如何通過puppetter實(shí)現(xiàn)PDF聚合閱讀器初始模型以及產(chǎn)品思維構(gòu)想
什么是puppeteer?
行業(yè)中puppeteer被稱為傀儡師,又被稱為提線木偶,它是一個(gè) Node 庫,它提供了一個(gè)高級 API 來通過 DevTools 協(xié)議 控制 Chrome 或 Chromium 。Puppeteer 默認(rèn)運(yùn)行 無頭 ,但可以配置為運(yùn)行完整(非無頭)Chrome 或 Chromium。
puppeteer可以做什么?
生成頁面的屏幕截圖和 PDF。
抓取 SPA(單頁應(yīng)用程序)并生成預(yù)渲染內(nèi)容(即“SSR”(服務(wù)器端渲染))。
自動化表單提交、UI 測試、鍵盤輸入等。
創(chuàng)建最新的自動化測試環(huán)境。使用最新的 JavaScript 和瀏覽器功能直接在最新版本的 Chrome 中運(yùn)行測試。
捕獲您網(wǎng)站的 時(shí)間線軌跡 以幫助診斷性能問題。
測試 Chrome 擴(kuò)展程序。
puppeteer和selenium的主要區(qū)別?
puppeteer是谷歌孵化出來的一個(gè) Node.js 庫和瀏覽器測試框架對geogle瀏覽器訪問權(quán)限較好,它主要針對geogle瀏覽器和它同胞小弟Chromium瀏覽器、而selenium是有Thoughtworks公司在2004 年推出的。
puppeteer開發(fā)語言主要是JavaScript、而selenium支持 JavaScript、Java、Ruby、C# 和 Python。為了更好的體現(xiàn)python語言的萬金油的作用、非官方版本的puppetter應(yīng)運(yùn)而生。
從易用性來說如果對JavaScript有所了解的話,選擇puppeteer還是比較好的。當(dāng)然如果對python語言比較熟悉、像構(gòu)建完善的自動化工程還是選擇selenium。
語言特性和實(shí)現(xiàn)
nodeJs

python3

滄桑巨變、史詩為進(jìn)
Pdf的處理對于現(xiàn)在場景分析中、是必須常見的、目前國際或者國內(nèi)做PDF聚合閱讀和處理的平臺到是不多、中國老牌的福昕閱讀器和海外同類的PDF Reader Pro市場都是在閱讀上,但是在pdf合并和處理上并沒有什么好的平臺得以應(yīng)用、要么收費(fèi)、要么按次收費(fèi)。當(dāng)然今天不討論這個(gè)問題,只是為了寫個(gè)PDF聚合采集工具。
nodeJs

這是一個(gè)簡單的產(chǎn)品原型、后期可以加入PDF合并、拆分以及PDF轉(zhuǎn)成圖片、圖片轉(zhuǎn)PDF、視頻格式轉(zhuǎn)換等工具類的工具平臺。
思維和共識
