国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網 會員登陸 & 注冊

網頁抓取實例之wildberries電商平臺數據抓取

2023-02-10 10:01 作者:旺旺愛吃小仙貝  | 我要投稿

電商平臺的數據抓取,一直是網頁抓取公式的熱門實戰(zhàn)實例,之前我們通常是針對國內的電商平臺進行數據抓取,昨天小編受到委托,針對一個俄羅斯電商平臺wildberries做了數據抓取,抓取的主要內容是商品標題、價格及評價數量。



本文小編將給大家講解下網頁抓取的步驟及遇到的難點。

先看一下整體效果,在網址提前分析錄入好的前提下,我們通過輸入頁數,便可自動生成商品的標題、價格和評價數量:

?

在對網頁進行一定的分析之后,我們開始尋找其數據源。右鍵檢查或按快捷鍵F12打開開發(fā)者工具,然后在NetWork選項卡下,篩選找出請求結果,當找到請求中含有的數據與網頁外部顯示的數據一致時,便是尋找成功了。

?

這里,我們將請求的網址復制下來,以便后續(xù)使用。

?

有了網址,我們便可以將數據源提取到表格中,通常我們使用的公式為=GetJsonSource(),但是在提取過程中我們發(fā)現,由于wildberries平臺的一個頁面數據量太大,導致數據源的字符數超過了表格的最大字符數限制,所以提取的內容并不完整。

為解決這一問題,我們更換為=GetJsonSourceW()公式,并對其進行改造。將網頁中的源數據下載到本地文件,代替了之前的提取到表格單元格中,公式的括號內同樣都是填寫數據源的網址。當然,使用=GetJsonSourceW()需要打開Excel瀏覽器執(zhí)行網頁抓取任務,相信這點肯定難不倒大家。

終于將數據源搞定了,剩下的工作就簡單了起來。由于數據源為JSON格式的,我們便使用=GetJsonProperty()公式提取,其中A5表示數據源所在的單元格位置,data.products.0.name為屬性名稱

寫好公式后,重新計算下公式,很快就會出來結果。至此,我們的網頁抓取任務就算結束了,后面的工作就是對表格的內容進行優(yōu)化,比如我們將數據源的網址進行分析,把頁數拿了出來,這樣我們就可以做到僅通過修改數字,便可跳轉到其他頁,實現抓取任務。


網頁抓取實例之wildberries電商平臺數據抓取的評論 (共 條)

分享到微博請遵守國家法律
阜康市| 洪泽县| 大庆市| 电白县| 临夏市| 台中市| 维西| 油尖旺区| 海门市| 凤城市| 云浮市| 西充县| 娄烦县| 无极县| 图木舒克市| 张家界市| 曲阜市| 禹城市| 诸城市| 遂昌县| 磐石市| 凌海市| 岳阳县| 绥芬河市| 专栏| 察隅县| 邵阳县| 珲春市| 藁城市| 昆明市| 惠安县| 察哈| 鄂州市| 静乐县| 九龙县| 牡丹江市| 栖霞市| 镇坪县| 东丰县| 蒲江县| 启东市|