国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

小象學(xué)院爬蟲實(shí)戰(zhàn)課

2023-05-26 16:45 作者:31775301  | 我要投稿

爬蟲的基本流程:

用戶獲取網(wǎng)絡(luò)數(shù)據(jù)的方式:


方式1:瀏覽器提交請(qǐng)求--->下載網(wǎng)頁代碼--->解析成頁面


方式2:模擬瀏覽器發(fā)送請(qǐng)求(獲取網(wǎng)頁代碼)->提取有用的數(shù)據(jù)->存放于數(shù)據(jù)庫或文件中


爬蟲要做的就是方式2;

爬蟲的基本流程:

用戶獲取網(wǎng)絡(luò)數(shù)據(jù)的方式:


方式1:瀏覽器提交請(qǐng)求--->下載網(wǎng)頁代碼--->解析成頁面


方式2:模擬瀏覽器發(fā)送請(qǐng)求(獲取網(wǎng)頁代碼)->提取有用的數(shù)據(jù)->存放于數(shù)據(jù)庫或文件中


爬蟲要做的就是方式2;

1、發(fā)起請(qǐng)求


使用http庫向目標(biāo)站點(diǎn)發(fā)起請(qǐng)求,即發(fā)送一個(gè)Request


Request包含:請(qǐng)求頭、請(qǐng)求體等


Request模塊缺陷:不能執(zhí)行JS 和CSS 代碼


2、獲取響應(yīng)內(nèi)容


如果服務(wù)器能正常響應(yīng),則會(huì)得到一個(gè)Response


Response包含:html,json,圖片,視頻等


3、解析內(nèi)容


解析html數(shù)據(jù):正則表達(dá)式(RE模塊),第三方解析庫如Beautifulsoup,pyquery等


解析json數(shù)據(jù):json模塊


解析二進(jìn)制數(shù)據(jù):以wb的方式寫入文件


4、保存數(shù)據(jù)


數(shù)據(jù)庫(MySQL,Mongdb、Redis)


文件


小象學(xué)院爬蟲實(shí)戰(zhàn)課的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
平乐县| 荆门市| 龙游县| 铜梁县| 通道| 枣阳市| 泗水县| 岢岚县| 惠安县| 台东县| 资阳市| 延长县| 马鞍山市| 衡东县| 大连市| 聂荣县| 丘北县| 香河县| 修文县| 东乡族自治县| 龙口市| 沂水县| 平谷区| 阿拉善盟| 连江县| 股票| 沧州市| 开化县| 福安市| 阿尔山市| 靖州| 定边县| 浮山县| 凌源市| 炉霍县| 正定县| 黔江区| 兴宁市| 庆安县| 扬中市| 木兰县|