国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)

2020-11-30 12:45 作者:ocean_tide  | 我要投稿

如下圖所示,我們要從這個(gè)網(wǎng)站抓取長江主要站點(diǎn)的水位和流量數(shù)據(jù)。

首先使用urlread讀取網(wǎng)頁的內(nèi)容,再找到數(shù)據(jù)所在的字符串

str=urlread('http://www.cjh.com.cn/sssqcwww.html')
以向家壩為例,1710就是流量,266.22是水位
'{"oq":"0","q":"1710","rvnm":"長江","stcd":"60103400","stnm":"向家壩","tm":1606701600000,"wptn":"5","z":"266.22"}'
接著我們使用正則化表達(dá)來提取這些數(shù)據(jù)
flow=regexp(str,'{"oq":"0","q":"\d*','match');? %提取流量 單位是m3/s
wl=regexp(str,'"wptn":"\d","z":"\S{2,10}"}','match'); %提取水位 單位是米
name=regexp(str,'"stnm":"\S{2,10}","tm":','match'); %提取觀測站點(diǎn)名字
完整的程序如下,該程序會每小時(shí)運(yùn)行一次,抓取數(shù)據(jù)并保存成mat文件:

j=1; %網(wǎng)站數(shù)據(jù)是逐時(shí)的,整點(diǎn)會更新,為了預(yù)防可能出現(xiàn)的延遲問題,建議12點(diǎn)的數(shù)據(jù)12點(diǎn)15分時(shí)才去爬取
while 0<1
?time(j,:)=datestr(now);
str=urlread('http://www.cjh.com.cn/sssqcwww.html');
%str1='{"oq":"0","q":"1710","rvnm":"長江","stcd":"60103400","stnm":"向家壩","tm":1606701600000,"wptn":"5","z":"266.22"}'
flow=regexp(str,'{"oq":"0","q":"\d*','match');? %流量 單位是m3/s
wl=regexp(str,'"wptn":"\d","z":"\S{2,10}"}','match'); %水位 單位是米
name=regexp(str,'"stnm":"\S{2,10}","tm":','match'); %觀測站點(diǎn)名字
for i=1:length(flow)
??? d(j,i)=str2num(flow{i}(16:end));? %0代表沒有流量觀測
end

for i=1:length(wl)
??? sl(j,i)=str2num(wl{i}(17:end-2));?
end
j=j+1
save('Yangtze.mat','time','d','sl','name')
pause(3600); %每隔一小時(shí)執(zhí)行一次
end

使用網(wǎng)絡(luò)爬蟲自動抓取長江水位和流量數(shù)據(jù)的評論 (共 條)

分享到微博請遵守國家法律
桃江县| 桂林市| 巨鹿县| 大化| 托克逊县| 离岛区| 格尔木市| 富源县| 宜城市| 镇巴县| 雅安市| 蓬溪县| 沂南县| 漠河县| 海淀区| 伊宁县| 都江堰市| 鸡东县| 南丰县| 浦东新区| 海原县| 滨州市| 凌云县| 九台市| 神木县| 兴国县| 西藏| 龙口市| 曲周县| 防城港市| 东台市| 咸阳市| 庆安县| 贵溪市| 大姚县| 黎城县| 鹤壁市| 察雅县| 广宗县| 永丰县| 永修县|