R語言學(xué)習(xí)心得歷程-第一周(暗中摸索、毫無章法)
1.使用data.table程序包讀入數(shù)據(jù)的方法
? ①R語言軟件菜單中找——程序包→設(shè)定CARN鏡像,選擇china(Guangzhou)安裝即可,其他也可以。
? ②選擇菜單中——程序包→安裝程序包——選擇→data.table,安裝即可(因為要用到其中的fread函數(shù))
? ③在使用fread函數(shù)之前,還需要運行程序——install.packages("bit64")
? ④安裝之后就可以使用fread函數(shù)了,代碼如下:
data<- fread("data.txt",header=FALSE,sep=",",encoding="UTF-8")
? 其中data.txt,是定義的數(shù)據(jù)文件名字,在使用fread函數(shù)之前需要將數(shù)據(jù)文件(即data.txt)放在軟件固定存放點(可由代碼——? print(getwd())——得到位置信息)
? 心得:數(shù)據(jù)的讀入工作,是對數(shù)據(jù)進(jìn)行的結(jié)構(gòu)上的定義,是為了后續(xù)分析而做的準(zhǔn)備,不同的函數(shù),得出的數(shù)據(jù)結(jié)構(gòu)是不同的。需要根據(jù)后續(xù)的分析,選擇數(shù)?據(jù)讀入的方法。
??? 程序代碼:步驟①②結(jié)束之后
??? >install.packages("bit64")
??? >library(data.table)
??? >data<- fread("data.txt",header=FALSE,sep=",",encoding="UTF-8")
??? >data
2.數(shù)據(jù)讀入之后的簡單代碼操作
? ①View(data),可以用來可視化讀入的數(shù)據(jù);
? ②print(ncol),可以用來顯示數(shù)據(jù)的列數(shù);
? ③print(nrow),可以用來顯示數(shù)據(jù)的行數(shù);
? ④max()函數(shù)的應(yīng)用,執(zhí)行如下代碼,可以得到V5(播放次數(shù))的最大值:
?? v5<-max(data$V5)
?? print(v5)
? ⑤比④更詳細(xì)的信息,可以用如下代碼實現(xiàn)(利用subset函數(shù)):
?? details<-subset(data,V5==max(V5))
?? print(details)
? ⑥利用subset函數(shù)的條件篩選功能:
?? info<-subset(data,V5>1000)
?? print(info)