酷知百科網

位置:首頁 > 職場理財 > 職場就業

R軟件如何讀取文字數據?

R軟件中有很多程序包,比如RCurl、XML、rvest,以及R的基礎包,都有函數可以讀取文字數據,下面我們就來介紹下具體的使用方法。

操作方法

(01)對於網頁爲csv檔案的頁面,可以直接用函數匯入網頁數據並轉爲數據框的形式。html格式的網頁也可以讀取。例如:data <- (text="it is a page")#text是要檢視的文字head(data,10)#讀取網頁數據的代碼data <- ("page"),page可以是要檢視的網址或文字

R軟件如何讀取文字數據?

(02)R基礎包中的readLines可以讀取網頁或文字數據。#輸入文字cat("asqsdn1213",file="a1")readLines("a1") #讀取文字數據#cat中"n"表示換行。

R軟件如何讀取文字數據? 第2張

(03)RCurl包中的getURL()函數獲取網頁數據。library(RCurl)data<-getURL("a1")#a1爲某個具體的網址。head(data)

R軟件如何讀取文字數據? 第3張

(04)透過getURL直接獲取的數據有些凌亂,可以藉助library(XML)解析樹函數htmlTreeParse處理。library(XML)#解析樹函數htmlTreeParsedata_Parse<-htmlTreeParse(data)head(data_Parse,2)

R軟件如何讀取文字數據? 第4張

(05)對於複雜網站的文字數據,用rvest包中的read_html函數來提取文字數據。library(rvest)page<-read_html("a1")#a1爲某個具體的網址data<-html_nodes(page,"table")head(data)#本例中沒有輸入網址,所以結果爲空。

R軟件如何讀取文字數據? 第5張

(06)透過html_nodes獲得的數據不能直接投入使用。table<-html_table(data);table #提取表格數據,可以得到多個表格結果table[1]#檢視第1個表text<-html_text(data);text #提取文字數據#在實際應用中,可以發現提取表格後的數據或文字是非常便於分析的。

R軟件如何讀取文字數據? 第6張
標籤:讀取 文字 軟件