R軟件如何讀取文本數據?
R軟件中有很多程序包,比如RCurl、XML、rvest,以及R的基礎包,都有函數可以讀取文本數據,下面我們就來介紹下具體的使用方法。
操作方法
(01)對於網頁為csv文件的頁面,可以直接用函數導入網頁數據並轉為數據框的形式。html格式的網頁也可以讀取。例如:data <- (text="it is a page")#text是要查看的文本head(data,10)#讀取網頁數據的代碼data <- ("page"),page可以是要查看的網址或文本
(02)R基礎包中的readLines可以讀取網頁或文本數據。#輸入文本cat("asqsdn1213",file="a1")readLines("a1") #讀取文本數據#cat中"n"表示換行。
(03)RCurl包中的getURL()函數獲取網頁數據。library(RCurl)data<-getURL("a1")#a1為某個具體的網址。head(data)
(04)通過getURL直接獲取的數據有些凌亂,可以藉助library(XML)解析樹函數htmlTreeParse處理。library(XML)#解析樹函數htmlTreeParsedata_Parse<-htmlTreeParse(data)head(data_Parse,2)
(05)對於複雜網站的文本數據,用rvest包中的read_html函數來提取文本數據。library(rvest)page<-read_html("a1")#a1為某個具體的網址data<-html_nodes(page,"table")head(data)#本例中沒有輸入網址,所以結果為空。
(06)通過html_nodes獲得的數據不能直接投入使用。table<-html_table(data);table #提取表格數據,可以得到多個表格結果table[1]#查看第1個表text<-html_text(data);text #提取文本數據#在實際應用中,可以發現提取表格後的數據或文本是非常便於分析的。
-
如何克服面試時的緊張心理
許多職場的新人都會有這麼的疑問,那便是面試的時分分外緊張,不能準確的體現,終究不被聘任。面試緊張怎麼辦?在緊張的狀態下不能極好的體現,怎麼才能夠打敗呢?讓我們來看看怎麼打敗緊張的心境。操作方法(01)1、堅持平常心才能應付自如。面對劇烈的比賽,誰都會有緊張感,...
-
怎麼打立方米符號
很多時候我們辦公的時候會用到一些生僻的符號,有一些及時經常會見到但是當自己需要做的時候就茫然了。比如現在讓你打出來一個立方米符號,平方米符號,對號,錯號,大寫金額可能就有點懵了,今天我就告訴大家一些小竅門。立方米、平方米(01)在表格裏輸入m3,選中3點擊“字體...
-
如何做一個優秀的列車乘務員
讓你的旅途不再孤單.操作方法(01)第一,學習基本禮儀與着裝,端正服務態度。每個服務行業人員都需要乾淨、整潔的着裝,嚴格遵守規章制度,尤其是每天面對廣大旅客朋友們的乘務員。一名列車乘務員不僅僅是代表個人,更代表者整個類車服務行業,更需要主動。真誠的為旅客提供...
-
如何將一維表數據變成二維表數據
日常工作當中為了數據的分析與直觀表示,常常需要將一維表與二維表互換,對於二維錶轉為一維表,網上已經有很多相關信息,這裏就不再説,這裏主要講述如何將一維錶轉變成二維表操作方法(01)選中一維表所有數據,在工具欄插入中找到並選擇插入數據透視表(02)根據需要選擇對應數...