R軟體如何讀取文字資料?
R軟體中有很多程式包,比如RCurl、XML、rvest,以及R的基礎包,都有函式可以讀取文字資料,下面我們就來介紹下具體的使用方法。
操作方法
(01)對於網頁為csv檔案的頁面,可以直接用函式匯入網頁資料並轉為資料框的形式。html格式的網頁也可以讀取。例如:data <- (text="it is a page")#text是要檢視的文字head(data,10)#讀取網頁資料的程式碼data <- ("page"),page可以是要檢視的網址或文字
(02)R基礎包中的readLines可以讀取網頁或文字資料。#輸入文字cat("asqsdn1213",file="a1")readLines("a1") #讀取文字資料#cat中"n"表示換行。
(03)RCurl包中的getURL()函式獲取網頁資料。library(RCurl)data<-getURL("a1")#a1為某個具體的網址。head(data)
(04)通過getURL直接獲取的資料有些凌亂,可以藉助library(XML)解析樹函式htmlTreeParse處理。library(XML)#解析樹函式htmlTreeParsedata_Parse<-htmlTreeParse(data)head(data_Parse,2)
(05)對於複雜網站的文字資料,用rvest包中的read_html函式來提取文字資料。library(rvest)page<-read_html("a1")#a1為某個具體的網址data<-html_nodes(page,"table")head(data)#本例中沒有輸入網址,所以結果為空。
(06)通過html_nodes獲得的資料不能直接投入使用。table<-html_table(data);table #提取表格資料,可以得到多個表格結果table[1]#檢視第1個表text<-html_text(data);text #提取文字資料#在實際應用中,可以發現提取表格後的資料或文字是非常便於分析的。
-
隔月普票開錯了怎麼辦
隔月開紅票,再開正確的發票 如果是專票就麻煩了,以後要小心操作方法(01)上月開票後你如果已入賬,則應開具一張與上月相同的紅字普票沖銷(同時應將對方寄回的藍票附在後面粘回收票本),再開一張正確的藍字發票入賬。(02)如上月開票後你末及時入賬則可將收回的普票粘回原處...
-
Vlookup函式的使用技巧
Excel作為日常工作的常用工具,大家很熟悉。提到Excel都會想到函式,如果提到函式,vlookup函式是不得不提的。下面看一下用vlookup函式如何實現根據姓名匹配年齡的例子操作方法(01)題目如下:從左邊的源資料中匹配出右邊姓名的年齡(現實工作中源資料和要匹配的資料往往不...
-
競選演講稿怎麼寫
公開選拔,競爭上崗是任用幹部的重要方式。在競職演講中,演講的成功與失敗對競職有著直接的影響,而演講的成功,首先要有一篇好的演講稿,那麼,競選演講稿該如何寫呢?請看操作方法(01)寫好開場白:一個好的開頭,能馬上鎮住聽眾,使之產生興趣及好感。(02)抓住主體部分:這是演講稿的...
-
5S管理的實施步驟
現如今大部分企業現場管理都不可或缺的匯入5S管理,但是5S管理如何匯入和實施呢?5S管理是一個系統性管理方式,是有一定步驟的:操作方法(01)第一步是“整理”:5S管理中的第一步是整理,所謂整理就是工作現場的各類物件將要與不要的區分開來,將要的物件留下,去除不要的物件...