R软件如何读取文本数据?
R软件中有很多程序包,比如RCurl、XML、rvest,以及R的基础包,都有函数可以读取文本数据,下面我们就来介绍下具体的使用方法。
操作方法
(01)对于网页为csv文件的页面,可以直接用函数导入网页数据并转为数据框的形式。html格式的网页也可以读取。例如:data <- (text="it is a page")#text是要查看的文本head(data,10)#读取网页数据的代码data <- ("page"),page可以是要查看的网址或文本
(02)R基础包中的readLines可以读取网页或文本数据。#输入文本cat("asqsdn1213",file="a1")readLines("a1") #读取文本数据#cat中"n"表示换行。
(03)RCurl包中的getURL()函数获取网页数据。library(RCurl)data<-getURL("a1")#a1为某个具体的网址。head(data)
(04)通过getURL直接获取的数据有些凌乱,可以借助library(XML)解析树函数htmlTreeParse处理。library(XML)#解析树函数htmlTreeParsedata_Parse<-htmlTreeParse(data)head(data_Parse,2)
(05)对于复杂网站的文本数据,用rvest包中的read_html函数来提取文本数据。library(rvest)page<-read_html("a1")#a1为某个具体的网址data<-html_nodes(page,"table")head(data)#本例中没有输入网址,所以结果为空。
(06)通过html_nodes获得的数据不能直接投入使用。table<-html_table(data);table #提取表格数据,可以得到多个表格结果table[1]#查看第1个表text<-html_text(data);text #提取文本数据#在实际应用中,可以发现提取表格后的数据或文本是非常便于分析的。
-
隔月普票开错了怎么办
隔月开红票,再开正确的发票 如果是专票就麻烦了,以后要小心操作方法(01)上月开票后你如果已入账,则应开具一张与上月相同的红字普票冲销(同时应将对方寄回的蓝票附在后面粘回收票本),再开一张正确的蓝字发票入账。(02)如上月开票后你末及时入账则可将收回的普票粘回原处...
-
Vlookup函数的使用技巧
Excel作为日常工作的常用工具,大家很熟悉。提到Excel都会想到函数,如果提到函数,vlookup函数是不得不提的。下面看一下用vlookup函数如何实现根据姓名匹配年龄的例子操作方法(01)题目如下:从左边的源数据中匹配出右边姓名的年龄(现实工作中源数据和要匹配的数据往往不...
-
竞选演讲稿怎么写
公开选拔,竞争上岗是任用干部的重要方式。在竞职演讲中,演讲的成功与失败对竞职有着直接的影响,而演讲的成功,首先要有一篇好的演讲稿,那么,竞选演讲稿该如何写呢?请看操作方法(01)写好开场白:一个好的开头,能马上镇住听众,使之产生兴趣及好感。(02)抓住主体部分:这是演讲稿的...
-
5S管理的实施步骤
现如今大部分企业现场管理都不可或缺的导入5S管理,但是5S管理如何导入和实施呢?5S管理是一个系统性管理方式,是有一定步骤的:操作方法(01)第一步是“整理”:5S管理中的第一步是整理,所谓整理就是工作现场的各类物件将要与不要的区分开来,将要的物件留下,去除不要的物件...