R软件如何读取文本数据?
R软件中有很多程序包,比如RCurl、XML、rvest,以及R的基础包,都有函数可以读取文本数据,下面我们就来介绍下具体的使用方法。
操作方法
(01)对于网页为csv文件的页面,可以直接用函数导入网页数据并转为数据框的形式。html格式的网页也可以读取。例如:data <- (text="it is a page")#text是要查看的文本head(data,10)#读取网页数据的代码data <- ("page"),page可以是要查看的网址或文本
(02)R基础包中的readLines可以读取网页或文本数据。#输入文本cat("asqsdn1213",file="a1")readLines("a1") #读取文本数据#cat中"n"表示换行。
(03)RCurl包中的getURL()函数获取网页数据。library(RCurl)data<-getURL("a1")#a1为某个具体的网址。head(data)
(04)通过getURL直接获取的数据有些凌乱,可以借助library(XML)解析树函数htmlTreeParse处理。library(XML)#解析树函数htmlTreeParsedata_Parse<-htmlTreeParse(data)head(data_Parse,2)
(05)对于复杂网站的文本数据,用rvest包中的read_html函数来提取文本数据。library(rvest)page<-read_html("a1")#a1为某个具体的网址data<-html_nodes(page,"table")head(data)#本例中没有输入网址,所以结果为空。
(06)通过html_nodes获得的数据不能直接投入使用。table<-html_table(data);table #提取表格数据,可以得到多个表格结果table[1]#查看第1个表text<-html_text(data);text #提取文本数据#在实际应用中,可以发现提取表格后的数据或文本是非常便于分析的。
-
excel表格中如何求和 数据较多如果求和
在表格的运用中,求和是最长用的工具了!在本文中,方法一种会简单介绍SUM求和函数的使用!方法二中,介绍数据较多的情况下,如何快速求和~操作方法(01)求和工具sum函数的使用点击需要显示总和的单元格,然后点击函数工具“fx”,弹出插入函数对话框。(02)在查找函数位置录入“sum...
-
有劳了是什么意思
(01)"有劳了"是一种客套用语,用于表达对对方努力、付出或服务的感谢之意。它可以用于工作场合、商务交往或日常生活中,表达对别人辛勤劳动的赞赏和敬意。(02)"有劳了"的使用场景包括:1.对方完成了一项任务或工作:当别人为你完成了某个任务、工作或项目时,你可以使用...
-
低压电工实际操作,三相电机的正反转控制
低压电工实际操作的一项重要项目:三相电机的正反转控制。想实现电机的正反转,只需要对调三相电源的两根线路就可以实现。这样控制电路需要两个交流接触器来实现,电机的电源的相序切换。为了实现互锁和将接触器的常闭触点串接到电路中。操作方法(01)看懂原理图:分为主...
-
数据库的六个设计过程
按照规范设计,我们把数据库的设计过程分为六个阶段:请按照你的理解进行详细的说明。操作方法(01)数据库设计的基本步骤一、数据库设计的生存期按照规范设计的方法,考虑到数据库及其应用系统开发的全过程,将数据库设计分为六个阶段。如下图。①需求分析需求收集和分析...