58电话号码采集方法
介绍采集电话号码的方法
建立采集任务
(01)将要采集的58网站地址复制下来(这里只是举的一个网站例子,其他网页的采集,可以参考这个教程的步骤去进行采集规则的编辑)
(02)登录采集器
(03)选择采集模式中的高级模式,点击开始采集
(04)编辑采集任务名称,完成后点击“下一步”
编辑采集规则
(01)将复制的网页地址粘贴在八爪鱼采集器内置浏览器的地址栏中,点击跳转,采集的网页会在下方浏览器中打开,流程设计器中会生成一个“打开网页”步骤
(02)将网页下拉到底部,找到翻页的按钮,右键点击,选择执行“循环点击这个元素”
(03)完成后流程设计器会生成一个翻页循环,点击“自定义”进行设置
(04)选择“元素文本=下一页”这个选项,点击确定,完成翻页循环的创建
(05)完成上述操作后,找到页面中第一个房源信息的方框,右键点击,在跳出的操作框中,选择下图红色方框的选项“创建一个元素列表”
(06)将第一个房源的信息”添加到列表“中,点击“继续编辑列表”
(07)点击第二个方框中的房源信息,同样将其”添加到列表“中
(08)八爪鱼会将具有相似特征的元素抓取到列表中,如下图,所有的信息都被添加到列表,接着点击“创建列表完成“,
(09)再点击“循环”,完成列表的创建
(10)创建列表完成后流程图,如左侧所示,接着我们需要对采集电话号码进行抓取,因为这个网页的电话号码都是图片的格式,所以我们需要将改网页切换成极速版的,再对需要的电话号码进行采集,将网页下拉到底部,找到“极速版”的按钮右键点击,选择执行“点击这个元素”
(11)如图右键点击房源信息中的电话号码,在跳出的执行框中,选择执行“抓取这个元素文本”,页面中其他数据的信息抓取,重复同样的步骤即可
(12)抓取到的内容会显示在右上方的操作框中,这里可以修改采集字段的名称,到这里我们就完成了电话号码在网页中的抓取
(13)由于每一页都需要循环采集数据,所以我们需要将这个循环列表拖入到翻页循环里面。
(14)注意:流程是从上网页执行的,所以这个循环列表需要放到点击翻页的前面,否则会漏掉第一页的数据。最终流程图如下图所示:点击保存,进入下一个采集步骤
开始采集,数据导出
(01)选择采集方式,开始电话号码的采集
(02)采集完成,有多个导出格式可供选择,可以根据需要点选,采集到的重复数据,采集器会自动识别出来,导出时可以选择是否去重。导出后就可以查看采集到的电话号码。
-
怎么快速通过新浪微博认证
新浪微博认证是身份的象征,通过新浪微博认证后,可以增加用户的影响力,可以享有新浪微博特殊权限,可以迅速增加粉丝,可以导入到新浪博客认证。通过新浪微博认证后,用户微博名字后面会加一个橙色的大V。很多微博好友都想通过新浪认证,怎么快速通过新浪微博认证呢?欢迎大...
-
怎么做手游推广
现在玩手游的人越来越多,手游市场也开阔起来,每天都会有新的游戏出现,竞争也就显得越发的激烈。想要占据一定的市场,那就需要进行推广,寻找合适的方式,加上游戏本身的质量,这样才会别更多人所了解。操作方法(01)应用商店。可以寻求相关的手游应用商店合作,把自己所要推广...
-
华为浏览器怎么设置默认搜索引擎
我们在使用华为或者荣耀手机时,会使用手机自带的华为浏览器进行网页的浏览,搜索相关的讯息等。如何更改华为手机浏览器默认的搜索引擎,选择其他的搜索引擎,本文将详细介绍。操作方法(01)我们打开自己的华为或荣耀系列手机后,选择最下方的系统自带的“浏览器”进入。(02...
-
怎么成为网易云阅读的作者
最近看到网易云阅读里面竟然有作者选项,所以就来分享下如何成为网易云阅读的作者。操作方法(01)要加入网易云阅读,首先就是先注册一个网易的帐号,一般推荐网易的163邮箱帐号。(02)有了网易邮箱之后,就可以登录网易云阅读的首页,用邮箱登录。(03)登录网易云阅读之后,就点击...