八爪鱼·云采集服务平台
www.bazhuayu.com
八爪鱼提取页面内的超链接图7
2)选择“采集以下链接地址”
八爪鱼提取页面内的超链接图8
八爪鱼·云采集服务平台
www.bazhuayu.com
3)点击“保存并开始采集”
八爪鱼提取页面内的超链接图9
4)根据采集的情况选择合适的采集方式,这里选择“启动本地采集”
八爪鱼提取页面内的超链接图10
八爪鱼·云采集服务平台
www.bazhuayu.com
步骤4:数据采集及导出
1)选择合适的导出方式,将采集好的数据导出
八爪鱼提取页面内的超链接图11
通过以上操作,目标网页内的商品超链接就被批量采集下来了。我们可以使用这些超链接,建立列表循环,来采集我们需要的其他字段数据,如下所示。
步骤5:创建url列表采集任务
1)重新创建一个采集任务,将导出后的商品链接复制,放到输入框中,点击“保存网址”
八爪鱼·云采集服务平台
www.bazhuayu.com
八爪鱼提取页面内的超链接图12
注意:输入框中的url列表数量不要超过2W个,超过的部分可以新建任务进行采集,url打开的页面必须是相同网站样式相近的,否则会导致数据采集缺失。
2)在页面中点击需要采集的文本数据,点击“采集数据”
八爪鱼提取页面内的超链接图13
八爪鱼·云采集服务平台
www.bazhuayu.com
3)打开流程图,修改采集字段名称,点击“保存并开始采集”
八爪鱼提取页面内的超链接图14
注意:点击右上角的“流程”按钮,即可展现出可视化流程图。
4)采集完成,点击“导出数据”