淘宝信息采集软件使用方法 下载本文

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

2)删除不需要字段(或点击采集所需字段)后,对现有字段进行重命名。

淘宝卖家信息采集步骤12

3)命名后检查字段发现部分字段缺失。如“城市”“店铺ID”“店铺类型”。

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

淘宝卖家信息采集步骤13

4)对于“城市”,检查页面发现在第三行数据中有相应信息。则先在循环列表的循环项中选中第三项(蓝色表示已选中),然后再点击提取数据。

淘宝卖家信息采集步骤14

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

淘宝卖家信息采集步骤15

1)选中第三项进行提取时发现其省份和城市在一起,无法单独提取。如需分成两个字段,则需要进行数据格式,通过正则表达来实现。

2)选中字段后点击下方的自定义数据字段。

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

淘宝卖家信息采集步骤16

3)数据格式化操作参照请参考下方动图。如需完整的格式教程请参考:http://www.bazhuayu.com/tutorialdetail-1/gshsj_7.html

八爪鱼·云采集网络爬虫软件

www.bazhuayu.com

淘宝卖家信息采集步骤17

4)对于“店铺ID”,先弄清楚“店铺ID”是个什么类型的数据,然后页面上未展现,则看看网页源码里是否有这个数据。百度后可知“店铺ID”是shop