八爪鱼爬虫模拟登录抓取数据 下载本文

八爪鱼·云采集服务平台

www.bazhuayu.com

Cookie登录方法(7.0)-图5

步骤4:记录Cookie

1)选中“打开网页”步骤,点开“缓存设置”,勾选“打开网页的自定义Cookie”,点击获取当前页面的Cookie(可以点一下旁边的箭头,查看是否获取了cookie)

2)获取到登陆之后的Cookie之后,点击“确定”按钮。八爪鱼会记住这个Cookie状态,下次会以登陆之后的状态打开

八爪鱼·云采集服务平台

www.bazhuayu.com

Cookie登录方法(7.0)-图6

步骤5:删除多余步骤

1)流程设计器里,把其他多余的步骤删掉

八爪鱼·云采集服务平台

www.bazhuayu.com

Cookie登录方法(7.0)-图7

2)然后按照新手入门的方法提取数据。这里以随便提取一个字段为例,设置好之后点击“确定”按钮进行保存

八爪鱼·云采集服务平台

www.bazhuayu.com

Cookie登录方法(7.0)-图8

步骤6:数据采集

1)选择保存并启动,选择“启动本地采集”。系统将会在本地启动一个采集流程并执行采集规则

八爪鱼·云采集服务平台

www.bazhuayu.com

Cookie登录方法(7.0)-图9

2)可以看到,数据采集正常进行。采集完成之后,选择导出数据