模拟登录(设置cookie) 帮助目录 词典
有些网站内的采集目标内容,需要用户先行登录后才可以正常查看,此时就需要让本系统在采集时也能模拟人的登录行为。如果目标网站的采集内容,不需要用户登录就可以正常在浏览器内浏览全部内容,此时就不必选中‘模拟登录(cookie设置)’。
详:
所谓Cookie,可以简单认的为是在浏览器端记录包括登录状态在内的各种属性值的容器名称。
模拟登录的设置方式和操作顺序:
1、请在有"http://登陆页面"字样的输入框内输入目标网站登录页面的网址url(或者直接输入该网站的首页地址亦可,网站的首页一般都有登录入口);
2、再点击<访问>按钮,此时在本对话框右侧内会显示该页面,直接在页面的登录输入框输入用户名和密码,点击登录,并等待网站提示登录成功即可;
3、在对方网站页面提示登录成功后,选择合适的“Cookie来源”种类,再点击获取<cookie>按钮即可完成设置。系统会记录该cookie内容,并直接使用。除非你非常明确该coolie内容含义,且需要修改,否则不能人为改变输入框下方出现的字符内容。
4、点击<验证>按钮,验证是否登录成功。此时会在右边窗口浏览器内显示登录后的登录界面的内容。注意此时右边浏览器内的内容,不是通过url直接访问获得的结果,而是系统通过模拟Cookie登录访问时获得的网页源码,经过适当加工后的显示结果。
5、如果右边窗口浏览器中显示的内容,是未登录时的状态。需要调整“Cookie的来源”选项,逐个尝试。尝试操作的步骤为:A、再次点击“访问”按钮,并确认是已经登录状态;B、更换选择“Cookie的来源”的选项;C、点击“获取Cookie”按钮;D、点击“验证Cookie”按钮。

有些网站,并没有通过cookie记录用户的登录行为,因此每次访问网站时都需要重新登录。如果采集项目的目标网站时这种情况,则每次运行采集时,需要人工操作一次登录并获取Cookie的行为。熊猫采集软件会努力尽快实现模拟用户自动登录的功能。