问题描述
- 【赶集网的发帖页面的验证码如何才能不显示】 10C
- 如果我用浏览器登陆,用户登陆成功后,赶集网的发帖页面的checkcode怎么控制?
http://www.ganji.com/pub/pub.php?act=pub&method=load&cid=6&mcid=14&domain=nb&&deal=1 (发帖界面)
如果我用浏览器登陆,验证码不显示;
但如果我用爬虫把这个页面爬下来,得到的页面有验证码,这个怎么修改呢?我看了一下页面的html+js代码,发现里面有个全局的js控制checkcode是否显示,但我不知道如何和服务器端交互,希望js高手帮下忙?
可以用firebug+wireshark+chrome+firefox来抓包?
如果解决了,必将重谢!
解决方案
爬虫爬页面时是不附带登陆后session的cookie id的,或者其他用cookie验证身份的相关cookie信息。所以会显示验证码。
你要不显示验证码,你可以用浏览器登录后,用开发工具查看发送的请求中的cookie信息,爬虫添加这些cookie信息后再发送请求就不会出现验证码了,因为已经附带了登陆后的信息
C#有cookiecontainer对象,将cookie信息全部添加到cookiecontainer中后,给你的httprequest对象设置cookicontainer为初始化好的
其他语言你就需要找相关的内容了。主要是附带上登陆后的cookie信息。
如果你不想用浏览器,全部程序自动模拟,你需要自己找到赶集网的登陆接口,发送你的信息到接口并接受返回的cookie信息,后续的请求附带上登陆成功的cookie信息,
解决方案二:
浏览器打开也有验证码
时间: 2024-08-02 21:54:42