问题描述
在抓取互联网数据时,在爬虫程序在一定时间后,会出现以下几种情况,而不能爬取或者重新设置等问题,效率比较低:1、直接屏蔽本机的IP,导致无法抓取2、需要输入认真认证码3、需要重新输入登录账号(比如爬取自己的同学录和好友时,在一定时间内,会提示重新登录或者输入账号ID)等等请教各位大侠:1、以上三个问题分别采用什么方法去解决,需要怎么去做?谢谢!2、抓取的有的数据是乱码,比如姓名,有的会显示“****”,可以破解码?怎么破解?3、在登陆有些网站时,有比较复杂的图片和字符的验证码,请问这个验证码怎么破解?
时间: 2024-12-30 10:14:32