问题描述
想抓取一个网页的内容,但是发现这个页面翻页是通过JS隐藏分页的,URL地址不变化,没有办法继续抓取下一页,不知有没有办法通过JS获得URL地址要抓取的页面http://search.51job.com/jobsearch/default_search.php。我找到了JS。functionjump(jpage){if(''==trim(jpage)){alert('请输入您要跳转的页数。');returnfalse;}page_obj=document.forms.page_form.elements.curr_page;if(parseInt(jpage,10)<1){page_obj.value=1;}elseif(parseInt(jpage,10)>parseInt(document.forms.page_form.elements.total_page.value,10)){page_obj.value=document.forms.page_form.elements.total_page.value;}else{page_obj.value=jpage;}document.forms.page_form.target="_self";document.forms.page_form.submit();}
解决方案
解决方案二:
sf
解决方案三:
没人了解吗?
解决方案四:
你通过参数传递,把total_page,curr_page付值过去,估计就可以得到你所需要的页面
解决方案五:
能具体点吗?
解决方案六:
它是用js改变隐藏域中的值来传递参数。<inputtype="hidden"name="curr_page"value="1"><inputtype="hidden"name="total_page"value="1000">而且他控制了表单取值,简单将curr_page参数以url?curr_page=2无法取得,你可以模拟post试试来取值
解决方案七:
可以找该页的历史
解决方案八:
拿firefox浏览器的fireBug调试一下,再隐藏的代码也能看的一清二楚.