问题描述
- curl抓取淘宝首页抓取不到。
-
列表页面">这是我的代码,抓取淘宝一直抓取不到。
解决方案
curl得到的内容和你浏览器查看源代码后得到的一样,js动态添加的内容和ajax动态加载的无法获取
解决方案二:
数据都是js 动态生成的,你获取的只是代码。
解决方案三:
淘宝应该有防抓取设置 一般是通过判断请求来源来防止抓取 你可以在浏览器中访问时抓一下包 分析一下它的请求头数据 模拟一下啥
解决方案四:
页面是动态生成的,你没办法直接拿到内容,
时间: 2024-10-30 15:14:32