问题描述
我想用webharvest对http://www.etpass.com/(快乐e行)的国内机票频道的数据进行爬取,但是发现查询出来的数据(例如:http://www.etpass.com/airticket/inland/search?v=0&from=%E5%B9%BF%E5%B7%9E&o=CAN&to=%E5%8C%97%E4%BA%AC&t=SSS&d=2009-04-22&to2=&t2=undefined&d2=&m=0&l=&c=)航班数据列表是先放在一个js变量中的,然后在页面加载的时候再写到页面中,这样的话就无法用xpath和xquery对页面中的html元素进行爬取。有这方面的高手吗?急需,在线等。。。。
解决方案
解决方案二:
可以把取到得html打印出来在分析,看看生成的树结构,再进行解析。
时间: 2024-09-17 12:58:32