问题描述
- php使用selenium如何获得页面具体数据
-
现在用phpunit-selenium做一个php爬虫的一个东西,爬完之后,获得页面的数据,以及
具体的table表格里面第三行第二个的值等,,新人,求懂的大神帮忙解答,谢谢~
解决方案
用正则表达式或者xml解析。
http://cuiqingcai.com/977.html
解决方案二:
可以把页面当初xml来解析,然后先定位节点等,再获取对应的数据,或者属性值等。
先自己看看xml原始文件,然后寻找XPATH
解决方案三:
我之前做了一个爬虫,解析html使用的方案是phpQuery库,语法贴近jquery的选择器,不妨了解一下。
php的simplexml_load_xxx和xml_parser_create似乎都不适合解析html文件,想请问楼上怎么用xml的。
时间: 2025-01-21 15:26:25