问题描述
文件地址是:http://chuangshi.qq.com/search/getSearchNovels.html?pageIndex=1&Website=&Subjectid=&Contentid=&Bookwords=all&Updatestatus=all&Lastupdate=all&Sortby=all&Isvip=all&TitlePinyin=all&TagList=all我要获取的是页面中<a>标签中的href,怎样才能获取到,并把它转换成正常的个是呢,真心求教,用的Java语言。
解决方案
解决方案二:
没有人吗,求大神出现
解决方案三:
采用Java第三方包HTMLParser进行解析远程页面,可以直接获取页面所有的<a>标签内容,功能强大!
解决方案四:
引用2楼littlebrain4solving的回复:
采用Java第三方包HTMLParser进行解析远程页面,可以直接获取页面所有的<a>标签内容,功能强大!
一般来说,任何你想获取的标签都是没有问题的;但是此包有一个弊端就是无法识别JS内容,如果想处理JS的话可以采用另外一个第三方工具包HTMLUnit,这个更加强大,已经可以作为浏览器内核了!
时间: 2024-09-20 08:40:01