问题描述
在解析URL地址时有时会遇到解析出来的doc对象的text内容在结尾是...是显示不全吧?解析部分的代码我是这么写的。doc=Jsoup.connect(url).userAgent("Mozilla/5.0(compatible;MSIE9.0;WindowsNT6.1;WOW64;Trident/5.0").timeout(20000).get();
但是获取到的内容的doc.text()值就是一部分最后的结尾是...请高手指点。回帖即给分!
解决方案
解决方案二:
为什么呢,你得解析获取Elements然后text吧。
解决方案三:
看看真实的数据是不是也是...
解决方案四:
引用1楼rui888的回复:
为什么呢,你得解析获取Elements然后text吧。
比如说我想获得这个页面上一个div对象但是解析出来之后,内容里边竟然没有。但是我根据URL在浏览器里是可以看到的。我在debug时看到doc.text所获得的内容,由于脚本内容太多,后边的内容竟然是省略号……不知道有没有大神遇到过
解决方案五:
引用2楼fangmingshijie的回复:
看看真实的数据是不是也是...
真实的数据是有内容的。这个我非常的确定,只是解析之后,由于内容太多,后边的内容是省略号了,不知道是不是这个原因。我非常确定的是内容解析出来之后没有这个省略号
解决方案六:
textpublicElementtext(Stringtext)Setthetextofthebodyofthisdocument.Anyexistingnodeswithinthebodywillbecleared.Overrides:textinclassElementParameters:text-unencodedtextReturns:thisdocument
这个api是没有说大数据省略的,看看是否引用的document是否是jsoup的,是不是引用了jdk的
解决方案七:
会不会是那个url网页上处理过了多出来的就省略号代替了。
解决方案八:
引用5楼fangmingshijie的回复:
textpublicElementtext(Stringtext)Setthetextofthebodyofthisdocument.Anyexistingnodeswithinthebodywillbecleared.Overrides:textinclassElementParameters:text-unencodedtextReturns:thisdocument这个api是没有说大数据省略的,看看是否引用的document是否是jsoup的,是不是引用了jdk的
我引用的是importorg.jsoup.nodes.Document;
解决方案:
引用6楼rui888的回复:
会不会是那个url网页上处理过了多出来的就省略号代替了。
这个不太可能吧?
解决方案:
能说下怎么解决的吗。。。楼主好人