Java正则提取网页信息&lt;title&gt;&lt;/title&gt;出问题，提取的内容不全，请教各位高手

问题描述

我用Java提取网页标题时内容不全<title>Ta1bleofContents(目录)(页1)-默认版块-Discuz!Board-PoweredbyDiscuz!Archiver</title>下面是正则Stringregex="<title>([^</title>]*)";Patternpattern=Pattern.compile(regex,Pattern.DOTALL);Matchermatcher=pattern.matcher(buffer.toString());while(matcher.find()){System.out.println(matcher.group(1).trim());}结果为Ta1bleof后面的内容全都丢了好奇怪？？

解决方案

解决方案二：
答案很显然:([^</title>]*)";表示<title>之后,不为空格,不为<,/,T,l,e>的字符能匹配,所以到了能匹配到:<title>Ta1b后面的l就不能匹配上了!搂住为何不这样做,考虑title会空格和换行,加/r/n应该可以搞定Stringsrc="<title>Ta1bleofContents(目录)(页1)-默认版块-Discuz!Board-PoweredbyDiscuz!Archiver</title>";Stringregex="<title>(.*)</title>";Patternpattern=Pattern.compile(regex);Matchermatcher=pattern.matcher(src);while(matcher.find()){System.out.println(matcher.group(1).trim());break;}
解决方案三：
哦，原来如此啊，我原来还以为</title>是一个整体，只要是非</title>之前的都能匹配，谢谢高手，我还是正则个初学者
解决方案四：
RegexBuddy这个工具挺好用的，调试正则表达式，很省事。
解决方案五：
谢谢，这个软件真的很好用，以前用RegexTester.exe老是出问题
解决方案六：
学习一下

时间： 2024-09-18 10:28:58

Java正则提取网页信息&lt;title&gt;&lt;/title&gt;出问题，提取的内容不全，请教各位高手

问题描述

解决方案

Java正则提取网页信息&lt;title&gt;&lt;/title&gt;出问题，提取的内容不全，请教各位高手的相关文章

java 正则提取ip 和端口

如何提取网页中想要的信息并保存到text文件中

正则-如何用Java爬取网页的copyright？

java采集网页信息，并获取到所需要的信息存入数据库中对应的字段中去（可以自动创建表头）

ajax-请问关于java 通过http client抓取网页信息返回：请开启JavaScript并刷新该页

”java采集网页信息，并获取到所需要的信息存入数据库中对应的字段中去“的相关问题

（java）将一个系统的动态网页信息转另一个系统

java正则提取 description标签

请教如何正则提取html信息

Java正则提取网页信息&amp;lt;title&amp;gt;&amp;lt;/title&amp;gt;出问题，提取的内容不全，请教各位高手

问题描述

解决方案

Java正则提取网页信息&amp;lt;title&amp;gt;&amp;lt;/title&amp;gt;出问题，提取的内容不全，请教各位高手的相关文章

Java正则提取网页信息<title></title>出问题，提取的内容不全，请教各位高手

Java正则提取网页信息<title></title>出问题，提取的内容不全，请教各位高手的相关文章