问题描述
我是通過JAVA來抓取到的網頁源代碼.現在我需要提取其中的一部分.所以需要用正則表達式過濾,我是用java.util.regex.Matcher和java.util.regex.Pattern.現在我抓取過來的網頁源代碼中<A HREF="../detail.asp?main_id=186236">這里是需要抓取的內容</A>.我的正則表達式為<A HREF=.*main_id=.*>(.*.)</A>因為源代碼中的內容有的全面有換行,有的中間有換行,有的後面有換行.如果都沒有換行的話我的正則表達式能正確獲得,請問正則表達式如何寫才能抓取到所有情況呢?就是有換行的情況也能抓取到?问题补充:Pattern p=Pattern.compile(reg[1],Pattern.CASE_INSENSITIVE);我這里設置的是不區分大小寫,那如果需要加上Pattern.MULTILINE.該怎么加呢.?
解决方案
默认情况下,是只匹配单行的, 如果要匹配多行,则在Pattern.compile("regex", OPTIONS)的OPTIONS中,使用Pattern.MULTILINE
时间: 2024-09-29 11:32:37