请教:正则表达式无法匹配

问题描述

需要找出html文档中的title标签的内容,我用<title>正则表达式匹配了不少网站的网页。但是有一些网页用正则表达式就是找不到title标签,PatternTrim4=Pattern.compile("<\/title>");Html源码打开来看绝对是匹配的,怀疑是编码问题,试了utf,gb2312,unicode也不行,现在头大的很,哎。希望各位大虾遇到过类似情况的帮下忙。

解决方案

解决方案二:
你把能不能把所有的网页转成utf8格式...然后再做比较或者你看下不能匹配的网页与能匹配的网页之间的区别
解决方案三:
小弟你RP问题~...看看哥哥的代码
解决方案四:
不是人品问题吧,我看了下,就是凤凰网的网页特殊,怎么都匹配不了title,其他网站都可以匹配,也是utf-8,而且我提取新闻内容,直接给我乱码,真的是崩溃。
解决方案五:
靠,还是自己解决了,网站上的编码是utf-8的,存到本地就是gb2312,其实已经全乱了,有类似经历的朋友们注意啦。

时间: 2024-10-22 04:29:59

请教:正则表达式无法匹配的相关文章

正则表达式-请教php正则匹配时斜杠或冒号引起的问题

问题描述 请教php正则匹配时斜杠或冒号引起的问题 preg_match_all(""/>[w+="".*""s]+</"" $xml $pre); 我用正则去匹配类似下面的字符串: src1=""111"" src2=""bb"" src3=""ccc"" 匹配结果是:>src1=&quo

js正则表达式密码匹配

问题描述 js正则表达式密码匹配 大神们,我在在js中正则表达式判断密码是否匹配, 这方面我是新手还请大神们指点: (1)同时包含数字,字母,特殊符号 (2)包含字母和数字 (3)只包含数字或字母 解决方案 试试吧,不一定对. 正则:(1)/^(?!d+$)(?![a-zA-z]+$)(?![^0-9a-zA-Z]+$)/ (2)/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ (3) /^[0-9a-zA-Z]+$/ 解决方案二: ^(?=.*[0-

php正则表达式如何匹配在竖线之间的文字或者字符

问题描述 php正则表达式如何匹配在竖线之间的文字或者字符 我相匹配 Z10004|王|億达峰|52|66| 这个字符串的|中间的那些字串或者文字 解决方案 $s = 'Z10004|王|億达峰|52|66|'; //假定为 utf-8 编码,否则需要转码preg_match_all('/(?<=|)w+(?<!$)/u' $s $m); 解决方案二: 解决掉了,我是先将这个字符串转换成utf-8的编码,然后将里面的'|'替换成其他的字符(如','),然后在用explode函数就不会出错了 解

js-输入值与正则表达式不匹配

问题描述 输入值与正则表达式不匹配 var reg=new RegExp("^[^wu4e00-u9fa5]{2,4}$"); alert(reg.test(nvalue)); 当输入的为"张三" 时,alert显示的值是false 为什么匹配不上? 解决方案 [^wu4e00-u9fa5],去掉[里面的^,你加^就是排除这些字符了 var reg = new RegExp("^[wu4e00-u9fa5]{2,4}$"); alert(reg.

Javascript中使用exec进行正则表达式全局匹配时的注意事项_正则表达式

本文就是介绍在使用 Javascript 中使用 exec 进行正则表达式全局匹配时的注意事项. 先看一下常见的用法: 复制代码 代码如下: <script type="text/javascript"> var pattern = /http:\/\/([^\/\s]+)/; alert(pattern.exec('http://www.codebit.cn')); // http://www.codebit.cn,www.codebit.cn alert(pattern

iOS App开发中Objective-C使用正则表达式进行匹配的方法_IOS

iOS中有三种方式来实现正则表达式的匹配.现在将他们都记录在这里: 1.利用NSPredicate(谓词)匹配 例如匹配有效邮箱: NSString *email = @"nijino_saki@163.com": NSString *regex = @"[A-Z0-9a-z._%+-]+@[A-Za-z0-9.-]+\\.[A-Za-z]{2,4}"; NSPredicate *predicate = [NSPredicate predicateWithForma

请教蓝牙自动匹配开发问题

问题描述 请教蓝牙自动匹配开发问题 各位,请教一个问题.比如使用一个蓝牙设备,当蓝牙进入休眠,再唤醒的时候,比如app端的串口调试助手.或者用C#写一个连接程序都要去手动操作一次连接蓝牙设备,这样操作很繁琐,是不是有什么办法可以自动连接设备,不用手动连接,或者需要什么开发包支持?/抱拳 解决方案 已配对了,就可以直接连了赛

求一个java中正则表达式,匹配所有标点符号,但除去‘-’和‘_’的

问题描述 求一个java中正则表达式,匹配所有标点符号,但除去'-'和'_'的 解决方案 可以使用正则表达式:(?=\pP)[^-_]测试:String ss = "测试test.df/:'-_";System.out.println(ss.replaceAll("(?=\pP)[^-_]", ""));输出:测试testdf-_解释:(1)前面部分(?=\pP)是个顺序环视正则表达式,只匹配位置不占用字符,匹配的位置是一个标点符号.(2)匹配到

正则表达式,匹配的,不理解

问题描述 正则表达式,匹配的,不理解 {1=A, 2=B, 3=C, 4=D}, {3=E, 4=F, 5=G, 6=H, 7=K}, {4=F, 5=G, 6=H, 7=K} 想split成如下. 1=A, 2=B, 3=C, 4=D 3=E, 4=F, 5=G, 6=H, 7=K 4=F, 5=G, 6=H, 7=K split("},s[{]");这样就可以 发现"},s{"这样怎么就不行呢. 解决方案 "},s[{]":空白正则是s,你放

正则表达式 c#-c# 中关于正则表达式的匹配问题,跪求解答

问题描述 c# 中关于正则表达式的匹配问题,跪求解答 我有一个字符串全新通信设备,现货低价出售:中兴 9800 ASNV+PNVNA 3套MSAG5200 ALCH 60块 GADL 20块C220含机柜(2000*600*600)4套 现在想用正则表达式匹配出:9800,asnv+pnvna,msag5200 alch ,gadl,c220 这些数字加英文的这些关键字请问怎么写正则表达式来截取呢?