问题描述
<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc</p>我想取aaaaaaaaaaaaa,bbb,ccc的内容,这个正则表达式应该怎样写?
解决方案
解决方案二:
stringhtml=@"<pclass=""xdct0""> aaaaaaaaaaaaa“<spanclass=""zx3"">bbb</span>”ccc</p>";stringpatten=@"<ps+class=""xdct0"">s*([^“]*)“<spans+class=""zx3"">([^<>]*)</span>”([^<]*)</p>";Matchm=Regex.Match(html,patten);if(m.Success){Console.WriteLine(m.Groups[1].Value);Console.WriteLine(m.Groups[2].Value);Console.WriteLine(m.Groups[3].Value);}
就这么点html的话,直接就这么匹配了
解决方案三:
引用楼主andyhere的回复:
<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc</p>我想取aaaaaaaaaaaaa,bbb,ccc的内容,这个正则表达式应该怎样写?
谢谢!我测试了下,你的表达式也会提取到其他无关的内容,怎么限定“xdct0”,”zx3“呢?
解决方案四:
引用2楼andyhere的回复:
Quote: 引用楼主andyhere的回复:
<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc</p>我想取aaaaaaaaaaaaa,bbb,ccc的内容,这个正则表达式应该怎样写?谢谢!我测试了下,你的表达式也会提取到其他无关的内容,怎么限定“xdct0”,”zx3“呢?
人家这个正则至少可以通过你给出的例子。还有其他例子?
解决方案五:
你得举例说出什么情况不能通过
解决方案六:
谢谢大伙,我是从一个网页里提取内容,网面上肯定还有很多的标签,我不可能全列出来呀,starfd的表达式确实能提取出来,便同时会提取很多其他我不需要的出来,所以starfd的表达式如能限定“xdct0”,”zx3“,只提取我要的内容,那就OK了,
解决方案七:
stringpatten=@"<ps+class=""xdct0"">s*([^“]*)“<spans+class=""zx3"">([^<>]*)</span>”([^<]*)</p>";这个表达式,可以提取所以如下的标签:<pclass="xdct0">...</p>我的目标是只提取如下标签:<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc</p>所以要限定一个"zx3"请大伙再帮邦忙!
解决方案八:
里面有一个字打错了,重发下:stringpatten=@"<ps+class=""xdct0"">s*([^“]*)“<spans+class=""zx3"">([^<>]*)</span>”([^<]*)</p>";这个表达式,可以提取网页上所有如下的标签:<pclass="xdct0">...</p>我的目标是只提取如下标签:<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc</p>所以要限定一个"zx3"请大伙再帮邦忙!
解决方案九:
stringpatten=@"<ps+class=""xdct0"">s*([^“]*?)“<spans+class=""zx3"">([^<>]*)</span>”([^<>]*)</p>";
你试下这个吧,你不懂我不说啥,但上面的正则已经限定了xdct0和zx3
解决方案十:
我试过了,结果还是一样的,会把所有如下的标签的内容都提取到的:<pclass="xdct0">...</p>
解决方案十一:
比如会把下面的标签都提取了:<pclass="xdct0"><strong>ababababababa</strong></p><hrclass="hhhhh"/><pclass="xdct0">@<strong>a</strong></p><pclass="xdct0"><spanclass="zzzz">cd<script>szz("vvvv");</script>eeff</span></p><pclass="xdct0"> 1.aaaaaaaaaaaa“<spanclass="zx3">bb</span>”ccc</p>
解决方案十二:
继续顶吧!继续顶,继续顶
解决方案十三:
stringpatten=@"<ps+class=""xdct0"">s*([^<>“]*?)“<spans+class=""zx3"">([^<>]*)</span>”([^<>]*)</p>";
解决方案十四:
很难理解你的需求,猜一下在<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc</p><pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx2">bbb</span>”ccc</p>只取<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc</p>中的 aaaaaaaaaaaaa“bbb”ccc在<pclass="xdct0"> aaaaaaaaaaaaa“<spanclass="zx3">bbb</span>”ccc<spanclass="zx2">BBB</span></p>也只取 aaaaaaaaaaaaa“bbb”ccc是这样的吗?