如何提取一个网页中需要的东西而抛弃不需要的

问题描述

<html><head><noscript><metahttp-equiv="refresh"divclass="btnoprint"style="background-image:url(http://base.googlehosted.com/base_media?q=maps:static.elong.com/images/hotels/images/hotel/hotelImg/5/2029_b_1.jpg&amp;size=3&amp;hl=zh-CN)"&nbsp;</div></a></td><td>&nbsp;</td><td><divclass="aladr"><fontsize=-1><spandir=ltr><spanclass="extended-address">河南省郑州市市区</span><spanclass="extended-address">金水区花园路北大河锦江饭店2楼</span></span>‎-<nobrclass=tel>0371-65929988</nobr></font></div><fontsize=-1color=#7777cc><aclass=ahref="/maps?li=d&amp;hl=zh-CN&amp;f=d&amp;iwstate1=dir:to&amp;daddr=%E6%B2%B3%E5%8D%97%E7%9C%81%E9%83%91%E5%B7%9E%E5%B8%82%E5%B8%82%E5%8C%BA%E9%87%91%E6%B0%B4%E5%8C%BA%E8%8A%B1%E5%9B%AD%E8%B7%AF%E5%8C%97%E5%A4%A7%E6%B2%B3%E9%94%A6%E6%B1%9F%E9%A5%AD%E5%BA%972%E6%A5%BC+(%E5%A4%A7%E6%B2%B3%E9%94%A6%E6%B1%9F%E9%A5%AD%E5%BA%97;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=3&amp;dtab=5"><divclass="btnoprint"style="background-image:url(http://base.googlehosted.com/base_media?q=maps:static.elong.com/images/hotels/images/hotel/hotelImg/9/4224_b_1.jpg&amp;size=3&amp;hl=zh-CN)"&nbsp;</div></a></td><td>&nbsp;</td><td><divclass="aladr"><fontsize=-1><spandir=ltr><spanclass="extended-address">河南省郑州市金水区</span><spanclass="extended-address">人民路22号</span></span>‎-<nobrclass=tel>0371-6281316</nobr></font></div><fontsize=-1color=#7777cc><aclass=ahref="/maps?li=d&amp;hl=zh-CN&amp;f=d&amp;iwstate1=dir:to&amp;daddr=%E6%B2%B3%E5%8D%97%E7%9C%81%E9%83%91%E5%B7%9E%E5%B8%82%E9%87%91%E6%B0%B4%E5%8C%BA%E4%BA%BA%E6%B0%91%E8%B7%AF22%E5%8F%B7+(%E6%96%B0%E5%8D%8E%E5%BB%BA%E5%9B%BD%E9%A5%AD%E5%BA%97)&amp;geocode=15057687664214124745,34.757100,113.672400,B017301568&amp;iwloc=1&amp;dq=%E9%A4%90%E5%8E%85&amp;ei=1Az8R7T7JpWmigOGt9T3Bg"dir=ltr>路线指南</a>‎</font></td></tr></table></td></tr><tr><td><divclass=rs></div></td></tr><trclass=lr><tdclass=lnalign="center"><ahref="/maps?f=q&amp;hl=zh-CN&amp;geocode=&amp;q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%85&amp;sll=37.649034,106.435547&amp;sspn=31.697307,59.414062&amp;ie=UTF8&amp;view=text&amp;latlng=0,0,11685948184425974943&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=4"><divclass=mpstyle="background-position:-720"></div></a></td><tdvalign=topclass=vcard><divclass="bn"><ahref="/maps?f=q&amp;hl=zh-CN&amp;geocode=&amp;q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%85&amp;sll=37.649034,106.435547&amp;sspn=31.697307,59.414062&amp;ie=UTF8&amp;view=text&amp;latlng=0,0,11685948184425974943&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=4"class="fnorg"dir=ltr>米兰庐西<b>餐厅</b></a>‎<fontsize=-1></font></div><table><tr><td><divclass="aladr"><fontsize=-1><spandir=ltr><spanclass="extended-address">郑州二七区北二七路106号和邦大厦南2楼</span></span>‎-<nobrclass=tel>0371-6263355</nobr></font></div><fontsize=-1color=#7777cc><aclass=ahref="/maps?li=d&amp;hl=zh-CN&amp;f=d&amp;iwstate1=dir:to&amp;daddr=%E9%83%91%E5%B7%9E%E4%BA%8C%E4%B8%83%E5%8C%BA%E5%8C%97%E4%BA%8C%E4%B8%83%E8%B7%AF106%E5%8F%B7%E5%92%8C%E9%82%A6%E5%A4%A7%E5%8E%A6%E5%8D%972%E6%A5%BC+(%E7%B1%B3%E5%85%B0%E5%BA%90%E8%A5%BF%E9%A4%90%E5%8E%85)&amp;geocode=14365981210762513662,34.761300,113.666700,B017306OXM&amp;iwloc=1&amp;dq=%E9%A4%90%E5%8E%85&amp;ei=1Az8R7T7JpWmigOGt9T3Bg"dir=ltr>路线指南</a>‎</font></td></tr></table></td></tr><tr><td><divclass=rs></div></td></tr><trclass=lr><tdclass=lnalign="center"><ahref="/maps?f=q&amp;hl=zh-CN&amp;geocode=&amp;q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%85&amp;sll=37.649034,106.435547&amp;sspn=31.697307,59.414062&amp;ie=UTF8&amp;view=text&amp;latlng=0,0,4700340719543115073&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=5"><divclass=mcstyle="background-position:-960"></div></a></td><tdvalign=topclass=vcard><divclass="bn"><ahref="/maps?f=q&amp;hl=zh-CN&amp;geocode=&amp;q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%85&amp;sll=37.649034,106.435547&amp;sspn=31.697307,59.414062&amp;ie=UTF8&amp;view=text&amp;latlng=0,0,4700340719543115073&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=5"class="fnorg"dir=ltr>天府酒家</a>‎<fontsize=-1></font></div><table><tr><td><divclass="aladr"><fontsize=-1><spandir=ltr><spanclass="extended-address">郑州二七区北二七路(太康路口)</span></span>‎-<nobrclass=tel>0371-66248455</nobr></font></div><fontsize=-1color=#7777cc><aclass=ahref="/maps?li=d&amp;hl=zh-CN&amp;f=d&amp;iwstate1=dir:to&amp;daddr=%E9%83%91%E5%B7%9E%E4%BA%8C%E4%B8%83%E5%8C%BA%E5%8C%97%E4%BA%8C%E4%B8%83%E8%B7%AF(%E5%A4%AA%E5%BA%B7%E8%B7%AF%E5%8F%A3)+(%E5%A4%A9%E5%BA%9C%E9%85%92%E5%AE%B6)&amp;0"></div></a></td><tdvalign=topclass=vcard><divclass="bn"><ahref="/maps?f=q&amp;hl=zh-CN&amp;geocode=&amp;q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%85&amp;sll=37.649034,106.435547&amp;sspn=31.697307,59.414062&amp;ie=UTF8&amp;view=text&amp;latlng=0,0,12163636550296619231&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=6"class="fnorg"dir=ltr>红树林餐馆</a>‎<fontsize=-1></font></div><table><tr><td><divclass="aladr"><fontsize=-1><spandir=ltr><spanclass="extended-address">河南省郑州市市区</span><spanclass="extended-address">二七区北二七路110号三九大酒店内</span></span>‎-<nobrclass=tel>0371-6228888</nobr></font></div><fontsize=-1color=#7777cc><aclass=ahref="/maps?li=d&amp;hl=zh-CN&amp;f=d&amp;iwstate1=dir:to&amp;daddr=%E6%B2%B3%E5%8D%97%E7%9C%81%E9%83%">郑州二七区太康路人民公园南门(近民主街)</span></span>‎</font></div><fontsize=-1color=#7777cc><aclass=ahref="/maps?li=d&amp;hl=zh-CN&amp;f=d&amp;iwstate1=dir:to&amp;daddr=%E9%83%91%E5%B7%9E%E4%BA%8C%E4%B8%83%E5%8C%BA%E5%A4%AA%E5%BA%B7%E8%B7%AF%E4%BA%BA%E6%B0%91%E5%85%AC%E5%9B%AD%E5%8D%97%E9%97%A8(%E8%BF%91%E6%B0%91%E4%B8%BB%E8%A1%97)+(%E6%96%B0%E7%96%86%E5%B7%B4%E5%9C%9F%E6%B1%9F%E9%A3%8E%E5%91%B3%E9%A5%AD%E5%BA%97)&amp;geocode=4865251608913133603,34.757200,113.664200,B01730693Z&amp;iwloc=1&amp;dq=%E9%A4%90%E5%8E%85&amp;ei=1Az8R7T7JpWmigOGt9T3Bg"dir=ltr>路线指南</a>‎</font></td></tr></table></td></tr><tr><td><divclass=rs></div></td></tr><trclass=lr><tdclass=lnalign="center"><ahref="/maps?f=q&amp;hl=zh-CN&amp;geocode=&amp;q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%85&amp;sll=37.649034,106.435547&amp;sspn=31.697307,59.414062&amp;ie=UTF8&amp;view=text&amp;latlng=0,0,17496980278892071097&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=8"><divclass=mpstyle="background-position:-1680"></&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=9"class="fnorg"dir=ltr>意力海景咖啡西<b>餐厅</b>(金水路店)</a>‎<fontsize=-1></font></div><table><tr><td><divclass="aladr"><fontsize=-1><spandir=ltr><spanclass="extended-address">郑州金水区金水路24号信城商务201室</span></span>‎-<nobrclass=tel>0371-63581053</nobr></font></div><fontsize=-1color=#7777cc><aclass=ahref="/local_url?85&amp;sll=37.649034,106.435547&amp;sspn=31.697307,59.414062&amp;ie=UTF8&amp;view=text&amp;latlng=0,0,10815685486047116473&amp;ei=1Az8R7T7JpWmigOGt9T3Bg&amp;cd=10"><divclass=mcstyle="background-position:-2160"></div></a></td><tdvalign=topclass=vcard><divclass="bn"><ahref="/maps?f=q&amp;hl=zh-CN&amp;geocode=&amp;q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%

解决方案

解决方案二:
晕,需求呢?你要干什么啊!!!!正则表达式,我也这么回答,你能看懂么
解决方案三:
//提供一段天气预报的源码,仅供参考,摘自网络usingSystem;usingSystem.Collections.Generic;usingSystem.Text;usingSystem.Net;usingSystem.Text.RegularExpressions;usingSystem.Windows.Forms;namespaceReportWeatherDemo{classCityWeather{//--将此处的页面地址替换为相应的地址就行了,可以登陆www.cma.gov.cn查询到相应的城市//stringpageUrl="http://www.cma.gov.cn/tqyb/weatherdetail/57496.html";//鄂州stringpageUrl="http://www.cma.gov.cn/tqyb/weatherdetail/58367.html";//上海//--用于存储抓取出来的地点的名称stringdd=string.Empty;//--天气状况stringtqgk=string.Empty;//--气温stringqw=string.Empty;//--风力/风向stringfxfl=string.Empty;publicstringGetWeatherInfo(){WebClientwc=newWebClient();wc.Credentials=CredentialCache.DefaultCredentials;Byte[]bt=wc.DownloadData(@pageUrl);stringresult=Encoding.Default.GetString(bt);if(result.Length<=0){System.Windows.Forms.MessageBox.Show("未找到指定的城市天气信息!");result="";}intpos=result.IndexOf("<divclass="font01">3天预报&nbsp;&nbsp;&nbsp;</div>");if(pos>0)result="未找到该城市的天气预报!";else{pos=result.IndexOf("<divclass="font01">3天预报");result=result.Substring(pos,result.IndexOf("穿衣指数")-pos);pos=result.IndexOf("&nbsp;&nbsp;&nbsp;")+18;dd=result.Substring(pos,result.IndexOf("</")-pos);pos=result.IndexOf("天气概况");result=result.Substring(pos,result.IndexOf("<!--<tr>")-pos);pos=result.IndexOf("<tdwidth="75"");result=result.Substring(pos);pos=result.IndexOf(">");tqgk=result.Substring(pos+1,result.IndexOf("</td>")-pos-1);result=result.Substring(result.IndexOf("气温"));pos=result.IndexOf("cn">")+4;qw=result.Substring(pos,result.IndexOf("℃</td>")-pos+1);result=result.Substring(result.IndexOf("风向/风力</td>"));result=result.Substring(result.IndexOf("<td"));pos=result.IndexOf("cn">")+4;fxfl=result.Substring(pos,result.IndexOf("</td")-pos);tqgk="今日天气:"+tqgk.Replace("","");qw=qw.Replace("","");//qw="最高温度:"+qw.Replace("/","最低温度:");qw="最高温度:"+qw.Replace("/",",最低温度:");fxfl="风向/风力:"+fxfl.Replace("","");result=dd+","+tqgk+","+qw+","+fxfl;}returnresult;}}}

解决方案四:
我想把一个网页的源代码获取过来,并提取其中的想要的数据。例公司名称和地址,除了这什么都不要。大侠们帮帮忙,我在这谢谢你们了。
解决方案五:
正则表达式,字符串运算。或者dom解析。最后一种方式速度是最慢的,但它是最直观的。
解决方案六:
就是要把http://ditu.google.cn/maps?f=q&hl=zh-CN&geocode=&q=%E9%83%91%E5%B7%9E+%E9%A4%90%E5%8E%85&sll=37.649034,106.435547&sspn=31.697307,59.414062&ie=UTF8&view=text网址下的例如郑州颐顺轩餐饮有限公司‎河南省郑州市未来路65号‎-0371-65932299‎米兰庐西餐厅‎郑州二七区北二七路106号和邦大厦南2楼‎-0371-6263355...取出来
解决方案七:
用正则表达式怎么做啊,发一下。

时间: 2024-08-20 22:16:25

如何提取一个网页中需要的东西而抛弃不需要的的相关文章

请问怎么能够获取一个网页中的所有link对象?

问题描述 大牛可不可以告知下方法?具体实现更佳 解决方案 解决方案二:我想给一个域名中的所有网址进行排名,方法就是先下载若干个页面,循环检测每个页面中的所有link网址,同时累加相应pagerank值,最后输出排名,但是我不知道怎么去获取一个网页中的所有link...解决方案三:webBrowser1.Document.Links解决方案四:要求是把若干个网页保存在硬盘中,然后对这几个网页分析,提取link,请问还能用这个方法吗?解决方案五:能不能这样实现,加载一个网页,用它初始化一个Docum

jsp中调用上一个网页中调用的js里面的input text的值

问题描述 jsp中调用上一个网页中调用的js里面的input text的值 套了一个时间选择的模板,想要获取开始时间和结束时间,但是这两个出现在调用的js里面,怎么获取 解决方案 将控件绑定id,js中有通过id设置控件内容的方法 解决方案二: 当前网页和上一个网页是什么关系?iframe还是window.open? iframe可以用parent或者document.getElementById('ifrID').contentWindow得到相互引用, window.open用opener或

java 提取指定网页中的所有汉字

问题描述 java 提取指定网页中的所有汉字 读取这个网页中汉字 http://news.sina.com.cn/c/2015-03-24/103831638858.shtml?qq-pf-to=pcqq.c2c 有大神也个例子么 解决方案 要求要用到正则表达式 解决方案二: 如果你这个请求是固定的格式,你可以选择截取URL

MFC在登陆页面中 加一个显示验证码的控件应该加哪个?图片从一个网页中加载出来的

问题描述 MFC在登陆页面中 加一个显示验证码的控件应该加哪个?图片从一个网页中加载出来的 http://202.200.144.63/(gac14yvwcsjrzj45cx1fq4ed)/CheckCode.aspx 我想把这网页里的图片显示在登陆界面作为验证码,请问我该在对话框中加什么控件,我用的是下边的方法 CHtmlView* pView= (CHtmlView*)m_wndSplit.GetPane(0,1); pView->Navigate("http://hao.201201

link如何遍历一个网页中所有的文字,以及链接中的文字呢?

问题描述 link如何遍历一个网页中所有的文字,以及链接中的文字呢? link如何遍历一个网页中所有的文字,以及链接中的文字呢? 解决方案 你可以通过广度优先遍历的方式获取,将已经获取的网页存入文件或者数据库,然后递归遍历它中间包含的链接.

请问一个网页中两个按钮分别点出来不同的东西怎么做?

问题描述 就是说在这个网页中实现分层点第一个按钮显示1点第二个按钮显示2同时隐藏第一个按钮显示的1!请告诉我一个简单的例子!谢谢 解决方案 解决方案二:使用z-index或者设置visible解决方案三:protectedvoidbtn1_Click(objectsender,EventArgse){btn2.Visible=true;btn1.Visible=false;}protectedvoidbtn2_Click(objectsender,EventArgse){btn1.Visible

winform如何获取一个网页中不确定数据,但确定用什么标签,的里面的数据

问题描述 一个网页.不确定他的数据,但是可以确定它用什么标签.也就相当于今天我的数据有2行,可是明天有3行,但是标签相同,我能不能获取了一次之后不用再操心这个问题就是说我的程序跟随着他的网页.我不用再想如果他多加数据了,我还要再次截取的问题用winform做.其他也可以, 解决方案 解决方案二:这个和winform关系不大把,是获取网络上的数据的问题!1,如果你知道怎么用正则,其实这个问题就容易了!2,或者你可以看看HtmlAgilityPack,这个也可以帮助你!具体的什么数据你没有说,所以,

csdn的高手们,我遇到问题了,是关于C#用正则提取一个网页里的内容。做不出来了,希望好心人给写一个参考下(初学)

问题描述 <palign="center"><tablecellpadding="2"cellspacing="0"align="center"borderColorDark="#ffffff"borderColorLight="#008000"border="1"width="760"><theadonclick=&

c#如何调用一个网页中的函数使其在vs2010中调试

问题描述 考虑到浏览器兼容问题,要用webkitbrowser来调用.这是我vs2010下的一个窗体程序,我首先用webkitbrowser调用了网页中的用户名和密码,我故意设置一个错误的密码来调试,结果本来应该在第一个截图的窗体中出来警告对话框,却在第二个截图中出现了,第二个截图其实是浏览器网页上的,我的问题就是如何调用网页中的登录函数到vs中,进行修改,让警告的窗口出现在我vs中制作的窗体中,也就是第一个截图中.在解释一遍,第二个截图是网页,第一个截图是vs中的窗体程序,怎么把第二个截图中的