这样一个正则怎么取?爬虫，抓取程序，急！！！！！！！！！！

问题描述

<!DOCTYPEhtml><html><head><metahttp-equiv=content-typecontent="text/html;charset=UTF-8"/><metahttp-equiv=X-UA-Compatiblecontent=IE=EmulateIE7/><title>香山-Google地图</title><scripttype=text/javascript>//<![CDATA[varw=window.parent;functiononLoad(){w.loadVPage({title:"香山-Google地图",vartitle:"",url:"/maps?f=qx26source=s_qx26hl=zh-CNx26geocode=x26q=%E9%A6%99%E5%B1%B1x26vps=8x26jsv=156cx26sll=39.965543,116.503143x26sspn=0.442063,0.704498x26ie=UTF8",urlViewport:false,ei:"ULMCStwHhfK5A4Lr2cQO",form:{selected:"q",q:{q:"香山"},l:{q:"香山",near:""},d:{saddr:"",daddr:"",dfaddr:"北京市"},geocode:"",g:{q:"香山"},d_edit:{saddr:"",daddr:""}},query:{type:"l"},viewport:{center:{lat:0,lng:0,alt:{ll:"34545111588400255001",mode:2}},span:{lat:0.44206299999999998,lng:0.70449799999999996},mapType:""},modules:["","truffle","app_infowindow"],overlays:{sxcar:false,markers:[{id:"A",image:"/intl/zh-CN_cn/mapfiles/markerA.png",elms:[4,1,6,2,5],laddr:"北京市海淀区买卖街(北京香山金源商旅中心酒店)",sxti:"北京香山金源商旅中心酒店",name:"北京香山金源商旅中心酒店",dtlsUrl:"/maps?f=qx26source=s_qx26hl=zh-CNx26geocode=x26q=%E9%A6%99%E5%B1%B1x26vps=8x26jsv=156cx26sll=39.965543,116.503143x26sspn=0.442063,0.704498x26ie=UTF8x26latlng=0,0,12994289385194773328x26ei=ULMCStwHhfK5A4Lr2cQOx26cd=2",addressLines:["北京市海淀区","买卖街"],title:"北京x3cbx3e香山x3c/bx3e金源商旅中心酒店",reviews:13,photoUrl:"http://base.googlehosted.com/base_media?q=maps:www.5booking.com/pic/200549201742.jpgx26size=2x26hl=zh-CN",phototabUrl:"/maps?f=qx26source=s_qx26hl=zh-CNx26geocode=x26q=%E9%A6%99%E5%B1%B1x26vps=8x26jsv=156cx26sll=39.965543,116.503143x26sspn=0.442063,0.704498x26ie=UTF8x26latlng=0,0,12994289385194773328x26ei=ULMCStwHhfK5A4Lr2cQOx26cd=1x26oi=md_photosx26sa=Xx26ct=iw_photox26cad=5booking.com",cid:"12994289385194773328",infoWindow:{basics:"x3cdivtransclude="iw"x3ex3c/divx3e",maxUrl:"/maps?f=qx26source=s_qx26hl=zh-CNx26geocode=x26q=%E9%A6%99%E5%B1%B1x26vps=8x26jsv=156cx26sll=39.965543,116.503143x26sspn=0.442063,0.704498x26ie=UTF8x26latlng=0,0,12994289385194773328x26ei=ULMCStwHhfK5A4Lr2cQOx26cd=2x26iwd=1x26fb=0",moreInfo:"更多信息"},geocode:"CcMQRuHunLNuFeQ3YgIdex3tBiFQ2ylhWf1UtA",icon_id:"B",sprite:{width:20,height:34,top:34,image:"/intl/zh-CN_cn/mapfiles/red_markers_A_J.png"},cat2:[{name:"住宿服务；宾馆酒店；五星级宾馆",lang:"zh"},{name:"体育休闲服务；运动场馆；健身中心",lang:"zh"},{name:"其他",lang:"zh"},{name:"其他餐饮美食",lang:"zh"},{name:"星级酒店",lang:"zh"}],latlng:{lat:0,lng:0,alt:{ll:"34510131588008159223",mode:2}},phones:[{number:"010-59898888"}],b_s:2,photoType:1},{id:"C",image:"/intl/zh-CN_cn/mapfiles/markerC.png",取其中的地电话：地址，连接laddr:"北京市海淀区买卖街(北京香山金源商旅中心酒店)",sxti:"北京香山金源商旅中心酒店",name:"北京香山金源商旅中心酒店"photoUrl:"http://base.googlehosted.com/base_media?q=maps:www.5booking.com/pic/200549201742.jpg

解决方案

解决方案二：
先占个楼看看
解决方案三：
up
解决方案四：
就是找其前后的格式特征，加上其本身的特征就可以了。但是有时页面的格式稍一变化，就还得重新做。
解决方案五：
自己的贴子都不能编辑..我晕..LZ的问题不是太明确..是取出来就行..还是必须得按照你的那个结果那样取..如果是取出来就行..可以试试这样写..(?<=bladdr:)"w*"b我现在用的电脑..没有任何开发环境..还不能下载软件..所以没调试过..算是提供个思路吧..找关键字"xxxx"后面的又是""以内的字符串
解决方案六：
引用4楼cyougyoku的回复:

自己的贴子都不能编辑..我晕..LZ的问题不是太明确..是取出来就行..还是必须得按照你的那个结果那样取..如果是取出来就行..可以试试这样写..(?<=bladdr:)"w*"b我现在用的电脑..没有任何开发环境..还不能下载软件..所以没调试过..算是提供个思路吧..找关键字"xxxx"后面的又是""以内的字符串

能不能写完整点?就是取出来就行用正则
解决方案七：
这个就是取laddr的式子....你把laddr换成你要的那些..应该就可以吧..我这没啥环境..不能试..你试试看取出来的是什么...我记得..好象是这么写..就可以取..laddr:"xxxxxxxxxx",这样的格式中的xxxxxx...了..规定头和双引号

时间： 2024-10-14 07:10:50

这样一个正则怎么取?爬虫，抓取程序，急！！！！！！！！！！

问题描述

解决方案

这样一个正则怎么取?爬虫，抓取程序，急！！！！！！！！！！的相关文章

java爬虫-请求一个url，用java抓取所有网页链接以及内容。

Java爬虫抓取视频网站下载链接_java

玩玩小爬虫——抓取动态页面

有关搜索引擎爬虫抓取原理浅析

nodejs爬虫抓取数据之编码问题_node.js

nodejs爬虫抓取数据乱码问题总结_node.js

使用Python编写简单网络爬虫抓取视频下载资源_python

网页-如何网络爬虫抓取淘宝交易数据

JAVA使用爬虫抓取网站网页内容的方法_java

用nodejs爬虫抓取网页，但提示无Post()函数