比如你抽取右边的活动
代码段如下:
import re #正则类 from urllib import urlopen #提取内容类 #打开链接 webpage = urlopen("http://www.douban.com") #提取读取内容 info = webpage.read() #正则匹配 party = re.findall("<a.href=\"http://www.douban.com/online/[0-9]+.\">(.{1,50})</a>",info) if len(party)>0: for x in xrange(len(party)):print party[x]
效果如下:
返回栏目页:http://www.bianceng.cnhttp://www.bianceng.cn/Programming/extra/
以上是小编为您精心准备的的内容,在的博客、问答、公众号、人物、课程等栏目也有的相关内容,欢迎继续使用右上角搜索按钮进行搜索正则
, 内容
, import
, www
, 抽取
urlopen
python 简单web服务器、python3 简单web框架、python 简单web、python代码示例、python爬虫代码示例,以便于您获取更多的相关知识。
时间: 2024-08-08 16:47:02