python分析网页上所有超链接的方法

   这篇文章主要介绍了python分析网页上所有超链接的方法,涉及Python使用urllib模块操作页面超链接的技巧,需要的朋友可以参考下

  ?

1
2
3
4
5
6
7
8
9

import urllib, htmllib, formatter
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.NullWriter())
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
for link in ptext.anchorlist:
print(link)

  希望本文所述对大家的Python程序设计有所帮助。

时间: 2024-11-08 21:23:33

python分析网页上所有超链接的方法的相关文章

python获取指定网页上所有超链接的方法_python

本文实例讲述了python获取指定网页上所有超链接的方法.分享给大家供大家参考.具体如下: 这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址 import urllib2 import re #connect to a URL website = urllib2.urlopen(url) #read html code html = website.read() #use re.findall to get all the links links

Python提取网页中的超链接地址方法

最近正在学习Python,打算用作爬虫开发.既然要做爬虫,首先就要抓取网页,并且从网页中提取出超链接地址. 下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接,代码如下:  代码如下 复制代码 import urllib2 import re url = 'http://www.111cn.net/' req = urllib2.Request(url) con = urllib2.urlopen(req) doc = con.read() con.c

Word2010过滤网页上的超链接和图片方法

  我们时常会在某些网站上找一些自己想要的资料,但是许多网站上都有各种各样的格式.超链接.图片等,复制到Word里面后你会发现连同这些样式全部都粘贴到文档里面了.我们要的纯文本形式的,如果手工去除这些样式工作量可不小,而且又麻烦.怎样可以直接复制网页里面的内容时只粘贴纯文本到文档中,而且都将这些超链接.图片等样式全部过滤掉呢?下面就来为大家详解操作吧! Word2010过滤网页上的超链接和图片方法: 方法一:先复制网页上带样式的内容,然后进入Word2010界面,单击左上角的"粘贴"箭

Python获取网页上图片下载地址的方法_python

本文实例讲述了Python获取网页上图片下载地址的方法.分享给大家供大家参考.具体如下: 这里获取网页上图片的下载地址是正在写的数据采集中的一段,代码如下: 复制代码 代码如下: #!/user/bin/python3 import urllib2 from HTMLParser import HTMLParser class MyHtmlParser(HTMLParser):     links = []     def handle_starttag(self, tag, attrs):  

jQuery找出网页上最高元素的方法

 这篇文章主要介绍了jQuery找出网页上最高元素的方法,实例分析了jQuery遍历元素与获取元素高度的技巧,具有一定参考借鉴价值,需要的朋友可以参考下     本文实例讲述了jQuery找出网页上最高元素的方法.分享给大家供大家参考.具体如下: 这段JS代码通过jQuery遍历网页上的元素,找出其中最高的元素 ? 1 2 3 4 5 6 7 8 9 $(document).ready(function() { var maxHeight = -1; $('.features').each(fu

php获取网页上所有链接的方法

本文实例讲述了php取得网页上所有链接的方法.分享给大家供大家参考.具体实现方法如下: 代码如下: <?php function get_all_url($code){ preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr); return array('name'=>$arr[2],'url'=>$arr[

javascript-给网页上的超链接按钮添加声音 点击就发出声音 要多浏览器支持 怎么写

问题描述 给网页上的超链接按钮添加声音 点击就发出声音 要多浏览器支持 怎么写 延迟越小越好 声音反应速度要快 给网页上的超链接按钮添加声音 点击就发出声音 要多浏览器支持 怎么写 解决方案 jmp3这个插件,用flash实现的,移动端浏览器不兼容,不过可以用audio标签来播放音频,自己判断下是否支持audio

php获取网页上所有链接的方法_php技巧

本文实例讲述了php取得网页上所有链接的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: <?php function get_all_url($code){     preg_match_all('/<as+href=["|']?([^>"' ]+)["|']?s*[^>]*>([^>]+)</a>/i',$code,$arr);     return array('name'=>$arr[2],'u

jQuery找出网页上最高元素的方法_jquery

本文实例讲述了jQuery找出网页上最高元素的方法.分享给大家供大家参考.具体如下: 这段JS代码通过jQuery遍历网页上的元素,找出其中最高的元素 $(document).ready(function() { var maxHeight = -1; $('.features').each(function() { maxHeight = maxHeight > $(this).height() ? maxHeight : $(this).height(); }); $('.features'