利用Python抓取行政区划码的方法_python

前言

国家统计局网站上有相对比较齐的行政区划码，对于一些网站来说这是非常基础的数据，所以写了个Python程序将这部分数据抓取下来。

注意：抓取下来以后还要进行简单的人工的整理

示例代码：

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'

def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u'　',''),area[1].decode('utf-8').count(u'　')

if __name__=='__main__':
 get_xzqh()

注意事项：

另外，关于国家地区表的信息，还有另外一种获取渠道，那就是QQ软件自带的国家地区信息表。（文件名为LocList.xml），一般的存储位置为：C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取，如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的，极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容，希望本文的内容对大家学习或者使用python能有所帮助，如果有疑问大家可以留言交流。

以上是小编为您精心准备的的内容，在的博客、问答、公众号、人物、课程等栏目也有的相关内容，欢迎继续使用右上角搜索按钮进行搜索python
抓取网页内容
python 行政区划、行政区划代码 python、抓取统计用区划代码、python抓取网页数据、python 抓取网页，以便于您获取更多的相关知识。

时间： 2024-09-20 06:26:03

利用Python抓取行政区划码的方法_python

利用Python抓取行政区划码的方法_python的相关文章

利用PHP抓取百度阅读的方法示例_php技巧

python抓取百度首页的方法

Python爬取三国演义的实现方法_python

python实现从web抓取文档的方法_python

Python抓取框架 Scrapy的架构_python

Python抓取Discuz!用户名脚本代码_python

Python抓取京东图书评论数据_python

python中两种判断和抓取网页编码的方法

编码-python抓取网页，网页源码无法解码