Python使用minidom读写xml的方法

   本文实例讲述了Python使用minidom读写xml的方法。分享给大家供大家参考。具体分析如下:

  一 python提供的xml支持

  2种工业标准的xml解析方法-SAX和DOM。SAX(simple API for XML),是基于事件处理的,当XML文档顺序地读入时,每次遇到一个元素会触发相应的事件处理函数来处理。DOM(Document Object Model),通过构建一个树结构来表现整个xml文档,一旦树被构建,可以通过DOM提供了接口来遍历树和提取相应的数据。

  python还提供了python独特的xml解析方法,相比于SAX和DOM更容易使用和更加快速,此方法为ElementTree。

  python的xml模块为:

  1)xml.dom.minidom

  2)xml.elementtree

  3)xml.sax + xml.dom

  二 xml实例:(employees.xml)

  ?

1
2
3
4
5
6
7
8
9
10
11

<?xml version="1.0" encoding="UTF-8" ?>
<employees>
<employee>
<name>l inux </name>
<age> 30 </age>
</employee>
<employee>
<name>windows </name>
<age> 20 </age>
</employee>
</employees>

  三 使用xml.dom.minidom来读写xml

  1)使用xml.dom.minidom来解析xml:

  ?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

def TestMiniDom():
from xml.dom import minidom
doc = minidom.parse( "employees.xml" )
# get root element: <employees/>
root = doc.documentElement
# get all children elements: <employee/> <employee/>
employees = root.getElementsByTagName( "employee" )
for employee in employees:
print ( " ------------------------------------------- " )
# element name : employee
print (employee.nodeName)
# element xml content : <employee><name>windows</name><age>20</age></employee>
# basically equal to toprettyxml function
print (employee.toxml())
nameNode = employee.getElementsByTagName( "name" )[0]
print (nameNode.childNodes)
print (nameNode.nodeName + ":" + nameNode.childNodes[0].nodeValue)
ageNode = employee.getElementsByTagName( "age" )[0]
print (ageNode.childNodes)
print (ageNode.nodeName + ":" + ageNode.childNodes[0].nodeValue)
print ( " ------------------------------------------- " )
for n in employee.childNodes:
print (n)
TestMiniDom()

  2)使用xml.dom.minidom来生成xml:

  ?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

def CreateXml():
import xml.dom.minidom
impl = xml.dom.minidom.getDOMImplementation()
dom = impl.createDocument(None, 'employees' , None)
root = dom.documentElement
employee = dom.createElement( 'employee' )
root.appendChild(employee)
nameE = dom.createElement( 'name' )
nameT = dom.createTextNode( 'linux' )
nameE.appendChild(nameT)
employee.appendChild(nameE)
ageE = dom.createElement( 'age' )
ageT = dom.createTextNode( '30' )
ageE.appendChild(ageT)
employee.appendChild(ageE)
f = open( 'employees2.xml' , 'w')
dom.writexml(f, addindent = ' ' , newl = 'n' ,encoding = 'utf-8' )
f.close()
CreateXml()

  3)使用xml.dom.minidom需要注意的

  *使用parse()或createDocument()返回的为DOM对象;

  *使用DOM的documentElement属性可以获得Root Element;

  *DOM为树形结构,包含许多的nodes,其中element是node的一种,可以包含子elements,textNode也是node的一种,是最终的子节点;

  *每个node都有nodeName,nodeValue,nodeType属性,nodeValue是结点的值,只对textNode有效。对于textNode,想得到它的文本内容可以使用: .data属性。

  *nodeType是结点的类型,现在有以下:

  'ATTRIBUTE_NODE''CDATA_SECTION_NODE''COMMENT_NODE''DOCUMENT_FRAGMENT_NODE'

  'DOCUMENT_NODE''DOCUMENT_TYPE_NODE''ELEMENT_NODE''ENTITY_NODE''ENTITY_REFERENCE_NODE'

  'NOTATION_NODE''PROCESSING_INSTRUCTION_NODE''TEXT_NODE'

  *getElementsByTagName()可以根据名字来查找子elements;

  *childNodes返回所有的子Nodes,其中所有的文本均为textNode,包含元素间的‘nr'和空格均为textNode;

  *writexml() 时addindent=' '表示子元素的缩进,newl='n'表示元素间的换行,encoding='utf-8'表示生成的xml的编码格式()。

  希望本文所述对大家的Python程序设计有所帮助。

时间: 2024-10-27 05:00:18

Python使用minidom读写xml的方法的相关文章

使用Python进行二进制文件读写的简单方法(推荐)_python

总的感觉,python本身并没有对二进制进行支持,不过提供了一个模块来弥补,就是struct模块. python没有二进制类型,但可以存储二进制类型的数据,就是用string字符串类型来存储二进制数据,这也没关系,因为string是以1个字节为单位的. import struct a=12.34 #将a变为二进制 bytes=struct.pack('i',a) 此时bytes就是一个string字符串,字符串按字节同a的二进制存储内容相同. 再进行反操作 现有二进制数据bytes,(其实就是字

Python创建xml的方法_python

本文实例讲述了Python创建xml的方法.分享给大家供大家参考.具体实现方法如下: from xml.dom.minidom import Document class write_xml(Document): def __init__(self): Document.__init__(self) def set_tag(self,tag): self.tag = tag self.tag1 = self.createElement(self.tag) self.appendChild(sel

python读写ini配置文件方法实例分析

  本文实例讲述了python读写ini配置文件方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 import ConfigParser import os class ReadWriteConfFile: currentDir=os.path.dirname(__file__) fil

Python读写配置文件的方法

  本文实例讲述了Python读写配置文件的方法.分享给大家供大家参考.具体分析如下: python 读写配置文件在实际应用中具有十分强大的功能,在实际的操作中也有相当简捷的操作方案,以下的文章就是对python 读写配置文件的具体方案的介绍,相信对大家学习Python有所帮助. python 读写配置文件ConfigParser模块是python自带的读取配置文件的模块.通过他可以方便的读取配置文件. 这里就来简单介绍一下python 读写配置文件的方法. 配置文件.顾名思议就是存放配置信息的

python自定义解析简单xml格式文件的方法

  这篇文章主要介绍了python自定义解析简单xml格式文件的方法,涉及Python解析XML文件的相关技巧,非常具有实用价值,需要的朋友可以参考下: 因为公司内部的接口返回的字串支持2种形式:php数组,xml;结果php数组python不能直接用,而xml字符串的格式不是标准的,所以也不能用标准模块解析.[不标准的地方是某些节点会的名称是以数字开头的],所以写个简单的脚步来解析一下文件,用来做接口测试. ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

python比较2个xml内容的方法

  这篇文章主要介绍了python比较2个xml内容的方法,涉及Python操作XML文件的相关技巧,需要的朋友可以参考下 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 from xml.etree import ElementTree OK=True main_p

python读写二进制文件的方法

  本文实例讲述了python读写二进制文件的方法.分享给大家供大家参考.具体如下: 初学python,现在要读一个二进制文件,查找doc只发现 file提供了一个read和write函数,而且读写的都是字符串,如果只是读写char等一个字节的还行,要想读写如int,double等多字节数 据就不方便了.在网上查到一篇贴子,使用struct模块里面的pack和unpack函数进行读写.下面就自己写代码验证一下. ? 1 2 3 4 >>> from struct import * >

php的SimpleXML方法读写XML接口文件实例解析_php技巧

在php5中读写xml文档是非常方便的,可以直接使用php的SimpleXML方法来快速解析与生成xml格式的文件,下面举例说明: 创建一个SimpleXML对象有三种方法: 1.使用new关键字创建 复制代码 代码如下: $xml="<personinfo><item><id>1</id><name>aaa</name><age>16</age></item><item>&l

用python读写excel的方法_python

本文实例讲述了用python读写excel的方法.分享给大家供大家参考.具体如下: 最近需要从多个excel表里面用各种方式整理一些数据,虽然说原来用过java做这类事情,但是由于最近在学python,所以当然就决定用python尝试一下了.发现python果然简洁很多.这里简单记录一下.(由于是用到什么学什么,所以不算太深入,高手勿喷,欢迎指导) 一.读excel表 读excel要用到xlrd模块,官网安装(http://pypi.python.org/pypi/xlrd).然后就可以跟着里面