VC++中利用MSXML解析XML文档

c++|xml

四、程序实现

　　下面通过一个具体的实例来说明在VC++中如何利用MSXML解析XML文档。

　　（1）源XML文档（xmlfile.xml）如下：

　　＜?xml version="1.0" encoding="GB2312"?＞
　　＜Device id="10041" name="设备1"＞
　　＜Type＞13＜/Type＞
　　＜TypeName＞保护＜/TypeName＞
　　＜/Device＞

　　我们在源文档中查找"Device"，将其"name"属性设置为"测试设备"，为其添加"Model"节点，并设置其文本为"3"。

　　（2）源程序如下：

　　CoInitialize(NULL)； // 初始化COM。
　　CComPtr＜IXMLDOMDocument＞ spXMLDOM;
　　HRESULT hr=spXMLDOM.CoCreateInstance (_uuidof(DOMDocument));
　　// 创建解析器实例。
　　VARIANT_BOOL bSuccess=false;
　　hr=spXMLDOM-＞load(CComVariant(L"xmlfile.xml"),&bSuccess);
　　// 装载XML文档。
　　CComBSTR bstrSS(L"Device");
　　CComPtr＜IXMLDOMNode＞ spDevice;
　　hr=spXMLDOM-＞selectSingleNode(bstrSS,&spDevice); //搜索"Device"。
　　CComQIPtr＜IXMLDOMElement＞ spDev;
　　spDev=spDevice;
　　// 设置"Device"的"name"属性。
　　hr= spDev -＞setAttribute(CComBSTR(L"name"),CComVariant("测试设备"));
　　CComPtr＜IXMLDOMNode＞ spModelNode; hr=spXMLDOM-＞createNode(CComVariant(NODE_ELEMENT)，ComBSTR
　　（"Model"),NULL,& spModelNode); // 创建"Model"节点。
　　CComPtr＜IXMLDOMNode＞ spInsertedNode;
　　hr=spDevice-＞appendChild (spModelNode,&spInsertedNode);
　　// 添加新节点到"Device"节点下面。
　　CString strID="3";
　　hr=spInsertedNode-＞put_text(strID.AllocSysString());// 设置"Model"的文本。
　　hr=spXMLDOM-＞save(CComVariant("xmlfile.xml")); / /保存文档。
　　CoUninitialize(); // 结束对COM的使用。

　　因为篇幅的原因，上述代码的每步操作并未对返回的HRESULT类型进行判断，也未进行异常的捕获处理，在实际的编程中读者应根据返回的hr进行决断，以决定程序的流程，同时应进行异常的捕获处理。

　　（3）修改后的XML文档如下

　　＜?xml version="1.0" encoding="GB2312"?＞
　　＜Device id="10041" name="测试设备"＞
　　＜Type＞13＜/Type＞
　　＜TypeName＞保护＜/TypeName＞
　　＜Model＞3＜/Model＞
　　＜/Device＞

　　五、结束语

　　因为XML文档有着比HTML更严格的语法要求，所以使用和编写一个XML解析器要比编写一个HTML解析器要容易得多。同时因为XML文档不仅可以标记文档的显示属性，更重要的是它标记了文档的结构和包含信息的特征，所以我们可以方便地通过XML解析器来获取特定节点的信息并加以显示或修改，方便了用户对XML文档的操作和维护。同时我们需要注意的是，XML是一种开放的结构体系，并不依赖于任何一家公司，所以开发基于XML的应用必然会得到绝大多数软件开发平台的支持。　　一、 XML 简介

　　XML（Xtensible Markup Language，即扩展标记语言）的发展起源于1996年。当时，出版界巨头和Web业内人士经过共同讨论，提出了创建SGML（Standard Generalized Markup Language，即标准通用标识语言）子集（HML）的建议。该子集专用于Web，具有可扩展（或可扩充）性，并且能利用结构化标记语言的所有高级功能，但摒弃了SGML的复杂性。XML规范的第一份草稿于1996年11月发布后不久，1997年1月首个XML解析器就面世了。随后，便出现了XML的应用以及新的规范和解析器。

　　HTML(Hypertext Markup Language)语言是大家所熟悉的开发网页的一种标记语言，但它不是一种编程语言，它的主要标记是针对文档内容本身结构的描述，因机器本身是不能够解析它的内容的。XML语言是SGML语言的子集，它保留了SGML主要的使用功能，同时大大减小了SGML的复杂性。它不仅能表示文档的内容，而且可以表示文档的结构，这样在能够被人类理解的同时，也能够被机器所理解。虽然HTML是SGML的一个应用，XML是SGML的一个子集，但是XML绝不是在 HTML上添加某些元素而形成的，它们之间是有很大区别的。最大的区别就是XML允许使用者为某种特殊目的而定义自已的元素。除此之外，另一个最主要的区别就是XML致力解决的问题，正是在使用HTML时所遇到的一些特殊问题。

　　XML要求遵循一定的严格标准，其分析程序比HTML浏览器对语法和结构的要求更加严格。XML文档每次分析的结果都一致，而HTML在不同的浏览器中可能会作出不同的分析和显示。同时，XML标准是对数据的处理应用，而不只是针对Web页的，它还可涉及到数据库电子商务系统，以及任何显示系统的高级应用。开发者可根据特定的工业需求，利用XML创建自定义的数据结构。这些数据结构和数据库可以在许多设备上查看，而不需要使用自定义的接口在不同的显示设备上查看相同的数据。

　　XML主要有三个要素：文档类型声明(DTD：Document Type Declaration)或XML Schema(XML大纲)、可扩展样式语言(XSL：eXtensible Stylesheet Language)和可扩展链接语言（XLink：eXtensible Link Language）。DTD和XML大纲规定了XML文件的逻辑结构，定义了XML文件中的元素、元素的属性以及元素与元素属性之间的关系； Namespace(名域)实现了统一的XML文档数据表示以及数据的相互集成；XSL是用于规定XML文档呈现样式的语言，它使得数据与其表现形式相互独立，比如XSL能使Web浏览器改变文档的表示法，如数据显示顺序的变化，不需要再与服务器进行通讯。通过改变样式表，同一个文档可以显示得更大，或者经过折叠只显示外面的一层，或者可以变为打印的格式。而XLink 将进一步扩展目前Web上已有的简单链接。

　　二、文档对象模型（DOM）

　　DOM是Document Object Model（文档对象模型）的简称，是对Web文档进行应用开发、编程的应用程序接口（API）。作为W3C公布的一种跨平台、与语言无关的接口规范，DOM提供了在不同环境和应用中的标准程序接口，可以用任何语言实现。

　　DOM采用对象模型和一系列的接口来描述XML文档的内容和结构，即利用对象把文档模型化。这种对象模型实现的基本功能包括：

　　·　描述文档表示和操作的接口；

　　· 接口的行为和属性；

　　· 接口之间的关系以及互操作。

　　DOM可对结构化的XML文档进行解析，文档中的指令、元素、实体、属性等所有内容个体都用对象模型表示，整个文档被看成是一个有结构的信息树，而不是简单的文本流，生成的对象模型就是树的节点，对象同时包含了方法和属性。因此，对文档的所有操作都是在对象树上的进行。在DOM中，树中的一切都是对象，不管是根节点还是实体的属性。

　　在DOM中主要有以下三个对象：

　　· XML文档对象 XML文档既是一种对象，同时又代表整个XML文档。它由根元素和子元素组成。

　　· XML节点对象 XML节点对象代表的是XML文档内部的节点，如元素、注释、名字空间等。

　　· XML节点列表 XML文档模块列表代表了节点的集合。

　　利用DOM，开发人员可以动态地创建XML文档，遍历结构，添加、修改、删除内容等。其面向对象的特性，使人们在处理XML解析相关的事务时节省大量的精力，是一种符合代码重用思想的强有力编程工具。

　　三、MSXML

　　从理论上说，根据XML的格式定义，我们可以自己编写一个XML的语法分析器，但实际上微软已经给我们提供了一个XML语法解析器，即一个叫做MSXML.DLL的动态链接库，实际上它是一个COM（Component Object Model）对象库，里面封装了进行XML解析时所需要的所有对象。因为COM是一种以二进制格式出现的和语言无关的可重用对象，所以你可以用任何语言(比如VB，VC，DELPHI，C++ Builder甚至是剧本语言等等)对它进行调用，在你的应用中实现对XML文档的解析。

　　MSXML.DLL所包括的主要COM接口有：

　　1. DOMDocument

　　DOMDocument对象是XML DOM的基础，你可以利用它所暴露的属性和方法来浏览、查询和修改XML文档的内容和结构。DOMDocument表示了树的顶层节点，它实现了DOM文档的所有的基本方法，并且提供了额外的成员函数来支持XSL和XSLT。它创建了一个文档对象，所有其他的对象都可以从这个文档对象中得到和创建。

　　2. IXMLDOMNode

　　IXMLDOMNode是文档对象模型(DOM)中的基本对象，元素、属性、注释、过程指令和其他的文档组件都可以认为是IXMLDOMNode。事实上，DOMDocument对象本身也是一个IXMLDOMNode对象。

　　3. IXMLDOMNodeList

　　IXMLDOMNodeList实际上是一个节点(Node)对象的集合，节点的增加、删除和变化都可以在集合中立刻反映出来，可以通过"for...next"结构来遍历所有的节点。

　　4. IXMLDOMParseError

　　IXMLDOMParseError接口用来返回在解析过程中所出现的详细的信息，包括错误号、行号、字符位置和文本描述。

　　在具体应用时可以用DOMDocument的Load方法来装载XML文档，用IXMLDOMNode 的selectNodes（查询的结果有多个，得到存放搜索结果的链表）或selectSingleNode（查询的结果有一个，在有多个的情况下返回找到的第一个节点）方法进行查询，用createNode和appendChild方法来创建节点和追加节点，用IXMLDOMElement的 setAttribute和getAttribute方法来设置和获得节点的属性。

时间： 2024-11-02 10:41:50

VC++中利用MSXML解析XML文档

VC++中利用MSXML解析XML文档的相关文章

利用MSXML解析XML文本

java中四种生成和解析XML文档的方法详解（介绍+优缺点比较+示例）_java

解析在.net中使用XSLT转换xml文档的示例详解_实用技巧

灵活调用xsl来解析xml文档(js异步)

四种生成和解析XML文档的方法详解（介绍+优缺点比较+示例）

[Java开发之路]（12）JDOM和DOM4J解析XML文档

解析xml文档的一个简单php类

使用PHP 5.0 轻松解析XML文档（1）

使用Digester解析XML文档示例