简述PHP4和PHP5版本下解析XML文档的操作方法

  在PHP网站开发与建设过程中,时常会碰到需要对XML文档进行解析,PHP4版本自带了XML解析器(sax),PHP5版本增加了SimpleXML(基于dom)的XML扩展,对XML的解析更是非常方便,今天和大家分享下在不同环境下对XML文档进行解析的方法。
XML文档

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
<?xml
version="1.0"
encoding="gbk"?>
<LeapsoulXML>  
    <LeapsoulInfo>  
        <name>Leapsoul-PHP网站开发</name>  
        <website>http://www.leapsoul.cn</website>  
        <description>分享PHP网站开发与建设的乐趣,教你如何建立网站</description>
        <bloger>David</bloger>
        <date>2009-05-13</date>
        <qq>QQ:154130270</qq>
    </LeapsoulInfo>

    <LeapsoulInfo>  
        <name>Leapsoul-PHP网站开发</name>
        <website>http://www.leapsoul.cn</website>
        <description>分享PHP网站开发与建设的乐趣,教你如何建立网站</description>
        <bloger>David</bloger>
        <date>2009-05-13</date>
        <qq>QQ:154130270</qq>
    </LeapsoulInfo>
</LeapsoulXML>

PHP5版本下SimpleXML的使用方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
$info
= simplexml_load_file('leapsoulcn.xml');

print_r($info);
   
$name
=
$info->LeapsoulInfo[0]->name;
   
echo
$name;

foreach
($info->LeapsoulInfo
as
$LeapsoulInfo)
{
    echo
$LeapsoulInfo->name."<br />";
    echo
$LeapsoulInfo->website."<br />";
    echo
$LeapsoulInfo->description."<br />";
    echo
$LeapsoulInfo->bloger."<br />";
    echo
$LeapsoulInfo->date."<br />";
    echo
$LeapsoulInfo->qq."<br />";
}

foreach($info->xpath('//name')
as
$value)
{  
    echo
$value.'<br />';
}
   
foreach($info->LeapsoulInfo[0]->children()
as
$value)
{  
    echo
$value->getName();
    echo
$value.'<br />';  
}

$info->LeapsoulInfo[0]->addChild('msn',
'MSN:davidfaithman@hotmail.com');
$info->asXML('leapsoulcn.xml');

代码注释

第1行:simplexml_load_file:读取一个xml文档作为操作对象,可以读取本地或者远程xml文档;simplexml_load_string:读取一个xml字符串作为操作的对象

第3行:如果不清楚如何获取某个节点的信息,可用print_r函数打印输出查看具体的结构,simplexml解析返回的对象具有数组结构。

第5~8行:以对象方式读取某个XML文档节点信息,读取方式:句柄->节点元素名->子节点,如果相同的节点元素有多个,则以数组(array)方式读取

:由于simplexml解析返回的信息是UTF8格式的,如果网站使用的是GBK的,则需要转码,你可以使用iconv函数或者其他的utf8与gbk转换函数进行操作,如:$name = iconv(’utf-8′,’gbk’,$name);

第9~17行:以遍历的形式,读取所有元素下的子节点信息

第19~21行:simplexml的xpath函数是用来查询XML数据的,比如这里查询的是所有name节点的值

第23~26行:children函数是用来找寻某个特定节点下所有子节点的值。getName函数用来获得每个子节点的元素名称

第28~29行:addChild函数用来在某个特定节点下增加一个子节点;asXML函数对已做过改动的XML文档进行保存

点击查看更多SimpleXML函数说明。

PHP4版本自带的XML函数解析方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
function doStartElement($xmlParser,$name,$attr)
{
    //对开始元素的处理
}
   
function doEndElement($xmlParser,$name)
{
    //对结尾元素的处理
}
   
function doStringData($xmlParser,$data)
{
    //对元素间的字符数据的处理
}

$xmlObj
=
xml_parser_create("UTF-8");

xml_set_element_handler($xmlObj,"doStartElement","doEndElement");

xml_set_character_data_handler($xmlObj,"doStringData");

xml_parse($xmlObj,file_get_contents("leapsoulcn.xml"));

xml_parser_free($xmlObj);

代码注释

第1~15行:定义开始元素,结尾元素以及元素间字符数据的处理函数

第16行:建立一个新的XML解析器并返回可被其它XML函数使用的资源句柄,输入默认编码方式为 “ISO-8859-1”。同时,支持的编码方式还有“UTF-8”和 “US-ASCII”,输出数据编码方式是和xml_parser_create函数处定义相一致。

第18行:建立起始和终止元素处理器

第20行:建立字符数据处理器,处理元素之间的相关数据
:XML语法解析器不会加上或者去掉任何空格,空格的取舍将由开发者自己决定。

第22行:启动解析器xml_parse函数第二个参数是字符型的,所以需要读取相关的XML文档信息,此处我用的是file_get_contents函数,本地远程都可行,当然你也可以使用fopen函数

第24行:XML解析完成后,释放解析器占用的内存

自带的XML函数解析思路

第一步:自定义开始元素,结尾元素以及元素间字符数据的处理函数;第二步:建立一个XML解析器;第三步:建立起始和终止元素处理器;第四步:建立字符数据处理器,处理元素之间的相关数据;第五步:启动解析器;第六步:XML解析完成后,释放解析器占用的内存。

总结

  总的来说PHP自带的XML解析器使用起来相当繁琐,需要有较强的逻辑,而且如果XML文档结构不同,元素、字符等3个函数需要重新定义,而在PHP5版本增加了SimpleXML扩展后,XML解析起来非常简单,当然如果你需要进行更复杂的XML文档解析操作,你也可以下载安装并使用libxml,功能相当强。

  :PHP网站开发教程-leapsoul.cn版权所有,转载时请以链接形式注明原始出处及本声明,谢谢。

时间: 2024-12-20 13:39:13

简述PHP4和PHP5版本下解析XML文档的操作方法的相关文章

用PHP5的SimpleXML解析XML文档

messages.xml ======================================================== <?xml version="1.0" ?> <!--Sample XML document --> <SystemMessage> <MessageTitle>System Down for Maintenance</MessageTitle> <MessageBody>Go

使用PHP 5.0 轻松解析XML文档(1)

xml 用sax方式的时候,要自己构建3个函数,而且要直接用这三的函数来返回数据, 要求较强的逻辑. 在处理不同结构的xml的时候, 还要重新进行构造这三个函数,麻烦! 用dom方式,倒是好些,但是他把每个节点都看作是一个node,操作起来要写好多的代码, 麻烦! 网上有好多的开源的xml解析的类库, 以前看过几个,但是心里总是觉得不踏实,感觉总是跟在别人的屁股后面. 这几天在搞java, 挺累的,所以决定换换脑袋,写点php代码,为了防止以后xml解析过程再令我犯难,就花了一天的时间写了下面一

使用Digester解析XML文档示例

xml|示例 一. 概述 解析XML文档方面有不少的方法,也有不少的工具包可用,这里介绍的是来自Apache Jakarta的Digester,使用其解析XML文件非常方便而不需要过多的关心底层的具体解析过程. Digester最早出现在Struts中,后来随着Struts的发展以及其的公用性而被提到commens中独自立项,其底层实现的是SAX解析.当前版本为:1.5 二. 正文 1. 安装与配置 使用Digester需要如下几个软件包: Digester ,BeanUtils, Collec

Digester解析XML文档Sample

xml 解析XML文档 Digester的使用相当简单,请参看如下的SampleDigester类中的注释,这里不再拗述: /*============================================================ * Copyright:www.skyinn.org (c) 2002 - 2003 All rights reserved. * File:org.skyinn.quasar.config.SampleDigester * Inculde:Samp

VC++中利用MSXML解析XML文档

c++|xml 四.程序实现 下面通过一个具体的实例来说明在VC++中如何利用MSXML解析XML文档. (1)源XML文档(xmlfile.xml)如下: <?xml version="1.0" encoding="GB2312"?> <Device id="10041" name="设备1"> <Type>13</Type> <TypeName>保护</Ty

使用PHP 5.0 轻松解析XML文档(5)

xml 下面是通过getNode()函数,返回某一个分类下的所有商品的信息商品名: food11Array( [name] => food11 [price] => 12.90)Array( [id] => food11)商品名:food12Array( [name] => food12 [price] => 22.10 [desc] => Array ( [value] => 好东西推荐 [attrs] => Array ( [creator] =>

灵活调用xsl来解析xml文档(js异步)

js|xml|异步     1.新建一个vs2003的web工程,取名为XMLTest      2.将工程目录下的WebForm1.aspx中内容全部删除,只留下顶部的一条语句:      <%@ Page language="c#" Codebehind="WebForm1.aspx.cs" AutoEventWireup="false" Inherits="XMLTest.WebForm1" %> 3.修改W

四种生成和解析XML文档的方法详解(介绍+优缺点比较+示例)

原文链接 作者:Alexia(minmin) 众所周知,现在解析XML的方法越来越多,但主流的方法也就四种,即:DOM.SAX.JDOM和DOM4J 下面首先给出这四种方法的jar包下载地址 DOM:在现在的Java JDK里都自带了,在xml-apis.jar包里 SAX:http://sourceforge.net/projects/sax/ JDOM:http://jdom.org/downloads/index.html DOM4J:http://sourceforge.net/proj

《Java核心技术 卷Ⅱ 高级特性(原书第10版)》一3.2 解析XML文档

3.2 解析XML文档 要处理XML文档,就要先解析(parse)它.解析器是这样一个程序:它读入一个文件,确认这个文件具有正确的格式,然后将其分解成各种元素,使得程序员能够访问这些元素.Java库提供了两种XML解析器: 像文档对象模型(Document Object Model, DOM)解析器这样的树型解析器(tree parser),它们将读入的XML文档转换成树结构. 像XML简单API(Simple API for XML, SAX)解析器这样的流机制解析器(streaming pa