java解析XML之DOM解析和SAX解析(包含CDATA的问题)

  Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档;
  SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档;SAX采用事件驱动的方式解析XML。如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息。SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理。在SAX的解析过程中,读取到文档开头、文档结尾,元素的开头和元素结尾都会调用相应方法,我们可以在这些方法中进行相应事件处理。
github项目地址:https://github.com/Snailclimb/XML github
Students.xml

<?xml version="1.0" encoding="utf-8"?>

<Students>
  <Student num="001">
    <name>小明</name>
    <age>20</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="002">
    <name>小红</name>
    <age>21</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="003">
    <name>小蓝</name>
    <age>23</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="004">
    <name>小白</name>
    <age>19</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="005">
    <name>小林子</name>
    <age>18</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="006">
    <name>小东子</name>
    <age>20</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="007">
    <name>小左子</name>
    <age>21</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="008">
    <name>小张</name>
    <age>22</age>
    <subject><![CDATA[数学&英语]]></subject>
  </Student>
  <Student num="009">
    <name>小明</name>
    <age>23</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
  <Student num="010">
    <name>小明</name>
    <age>20</age>
    <subject><![CDATA[数学&英语]]></subject>
    <sport>篮球</sport>
  </Student>
</Students>

DOM解析

package cn.yangtze.domtext;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DomPractice {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        // 创建一个DocumentBuilderFactory的对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        // 创建一个DocumentBuilder的对象
        try {
            // 创建DocumentBuilder对象
            DocumentBuilder db = dbf.newDocumentBuilder();
            // 通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下
            Document document = db.parse("Students.xml");
            // 获取所有Student节点的集合
            NodeList StudentList = document.getElementsByTagName("Student");
            // 通过nodelist的getLength()方法可以获取StudentList的长度
            System.out.println("DOM解析开始...");
            // 遍历每一个Student节点
            for (int i = 0; i < StudentList.getLength(); i++) {
                System.out.println("开始解析第" + (i + 1) + "个学生");
                // 通过 item(i)方法 获取一个Student节点,nodelist的索引值从0开始
                Node book = StudentList.item(i);
                // 获取Student节点的所有属性集合
                NamedNodeMap attrs = book.getAttributes();
                // 遍历Student的属性
                for (int j = 0; j < attrs.getLength(); j++) {
                    // 通过item(index)方法获取Student节点的某一个属性
                    Node attr = attrs.item(j);

                    // 输出学生的属性名和属性值
                    System.out.println(attr.getNodeName() + ":" + attr.getNodeValue());
                }
                NodeList childNodes = book.getChildNodes();
                // 遍历childNodes获取每个节点的节点名和节点值
                for (int k = 0; k < childNodes.getLength(); k++) {
                    // 区分出text类型的node以及element类型的node
                    if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {

                        // 输出子节点的属性名和属性值
                        System.out.println(childNodes.item(k).getNodeName() + ":"
                                + childNodes.item(k).getFirstChild().getNodeValue());

                    }

                }

            }
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        System.out.println("DOM解析结束...");
    }
}

SAX解析
SAXParserHandler.java

package cn.yangtze.saxtext;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SAXParserHandler extends DefaultHandler {
    private int StudentIndex = 0;

    // 解析开始的标志
    @Override
    public void startDocument() throws SAXException {
        System.out.println("SAX解析开始...");
    }

    // 解析结束的标志
    @Override
    public void endDocument() throws SAXException {
        System.out.println("SAX解析结束...");
    }

    // 用来遍历XML文件的开始标签
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        // 调用DefaultHandler类的startElement方法
        super.startElement(uri, localName, qName, attributes);
        // 开始解析Student元素节点
        if (qName.equals("Student")) {
            ++StudentIndex;
            System.out.println("开始解析第" + StudentIndex + "个学生");
            //输出XML属性,也就是XML文件中的num属性,注意在因使用属性而引起的一些问题:
            /*1 ,属性无法包含多重的值(元素可以)
            2,属性无法描述树结构(元素可以)
            3,属性不易扩展(为未来的变化)
            4,属性难以阅读和维护
            5,请尽量使用元素来描述数据。而仅仅使用属性来提供与数据无关的信息。*/
            for (int i = 0; i < attributes.getLength(); ++i) {
                System.out.println(attributes.getQName(i) + ":" + attributes.getValue(i));
            }
        } else if (!qName.equals("Students")) {
            System.out.print(qName + ":");//输出元素值
        }
    }

    // 用来遍历XML文件的结束标签
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        super.endElement(uri, localName, qName);
        // 判断一个学生是否解析完
        if (qName.equals("Student")) {
            System.out.println("结束解析第" + StudentIndex + "个学生");
        }
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        super.characters(ch, start, length);
        String text = new String(ch, start, length);
        if (!text.trim().equals("")) {
            System.out.println(text);
        } // if
    }
}

SAXDemo.java

//SAX解析XML
package cn.yangtze.saxtext;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

public class SAXDemo {
    public static void main(String[] args) {
        File file =new File("Students.xml");
        try {
            // 通过SAXParserFactory的静态方法newInstance()方法获取SAXParserFactory实例对象factory
            SAXParserFactory factory = SAXParserFactory.newInstance();
            // 通过SAXParserFactory实例的newSAXParser()方法返回SAXParser实例parser
            SAXParser saxParser = factory.newSAXParser();
            // 定义SAXParserHandler对象
            SAXParserHandler handler = new SAXParserHandler();
            // 解析XML文档
            saxParser.parse(file, handler);
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}
时间: 2024-09-27 13:31:26

java解析XML之DOM解析和SAX解析(包含CDATA的问题)的相关文章

我的Android进阶之旅------&amp;gt;Android中解析XML 技术详解----&amp;gt;SAX解析、DOM解析、PULL解析

XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能.今天就由我向大家介绍一下在Android平台下几种常见的XML解析和创建的方法. 在Android中,常见的XML解析器分别为SAX解析器.DOM解析器和PULL解析器,下面,我将一一向大家详细介绍. SAX解析器: SAX(Simple API for XML)解析器是一种基于事件的解析器,它的核心是事件处理模式,主要是围绕着事件源以及事件处理器来工作的.当事

Python解析xml中dom元素的方法_python

本文实例讲述了Python解析xml中dom元素的方法.分享给大家供大家参考.具体实现方法如下: 复制代码 代码如下: from xml.dom import minidom try:     xmlfile = open("path.xml", "a+")     #xmldoc = minidom.parse( sys.argv[1])     xmldoc = minidom.parse(xmlfile) except :     #updatelogger.

java dom4j解析xml,用的是dom4g解析

问题描述 java dom4j解析xml,用的是dom4g解析 下面数据格式 需要获取标签值 解决方案 Java Dom4j解析 xmlJava -- XML解析工具dom4jJava中解析XML的四种常用方法(4)_DOM4J解析---------------------- 解决方案二: 你怎么传图片呢?传文字上去我们可以直接粘贴复制测试

[Java开发之路](11)SAX解析XML文档

1. 简介 Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档: SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档: SAX采用事件驱动的方式解析XML.套用网友的解释:如同在电影院看电影一样,从头到尾看一遍,不能回退(Dom可来来回回读取),在看电影的过程中,每遇到一个情节,都会调用大脑去接收处理这些信息.SAX也是相同的原理,每遇到一个元素节点,都会调用相应的方法来处理.在SAX的解析过程中,读取到文档开头.文档结尾,元素的开头和元素结尾都

Java解析XML(一)、SAX

package xml; import java.io.IOException; import java.io.InputStream; import java.util.List; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import model.Book; /** * 使用SAX解析XML文件 */ public class SaxHelper { private stati

Android解析XML的三种方式SAX、Pull、Dom

在android开发中,经常用到去解析xml文件,常见的解析xml的方式有一下三种:SAX.Pull.Dom解析方式.最近做了一个android版的CSDN阅读器,用到了其中的两种(sax,pull),本文对android解析xml的这三种方式进行一次总结. 今天解析的xml示例(channels.xml)如下: <?xml version="1.0" encoding="utf-8"?> <channel> <item id=&quo

Android解析XML的三种方式SAX、Pull、Dom_Android

在android开发中,经常用到去解析xml文件,常见的解析xml的方式有一下三种:SAX.Pull.Dom解析方式.最近做了一个android版的CSDN阅读器,用到了其中的两种(sax,pull),本文对android解析xml的这三种方式进行一次总结. 今天解析的xml示例(channels.xml)如下: <?xml version="1.0" encoding="utf-8"?> <channel> <item id=&quo

JAVA的XML编程(dom)

dom|xml|编程 XML作为全球通用的结构化语言,越来越受人们青睐,各种开发平台(比如Microsoft Studio系列.Oracle系列.Inprise Borland系列等)也都把支持XML开发作为宣传口号之一 .由于笔者所从事的电子政务开发较早的引入了XML,所以尝到了许多甜头,在许多项目中利用XML数据交换信息,省去了许多麻烦事,不用制定繁锁的数据格式,利用XML数据易于表达,也利于一线开发者跟踪调试. 笔者先前也曾发表过相关的文章,比如<简析Delphi中的XML编程>一文,有

java解析xml之dom解析xml示例分享_java

复制代码 代码如下: package com.test; import java.io.File;import java.util.ArrayList;import java.util.List;import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import org.w3c.dom.Document;import org.w3c.dom.Element;import o