如何得到XML文档大小

xml

XML文档从格式到大小都是不是确定的。有的可能只有几行,而有的却有好几兆字节。你也许会怀疑是不是需要了解XML文档的大小。而当性能成为首要问题时,知道XML文档大小就是件必须要作的事情了。

从性能角度讲,有两类处理XML文档的方法。批量处理方式需要较短的时间,解析成组的文档。实时方式就是实时的处理文档。批处理方式的性能可以通过在一定时间内处理多少文档来测量,而实时模式的性能也采用类似的测量方式,不过是以处理一个文档需要多长时间来计算的。

Scenarios场景
想象一下,你有一个实时工作的系统,比如一个Web服务器。这个系统需要实时的接收客户发来的订单,并需要立即对这个订单进行响应。

这个系统显然不能用批量处理的方式进行。简单的估计一下,假设这是个很简单的订单,只有十个项目,这样所生成的XML文档就比较小,大概每个文档是4KB。这种情况下,使用DOM来解析收到文档。

如果你的订单每小时只有几个,那么系统性能对你来说还不是问题。但是长远考虑,总有一天订单的数量会多到令你意识到系统性能必须提高。

现在你开始考虑提高性能来适应增长的负荷。你的订单文档已经很小了,把它们合并成较大的文档也没有什么实际的意义。从纵向考虑,这时候你可以提高现有系统处理能力;从横向考虑,你可以增加更多的系统将负荷分散开。

再看看另一个完全不同的领域,你现在要处理的是一个大型的数据仓库。和Web服务器完全不同,你现在用FTP来传输平均大小为300MB的XML文档。如果还是使用DOM来解析XML文档,你很快就会遇到大麻烦。相反,如果你使用SAX就会好的多,它可以直接解析流入的XML文档,而不必把它们事先都装入内存。

改变文档尺寸
有时候你会遇到特殊情况需要改变XML文档大小。想象一下,和刚才一样你有一个实时处理XML文档的Web服务器,而此时所有的文档大小都是400MB而不是4KB,你不能使用DOM方式,因为那太占内存了。可是因为这是个实时系统,性能很重要。你可以使用SAX,不过需要时间允许并要有强大的处理器。

在这种情况下,你可以通过改变文档大小来改进系统执行性能。比如你可以将一个400MB的文档分成10个40MB的,或者40个10MB的小文档,这比起处理一个400MB的文档更有效率。这样你就可以使用DOM方式把文件读入内存进行处理,及时响应每个文档的请求了。同时还可以清除掉不相关的文档。

在批量处理方式上也有类似情况。想象一下你在通过DOM的批处理方式处理数千个4KB大小的文档。最好的方式是将一千个文件合并成一个4MB的文件。因为每个文档的载入都需要占用系统时间(不论是DOM还是SAX)。通过将一千个文档合并成一个,你只需要载入一个文档,占用的时间只是原来的千分之一。

时间: 2024-09-13 22:00:36

如何得到XML文档大小的相关文章

得到XML文档大小的方法_WML教程

XML文档从格式到大小都是不是确定的.有的可能只有几行,而有的却有好几兆字节.你也许会怀疑是不是需要了解XML文档的大小.而当性能成为首要问题时,知道XML文档大小就是件必须要作的事情了. 从性能角度讲,有两类处理XML文档的方法.批量处理方式需要较短的时间,解析成组的文档.实时方式就是实时的处理文档.批处理方式的性能可以通过在一定时间内处理多少文档来测量,而实时模式的性能也采用类似的测量方式,不过是以处理一个文档需要多长时间来计算的. Scenarios场景 想象一下,你有一个实时工作的系统,

如何得到XML文档大小_XML/RSS

XML文档从格式到大小都是不是确定的.有的可能只有几行,而有的却有好几兆字节.你也许会怀疑是不是需要了解XML文档的大小.而当性能成为首要问题时,知道XML文档大小就是件必须要作的事情了.  从性能角度讲,有两类处理XML文档的方法.批量处理方式需要较短的时间,解析成组的文档.实时方式就是实时的处理文档.批处理方式的性能可以通过在一定时间内处理多少文档来测量,而实时模式的性能也采用类似的测量方式,不过是以处理一个文档需要多长时间来计算的. Scenarios场景想象一下,你有一个实时工作的系统,

如何得到XML文档文件的大小

        XML文档从格式到大小都是不是确定的.有的可能只有几行,而有的却有好几兆字节.你也许会怀疑是不是需要了解XML文档的大小.而当性能成为首要问题时,知道XML文档大小就是件必须要作的事情了.         从性能角度讲,有两类处理XML文档的方法.批量处理方式需要较短的时间,解析成组的文档.实时方式就是实时的处理文档.批处理方式的性能可以通过在一定时间内处理多少文档来测量,而实时模式的性能也采用类似的测量方式,不过是以处理一个文档需要多长时间来计算的. Scenarios场景 想

高效交换XML文档

xml XML文档因为其固有的描述性特性而趋向于变得很罗嗦.其结果是文档会由于被描述的数据增多而变得很长,而这种很大的文档会在需要同其他实体进行交换时出现问题.和其他文档(比如普通文本文件(flat file)或者Electronic Data Interchange (EDI))比起来XML文档就显得特别冗长.为了举例说明这个概念,让我们看看以下这个普通文本文件: John,Doe,1587,4/18/2000,1234 Anywhere St.,SomeCity,AZ,85222 再看这个X

研究 Java 中 XML 文档模型的特性和性能

xml|性能 Java 中的 XML: 文档模型,第一部分:性能 研究 Java 中 XML 文档模型的特性和性能 文档选项 将此页作为电子邮件发送 最新推荐 Java 应用开发源动力 - 下载免费软件,快速启动开发 级别: 初级 Dennis M. Sosnoski, 总裁, Sosnoski Software Solutions, Inc. 2001 年 9 月 01 日 在本文中,Java 顾问 Dennis Sosnoski 比较几个 Java 文档模型的性能和功能.当选择模型时,无法做

Flash处理外部XML文档数据

xml|数据 准备: 首先你得有台电脑.其次是要装上Windows系统和Flash8. XML基础: 既然是处理XML文档.就要先来了解下XML文档.下面是我所了解的,有些是在Flash中用不到的.XML扩展标记语言(Extensible Markup Language)是SGML(Structured Generalized Markup Language)的子集.XML是由World Wide Web Consortium(W3C)的XML工作组定义的. 下面开始了解XML的结构: XML是

Flash处理XML文档数据教程

xml|教程|数据 准备:首先你得有台电脑,其次是要装上Windows系统和Flash8. XML基础: 既然是处理XML文档,就要先来了解下XML文档.下面是我所了解的,有些是在Flash中用不到的. XML扩展标记语言(Extensible Markup Language)是SGML(Structured Generalized Markup Language)的子集,由World Wide Web Consortium(W3C)的XML工作组定义. 下面开始了解XML的结构.XML是由序言

在.NET里更好的创建XML文档

xml|创建 在.NET里更好的创建XML文档 作者: BUILDER.COM 创建XML文档不是一件特别困难的事,但是却是很让人乏味的,尤其是在你必须总是创建类型相似的文档的时候.使用代码来处理这些重复性的任务是行得通的.但是利用机器自动编程来创建XML文档到底有多难或者有多容易?这取决于你所使用的方法. 编写标示语言是令人乏味的任务  对于这个问题过于简单化的回答是:创建XML文档和创建文本文档是一样简单的.毕竟,XML文档只是一个文本文档.但是一个更加现实的回答是:编写标示语言可能会是令人

掌握XML系列(4)---创建格式良好的XML文档

这一节,我们讲解有关属性的问题. XML的属性: 其实大家都知道,其实属性就"名值对",再HTML中,我们看见过很多.之前的文章中也用过了一些属性的例子.来看个例子吧: <?xml version="1.0" ?> <persons> <person name="xiaoyang"/> <person name="panyan"/> </persons> 关于属性的问