XML简易教程之一_XML/RSS

在Intel的早期,Andy Grove遇到一个雇员 - 他
建议公司在芯片的基础上开发个人计算机。Andy
Grove疑问道“个人计算机能做什么呢?”,这个
雇员举例说,它可以存储处方。Grove考虑到整个
研究、开发和市场费用要数百万美圆,最终决定
以为红绿灯提供芯片作为开始。
每个人都是事后诸葛亮。Andy Grove,不管你怎样看他,被普遍
认为是一个非常聪明的人 - 能够做出发展公司的重大决定。但
是在七十年代,不可能强求他预见到个人计算机的潜力。如果
他当时见过Excel、Quark、Photoshop、Oracle或者网络,他就会
理解把强大的处理器放在桌面上会允许软件做任何事。

但是如果没亲眼见过,谁能想到呢。在用打字机、加法机和铅
笔作为计算的工具的时代,你能解释PC和它的用途吗?

这个例子可以用在解释扩展标记语言(XML - eXtensible Markup
Language)上。现在还没有和它相似的东西,所以很难做出比
较。你可能听说过XML是HTML的替代物或XML与HTML相似,可以
定义自己的标记符。这两种说法都不全对,就象说PC是存储处
方的机器一样。

我妈妈是一个训练有素的厨师,如果我用她的配方,我的家庭
会省下很大一笔钱。

我以简单的开始。因此我打开文本编辑器,开始写一些HTML
代码:

<HTML>

<H1 ALIGN=CENTER>Recipe</H1>

<FONT FACE size=2>Chocolate Chip Bars</FONT>

在写完上面几行后,我想接着写我妈妈 的精妙菜谱。那么怎么
做呢?一份老式的Web页面。接下来呢?把我的页面的URL送给
对这个菜谱感兴趣的人们,然后让他们剥掉其中的<P>和<FONT
FACE size=2>吗?这得花些时间,我想得到实际的内容。

看看下面可能的XML标记:

<author>Carol Schmidt</author>

<recipe_name>Chocolate Chip Bars</recipe_name>

在XML中,标记符可以最好地描述内容。以这种方式,我可以肯
定任何查找出现在<recipe_name>标记符中的“Chocolate Chip”
的人都可以得到妈妈_的菜谱。进一步说,如果我的信息被象这
样的标记符(有意义的标记符)包围 - 我可以告诉其它程序如
何使用它们。我还可以通过编码把<recipe_name>标记符中的内
容放入数据库的某个域中,然后把它输出到一本书的硬拷贝中。
还有,我可以用一个支持XML的字处理器使网页的出版轻而易举。

这就是XML的本质:使标记对人和机器都可读。但是在实现这个
目标之前,应该理解用XML编码所涉及的东西。

文档要组织良好
一个XML文件必须满足两点:组织良好和有效。我们以一个组
织良好的文档开始。

我发明了一些描述菜谱的标记符,并把它们组织成一种合理
和可读的方式。它可能不是最好的标记,但是在下面的例子
中工作得很好。

<?xml version="1.0"?>
<list>
<recipe>
<author>Carol Schmidt</author>
<recipe_name>Chocolate Chip Bars</recipe_name>
<meal>Dinner
<course>Dessert</course>
</meal>
<ingredients>
<item>2/3 C butter</item>
<item>2 C brown sugar</item>
<item>1 tsp vanilla</item>
<item>1 3/4 C unsifted all-purpose flour</item>
<item>1 1/2 tsp baking powder</item>
<item>1/2 tsp salt</item>
<item>3 eggs</item>
<item>1/2 C chopped nuts</item>
<item>2 cups (12-oz pkg.) semi-sweet choc. chips</item>
</ingredients>
<directions>
Preheat oven to 350 degrees. Melt butter;
combine with brown sugar and vanilla in large mixing bowl.
Set aside to cool. Combine flour, baking powder, and salt;
set aside.Add eggs to cooled sugar mixture; beat well.
Stir in reserved dryingredients, nuts, and chips.
Spread in greased 13-by-9-inch pan.
Bake for 25 to 30 minutes until goldenbrown;
cool. Cut into squares.
</directions>
</recipe>
</list>
这就是一份可以接受的XML文档 - 告诉你XML是什么:把数据
以一种有实际意义的方式进行组织。

虽然这些标记符看起来有点象HTML,但是有很大的区别:文件
中没有指出数据如何表示的信息。版面指令,当我们准备好时,
就会从其它地方出现。这和把地址簿的信息放在数据库的字段
和记录中而不是放在字处理器产生的清单中的道理一样。数据
库可以让你把地址簿中的信息合成到标签、信封、信件或其它
任何想要的载体上面。最后,就是把这份菜谱文件合成到一种
表现语言中,如HTML或CSS。

前面说过,XML文档必须组织良好。这意味着文件必须满足以下
三项基本规则:

文档以XML定义<?xml version="1.0"?>开始。
有一个包含所有其它内容的根元素,如上面例子中的<list>
和</list>标记符。
所有元素必须合理地嵌套,不允许交叉嵌套。
上面的例子中,几个<item>元素被合理地嵌套<ingredients>和
</ingredients>标记符中。但是下面的标记却有严重的问题:

<ingredients><item></ingredients>chocolate chips</item>

于是"chocolate chips"没有被包含在ingredients清单中。因此
这份文档就没有组织好。这在HTML中可能不算什么,因为浏览器
已经被设计成可以处理这种问题。

但是在XML中却是致命的 - 应用程序将拒绝处理没有组织好的
文件。

我们现在知道组织良好非常重要,但是还不止这些

 

时间: 2024-10-10 12:58:05

XML简易教程之一_XML/RSS的相关文章

XML简易教程之四_XML/RSS

实体 有五种预定义的XML实体HTML编码者应该熟悉.XML文档中的字符&.<.>."和'被分别表示为&.@lt;.>."和'. XML很大程度上扩展了实体的功能 - 允许在DTD中定义实体以便在文档的其余部分使用.例如我在XML文档中需要频繁使用词组"Wired Digital"可以在DTD中这样表示 <!ENTITY wd "Wired Digital"> 这样当我使用这个词组时可以敲入&

XML简易教程之三_XML/RSS

XML的未来 现在你已经知道XML.确实,结构有点复杂,而且DTD有各种可以定义文档可以包含的内容的选项.但还不只这些. 考虑一个数据交换对其很重要的产业,如银行.银行使用所有权系统来跟踪内部的交易,但是如果他们在Web上使用一种通用的XML格式,那么他们必须描述交易信息给另一个机构或应用程序(如Quicken或MS Money).当然,他们也可以在Web页面上表示数据.FYI:这个标记不存在.它叫做OFEX,开放金融交易格式(Open Financial Exchange). 在某种情况下,如

XML简易教程之二_XML/RSS

文档格式的排错 我妈妈_的清单中有数十条菜谱,甚至数百条.如果产生一个致命错误,排错将非常困难 - 你将一行一行地寻找丢失的标记符.如果使用几层嵌套,发现错误将很困难. 但是可以找到很好的帮助.分析器 - XML代码和报告格式错误的应用程序可以在网上免费得到.其中最好的是Lark,它的作者是由Tim Bray - XML规范的技术编辑和极力鼓吹者,地球上最聪明的人之一. 我用Lark分析下面的代码.注意"chocolate chips"和它的关闭标记符出现在</ingredien

使用XMLHTTP发送超长XML表单数据_XML/RSS

在把大量的XML作为POST数据的一部分发送给你的IIS服务器的时候--诸如在ASP表单的TEXTAREA里--你可能会得到一些没有预料到的结果.当数据在服务器上被处理的时候,由于你处理数据方式的不同,你最终可能会碰到错误.其原因是,当你把数据提交回服务器的时候,POST字段里有一个(数据)大小的限制.这样做的目的是为了防止可能的入侵者在实施拒绝服务(denial of service,DoS)的攻击中向服务器发送超大量的数据.  这一限制也束缚你的能力.但是有办法解决这个问题.如果你没被限制在

了解WEB页面工具语言XML(一)产生背景_XML/RSS

一.XML产生的背景 XML同HTML一样,都来自Standard Generalized Markup Language, 即标准通用标记语言,简称SGML.早在Web未发明之前,SGML就早已存在.正如它的名称所言,SGML是一种用标记来描述文档资料的通用语言,它包含了一系列的文档类型定义(简称DTD),DTD 中定义了标记的含义,因而 SGML 的语法是可以扩展的.SGML十分庞大,既不容易学,又不容易使用,在计算机上实现也十分困难.鉴于这些因素,Web的发明者--欧洲核子物理研究中心的研

把数据转换成XML格式的好处_XML/RSS

    我们常常会碰到需要处理以各种格式(从以逗号或者制表符做分隔符的文件到更负载的格式)保存或者传输的数据的情况,对每一种格式你都需要对应的解析器(parser).这一缺点减缓了开发进度,而且可能会导致错误的发生.一个解决方案就是把常用格式的数据转化成XML文档,然后对它进行保存.处理或者转换成其它格式. 一个实例 现在已经有好多种实现在软件内部或者软件之间进行数据保存.导出.导入以及传输功能的数据格式.最常见的是定界格式(delimited format),如逗号或者制表符分隔数据格式以及定

了解WEB页面工具语言XML(四)应用分类_XML/RSS

四.XML应用分类 总的说来的XML的应用可分为四类: (1)应用于客户需要与不同的数据源进行交互时.数据可能来自不同的数据库,他们都有各自不同的复杂格式.但客户与这些数据库间只通过一种标准语言进行交互,那就是XML.由于XML的自定义性及可扩展性,它足以表达各种类型的数据.客户收到数据后可以进行处理,也可以在不同数据库间进行传递.总之,在这类应用中,XML解决了数据的统一接口问题.但是,与其他的数据传递标准不同的是,XML并没有定义数据文件中数据出现的具体规范,而是在数据中附加tag来表达数据

了解WEB页面工具语言XML(三)支持工具_XML/RSS

三.支持XML的公司和它们的开发工具 尽管XML还处在开发阶段,其标准正在由W3C组织制定,但是已经有许多公司表示全力支持XML,并开发了不少XML工具.Adobe公司的FrameMaker可以用来书写XML文档.Microsoft公司推出的IE 4.0已经可以显示.处理和编辑XML文档,Microsoft公司作出承诺,要在下一个版本的Office 软件如MS Word.Excel中支持XML. Netscape.Sun公司也不甘寂寞,纷纷表示要在他们的Web工具中支持XML.除了这些著名的公司

一个简单的XML Schema的例子_XML/RSS

我们可以看到,DTD的语法相当复杂,并且它不符合XML文件的标准,自成一个体系.也就是说DTD文档本身并不是一个良好形式的XML文档,上面的关于DTD的介绍也仅仅是作了一个简介,目的是帮助大家能读懂DTD文件以及在必要时创建简单的DTD文件,因为现在很多的XML应用是建立在DTD之上的. 另外一个代替DTD的就是W3C定义的Schema,Schema从字面意义上来说,可以翻译成模式.大纲.计划.规划等等.它的基本意思就是说为XML文档制定一种模式. Schema相对于DTD的明显好处