《语义网基础教程(原书第3版)》—— 2.1 引言

2.1 引言

万维网的成功展现了使用标准化的信息交换和通信机制的力量。HTML是编辑网页的标准语言。它允许任何人发布一个文档并且相信该文档可以被任何万维网浏览器正确呈现。
HTML和其他交换语言都拥有以下3个组成元素:语法、数据模型和语义。语法告诉我们如何撰写数据。数据模型告诉我们数据的结构或组织形式。语义告诉我们如何解释数据。我们可以通过下面的HTML片段展现上述每个组成元素:

HTML的语法是用尖括号撰写的带标签文本(例如

)。HTML的数据模型称为文档对象模型(Document Object Model),将由标签定义的元素组织成一个层次树状结构。例如,应该在之前,而元素应该包含在

  1. 元素内。最后,HTML的语义告诉我们浏览器应该如何解释网页。例如,浏览器应该将网页体的内容呈现在浏览器窗口中,同时
    1. 元素应该呈现为一个有序列表。语法、数据模型和语义都在HTML标准中定义。
      HTML用于传递有关面向人类的文档结构的信息。而对于语义网,我们的需求更加丰富。我们需要一个能够被各种应用使用的数据模型,不仅为人类描述文档,而且为特定应用描述信息。这个数据模型需要是领域无关(domain independent)的,因此从房地产到社交网络的应用都可以使用它。除了一个灵活的数据模型之外,我们还需要一种机制来将语义赋予使用这个数据模型表达的信息。它应该允许用户描述一个应用该如何在一个社交网络描述中解释“朋友”,以及如何在一个地理信息描述中解释“城市”。最终,和HTML类似,我们需要将所有这些信息写下来,即语法。
      RDF(资源描述框架)恰好提供了这样一个灵活并且领域无关的数据模型。它的基础构件是一个实体–属性(attribute)–取值的三元组,称为声明(statement)。例如,我们可以使用这个模型来表达“The Baron Way Apartment is an Apartment”、“The Baron Way Apartment is part of The Baron Way Building”以及“The Baron Way Building is located in Amsterdam”。因为RDF不针对任何领域及使用,对用户而言必须定义他们在这些声明中使用的术语。为此,需要利用RDF模式(RDFS)。RDFS允许用户精确地定义它们的词汇表(vocabulary,即它们的术语)应该如何解释。
      综合起来,这些技术定义了在不同机器间交换任意数据的一种标准化语言的组成部分:
      RDF—数据模型
      RDFS—语义
      Turtle / RDFa / RDF-XML—语法
      尽管RDF主要是指数据模型,它也经常被用来作为上述所有的总称(本书中也会这样使用)。
      本章概述
时间: 2024-09-09 01:55:50

《语义网基础教程(原书第3版)》—— 2.1 引言的相关文章

《语义网基础教程(原书第3版)》—— 导读

前 言 与传统观念不同的是,信息系统作为量身定做的.成本密集型的数据库应用的时光一去不复返了.这种变化一部分是受到逐渐成熟的软件产业的推动(软件产业大量使用了现成的通用组件和标准的软件解决方案),而另一部分则是由于信息革命的冲击.反过来,这种改变导致了对信息服务的一系列全新需求,即要求其表示模式与交互模式的统一性.软件体系结构的开放性以及使用范围的全局性.这些需求主要来自诸如电子商务.银行业.制造业(包括软件产业本身).培训.教育和环境管理等领域,恕不一一列举. 未来的信息系统必须支持与各种运行

《语义网基础教程(原书第3版)》—— 1.1 引言

1.1 引言 1.1.1 语义网的动机 "语义网"的主要愿景可以概括为一句话:使计算机更能解读万维网(to make the web more accessible to computers).当前万维网是一个文字和图片网络,这些媒体对人而言很有用,但是计算机在目前的万维网上只发挥了非常有限的作用:它们索引关键词,将信息从服务器端传输到客户端,仅此而已.所有的智能工作(选择.组合.聚集等)必须通过人类读者来完成.如果我们能够使得万维网更适合机器处理,使得万维网上充满机器可读取.&quo

《语义网基础教程(原书第3版)》—— 第1章 语义网的愿景

第1章 语义网的愿景 1.1 引言 1.1.1 语义网的动机 "语义网"的主要愿景可以概括为一句话:使计算机更能解读万维网(to make the web more accessible to computers).当前万维网是一个文字和图片网络,这些媒体对人而言很有用,但是计算机在目前的万维网上只发挥了非常有限的作用:它们索引关键词,将信息从服务器端传输到客户端,仅此而已.所有的智能工作(选择.组合.聚集等)必须通过人类读者来完成.如果我们能够使得万维网更适合机器处理,使得万维网上充

《语义网基础教程(原书第3版)》—— 1.2 语义网技术

1.2 语义网技术 1.2.1 显式元数据 当前,万维网上内容的格式更适合人类读者而非计算机程序.HTML是(直接或借助工具)撰写网页的主流语言.一个理疗师的典型网页的一部分可能如下所示: 对人们而言,这些信息以一个令人满意的方式表达,但是对机器而言则存在问题.基于关键词的搜索会识别physiotherapy和consultation hours等词.并且一个智能agent甚至能够识别该中心的全体人员.但是,区分治疗师和秘书则会存在困难,查找准确的咨询时间还会碰到更大的困难(因为不得不沿着Sta

《语义网基础教程(原书第3版)》—— 第3章 查询语义网

第3章 查询语义网 在上一章中,我们学会了如何使用RDF来表示知识.当信息被表示为RDF后,出于推理和应用开发的需要,我们需要能够存取其中相关的部分.在本章中,我们将把注意力集中于一个叫做SPARQL的查询语言,它能够让我们通过选择.抽取等方式很容易地从被表示为RDF的知识中获得特定的部分.SPARQL是专为RDF设计的,适合并依赖于万维网上的各种技术.如果你熟悉诸如SQL等数据库查询语言,你会发现SPARQL和它们有很多相似之处.即便你不熟悉-本章也不假设你已熟悉,本章将为你从头开始学习提供一

《语义网基础教程(原书第3版)》—— 第2章 描述万维网资源:RDF

第2章 描述万维网资源:RDF 2.1 引言 万维网的成功展现了使用标准化的信息交换和通信机制的力量.HTML是编辑网页的标准语言.它允许任何人发布一个文档并且相信该文档可以被任何万维网浏览器正确呈现.HTML和其他交换语言都拥有以下3个组成元素:语法.数据模型和语义.语法告诉我们如何撰写数据.数据模型告诉我们数据的结构或组织形式.语义告诉我们如何解释数据.我们可以通过下面的HTML片段展现上述每个组成元素: HTML的语法是用尖括号撰写的带标签文本(例如 ).HTML的数据模型称为文档对象模型

《语义网基础教程(原书第3版)》—— 1.4 本书内容安排

1.4 本书内容安排 在这本书中,我们关注的是已经达到一个合理成熟度的语义网技术. 第2章讨论RDF和RDF模式.RDF是一种用于表达有关对象(资源)的声明的语言:它是一个标准的数据模型以提供机器可处理的语义.RDF模式提供了一组用于将RDF词汇表组织成带类型的层次结构的建模原语. 第3章致力于介绍SPARQL查询语言,它在RDF领域中起到的作用与SQL在关系领域中的作用相同. 第4章讨论OWL2,它是万维网本体语言OWL的最新修订版.OWL2提供了比RDF模式更多的建模原语,并且它拥有清晰的.

《语义网基础教程(原书第3版)》—— 1.5 小结

1.5 小结 语义网是一场旨在改进当前万维网状况的运动. 其核心思想是机器可处理的万维网信息的使用. 其核心技术包括发布带有显式元数据的数据.本体.逻辑和推理. 语义网的开发是分层次进行的.

《语义网基础教程(原书第3版)》—— 1.3 一种分层方法

1.3 一种分层方法 语义网的发展按步骤进行,每步都在一个层次之上建立另一个层次.这个方法的实用性论证是它更容易在小的步骤上达成一致,也就是说,如果有太多的目标,则很难让参与的每个人都同意.通常许多研究组研究不同的方向,思想的竞争是科学进步的主要驱动力.但是,从工程的角度则需要标准化.因此,如果绝大多数研究人员同意某些事情而反对另一些,稳固这些共识则是有意义的.这样,即使一些更有野心的研究成果会失败,但是至少有部分正面的结果.一旦一个标准被确立,许多组织和公司将采用它而不是等待着观察最终是否有可