《中国人工智能学会通讯》——6.10 链接数据实践

6.10 链接数据实践

从语义网的理想被提出起,人们就不断尝试各种建立数据之间链接的技术和方法。比较典型的如LOD(Linked Open Data Project) [17] 、Schema.org [18] 、WikiData [19] 等。

LOD
LOD 的初衷是为了实现 Tim Berners-Lee 在2006 年发表的有关链接数据(Linked Data)作为语义网的一种实现的设想[20] 。LOD 遵循了 Tim 提出的进行数据链接的四个规则,即:
(1)使用 URI 标识万物;
(2)使用 HTTP URI,以便用户可以(像访问网页一样)查看事物的描述;
(3)使用 RDF 和 SPARQL 标准;
(4)为事物添加与其他事物的 URI 链接,建立数据关联。

截止 2014 年的统计数据,LOD 已经包含了1 014 个数据集[17] 。其中社交媒体、政府、出版和生命科学四个领域的数据占比超过 90%。56% 的数据集对外至少与一个数据集建立了链接。被链接最多的是 dbpedia 的数据。比较常用的链接类型 包 括 foaf:knows、sioc:follows、owl:sameAs、rdfs:seeAlso、dct:spatial、skos:exactMatch 等。LOD 鼓励各个数据集使用公共的开放词汇和术语,但也允许使用各自的私有词汇和术语。在使用的术语中,有 41% 是公共的开放术语。

Schema.org
Schema.org 有 更 为 清 晰 的 商 业 模 式。Schema.org 是 2011 年 由 Bing、Google、Yahoo和 Yandex 等搜索引擎公司共同创建。与 LOD 不同,Schema.org 要求使用一组简单但统一的词汇集。链接数据以语义标签(Semantic Markup)的形式被嵌入到网页或电子邮件中。语义标签能帮助搜索引擎更加自动地抽取和归集语义化数据,帮助搜索引擎理解网页内容,并优化搜索结果。

Schema.org 由一套类集合和一套关系集合组成。目前,类集合已包含 642 个类型,并有类似于本体概念那样的继承结构。关系集合包含 992 个关系属性。词汇表覆盖范围包括个人、组织机构、地点、时间、医疗、商品等。

谷歌于 2015 年推出的定制化知识图谱[12]采用了 Schema.org 的做法,允许个人和企业在其网页中增加包括 Logo、企业联系方法和个人社交信息等在内的语义标签。 截止 2016 年,谷歌的一份统计数据显示,超过 31% 的网页和 1 200 万的网站已经使用了 Schema.org 的语义标签发布语义化的链接数据[19] 。其他采用了部分 Schema.org 功能的还包括微软Cortana、Yandex、Pinterest、苹果的Siri等[18] 。

Wikidata
WikiData 由维基百科于 2012 年启动。早期得到微软联合创始人 Paul Allen、Gordon BettyMoore 基金会以及 Google 的资助。WikiData 的目标是构建一个免费开放、任何人或机器都可以编辑修改的链接数据库[19] 。与 LOD 和 Schema.org 都不相同,WikiData 采用集中存储、众包协作的方式构建链接数据。

WikiData 由条目组成,仍然以三元组为最基本的数据模型。任何人或机器可以为条目增加属性描述。截止目前,WikiData 已经包含超过 1 750 多万个条目。谷歌于 2016 年 5 月正式关闭了 Freebase的服务,并将 Freebase 原有的数据和服务迁移至WikiData。

时间: 2024-08-28 11:47:18

《中国人工智能学会通讯》——6.10 链接数据实践的相关文章

《中国人工智能学会通讯》——10.19 安全挑战

10.19 安全挑战 通过上节对当前复杂网络化系统安全控制研究现状的综述,可以发现大量的工作还处于探索阶段,并不能系统地解决复杂网络化系统安全问题.究其原因,主要有来自复杂网络化系统自身和网络攻击两方面的挑战. 1 . 复杂网络化系统自身特点带来的安全挑战在深度融合通信与计算技术的背景下,复杂网络化系统既有传统工业系统控制特点,也有计算和通信技术带来的新特点,其安全控制和防御必然面临更多的挑战与困难,主要包括: • 复杂网络化系统外部边界模糊--向互联网全面开放,3C 各层面.各层次.各环节均可

《中国人工智能学会通讯》——10.18 研究进展

10.18 研究进展 本节将就复杂网络化系统安全控制研究的最新进展展开综述,主要涉及系统的安全架构分析与建模.攻击检测与安全评估,以及安全控制等诸方面.通过综述,将对国内外相关领域的主要工作分别进行总结,并分析存在的不足. 1 . 系统架构分析与建模 围绕复杂网络化系统的构架分析与建模,国内外学者开展了一系列研究工作.一方面,主要侧重于通信网络与物理系统在统一描述框架下的时空分析.实时性与稳定性等.例如文献 [11-20] 分别考虑网络通信因素(包括数据传输时滞.丢包.数据量化.干扰.带宽受限等

《中国人工智能学会通讯》——10.17 复杂网络化系统安全控制研究综述

10.17 复杂网络化系统安全控制研究综述 复杂网络化系统是传统工业控制系统向互联网开放过程中与先进通信和计算技术相结合的产物.基于各类网络通信技术,复杂网络化系统能巧妙地将在物理层面上独立分布的控制和计算单元在信息层面上紧密融合,从而在不受地域和环境限制的情况下对大规模的信息进行收集和处理,为系统最终的控制决策提供支撑.典型的复杂网络化系统包括智能电网.智慧医疗和智慧交通系统等,它们往往工作在国民经济的关键领域,为国家现代化工业生产和人民生活的顺利进行提供保证[1-2] .图 1 给出了一个以

《中国人工智能学会通讯》——10.29 实验结果

10.29 实验结果 我 们 在 Multi-PIE 数 据 集[7] .SurveillanceCameras 人脸数据集[8] .Multiple Biometric GrandChallenge 数据集[9]以及 Chock Point 数据集[10]上做了大量的实验来验证我们方法的适用性.我们使用了免费公开的基于主动形状模型(ASM)的 C++软件库.STASM [26] ,自动地去检测特征点位置 ; 然后手动纠正那些不正确的位置.注意,所检测到的位置只在训练过程中才需要.在测试过程中,

《中国人工智能学会通讯》——10.20 潜在研究方向

10.20 潜在研究方向 根据第 3 节的分析可知,阻碍复杂网络化系统安全控制研究进一步突破的障碍主要来自于复杂网络化系统自身的问题和网络攻击建模的困难性.基于此,将来的研究重点将会围绕如何解决这些挑战性问题展开,可能的研究方向包括: (1)在系统架构分析与建模方面:需要在综合考虑计算.通信与控制多时空关联的情况下对复杂网络化系统进行建模并分析其安全约束. (2)在攻击检测方面:需考虑复杂网络化系统自身的特征,包括边界模糊.设备异构,以及计算.通信与控制 3C 耦合等,同时考虑网络攻击建模难的问

《中国人工智能学会通讯》——10.23 能源互联网中的关键技术

10.23 能源互联网中的关键技术 现阶段可再生能源供应有很强的随机性.间断性和模糊性,成功并入电网并用其他形式高效利用存在很多技术上的难题:其次,对于能源互联网的建立,不仅要解决能源的高成本传输,以及能量输送损耗问题,还要对于能源互联网中产生的大数据进行实时处理,来预测和监控用户的需求变化,以及极端不稳定的能量生产供应变化.要解决上述问题并实现具体功能,能源互联网需要相应的技术体支撑.笔者认为,能源互联网的关键技术可以分为四个子技术,即体系架构技术.能源技术.信息通信技术和安全技术. 体系架构

《中国人工智能学会通讯》——10.22 能源互联网时代

10.22 能源互联网时代 根据美国能源信息管理局(EIA)最新公布的数据,截止到 2015 年 7 月,美国的当年能量消耗达到 57.782 万亿 BTU,其中化石燃料的消耗量为47.109 万亿 BTU,占总数的 81.529%.自第二次工业革命到现在,由于能源消费结构对化石燃料的依赖,产生了两个主要问题:① 能源短缺可能会成为一个重大危机:② 由于温室气体的排放,如从化石燃料燃烧的二氧化碳,全球变暖将持续恶化.应对这些日益严重的问题,如何更好地利用可再生能源显得迫切重要.目前,可再生能源的

《中国人工智能学会通讯》——10.24 结束语

10.24 结束语 多种智能终端和广泛存在的互联网使得信息的获取和共享变得更加自由,能源互联网是未来能源网络的愿景,是能量流和信息流深度融合的新兴能源网络结构,是解决大量分布式可再生能源接入和实现能量管控的有效解决方案.能源互联网通过整合运行数据.天气数据.电网数据.电力市场数据等,进行大数据分析.负荷预测.发电预测和机器学习,打通并优化能源生产和能源消费端的运行效率,随时动态调整能量的供需平衡[15] .笔者认为,未来的能源互联网的研究值得关注的动向将有以下四个方面. ● 能源互联网是一种新型

《中国人工智能学会通讯》——10.15 系统实施

10.15 系统实施 所实施的"智能电网监测终端无线供电装置"WPT 系统如图 7 所示,主要分为高压取电部分.高频逆变部分.耦合谐振部分和整流稳压及负载部分 5 个部分. 工作性能如表 2 所示,能够在线路负荷电流 200 A 时为低压侧设备提供不少于 20 W 的电能. 图 7 中,高压取电装置从模拟大电流线路中获得工频交流电能,其额定输出功率为 200 A/100 W.高压取电装置输出的工频交流电能经过整流稳压处理后以 48 V 的直流电能为高频逆变部分供电. 高频逆变部分如图

《中国人工智能学会通讯》——10.4 智慧微能源网(群)能量管理

10.4 智慧微能源网(群)能量管理 智能微电网能量管理的主要目标为实现多指标自趋优运行[1] .智能微电网能量管理主要采用分层控制体系[10-11] ,分层控制可以实现传统智能电网分散控制和集中控制之间的有效折衷.智能微电网(群)能量管理可为智慧微能源网(群)的能量管理提供技术支撑[26] . 智慧微能源网的核心环节也是能量路由器,微能源网的智慧运行依赖于能量路由器的高效能量管理.智慧微能源网亦可采用分层控制架构,第一层实现多能源生产单元及输出产品的控制:第二层实现能量路由器的控制:第三层实现