《中国人工智能学会通讯》——12.50 知识图谱研究综述

12.50 知识图谱研究综述

知识图谱(Knowledge Graph, KG)旨在描述客观世界的概念、实体、事件及其之间的关系。其中,概念是指人们在认识世界过程中形成对客观事物的概念化表示,如人、动物、组织机构等;实体是客观世界中具体事物,如篮球运动员姚明、互联网公司腾讯等;事件是客观世界的活动,如地震、买卖行为等。关系描述概念、实体、事件之间客观存在的关联关系,如毕业院校描述了一个人与他学习所在学校之间的关系,运动员和篮球运动员之间的关系是概念和子概念之间的关系等。谷歌于 2012 年 5月推出谷歌知识图谱,并在其搜索引擎中增强搜索结果,标志着大规模知识在互联网语义搜索中的成功应用。

知识图谱将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答、大数据分析与决策中显示出强大威力,已经成为互联网基于知识的智能服务的基础设施。知识图谱与大数据和深度学习一起,成为推动人工智能发展的核心驱动力之一。

知识图谱技术是指在建立知识图谱中使用的技术,是融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义 Web、数据挖掘与机器学习等交叉研究。知识图谱研究,一方面探索从互联网语言资源中获取知识的理论和方法;另一方面促进知识驱动的语言理解研究。随着大数据时代的到来,研究从大数据中挖掘隐含的知识理论与方法,将大数据转化为知识,增强对互联网资源的内容理解,将促进当代信息处理技术从信息服务向知识服务转变。具体地,知识图谱技术包括知识表示、知识图谱构建和知识图谱应用三方面的研究内容。

● 知识表示研究客观世界知识的建模,以便于机器识别和理解,既要考虑知识的表示与存储,又要考虑知识的使用和计算。

● 知识图谱构建解决如何建立计算机算法,从客观世界或者互联网的各种数据资源中获取客观世界的知识,主要研究使用什么样的数据和什么样的方法抽取什么样的知识。

● 知识图谱应用主要研究如何利用知识图谱,建立基于知识的系统并提供智能的知识服务,更好地解决实际应用问题。

下面,我们首先归类总结目前已有的一些知识图谱资源,然后逐一介绍上述三个方面的研究思路和进展。

时间: 2024-08-17 16:38:04

《中国人工智能学会通讯》——12.50 知识图谱研究综述的相关文章

中国人工智能学会通讯——NLP与知识图谱的对接

两个问题 第一个问题是,为什么有人说"中文知 识图谱"?难道知识图谱是有国籍的吗?知 识是无国界的,这个当然是理论上的说法. 具体到一个国度,一个语言文化的大环境, 我们就会发现,事实上知识是有母语的. 理论依据就是所谓的语言相对论.可能大 家最近都看了<降临>,<降临>讲的就 是语言相对论.其要点为:一种思维方式. 一种文化是被它的语言.它所操的母语所 塑造.这是一个很重要的论断,也正因为它, 在英语世界里搞得非常好的一些技术,到 汉语的世界来,就有可能水土不

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.2 知识图谱构建

1.2 知识图谱构建 知识图谱由实体.实体的属性描述以及实体和实体之间的关联构成.尽管其对于大数据人工智能的实现意义非凡,但其构造过程却极为困难.在早期,知识图谱构建单纯依赖于人类专家.在这一方法中,知识图谱中的实体.实体属性与实体关联关系完全由专家人工构造,此类知识图谱包括WordNet[2].CyC[3]等.WordNet定义了词汇之间的特定语义关系,包含约15万个词汇.20万个词汇语义对:CyC 包含了320万条人工定义的断言,涉及30万个概念.1.5万个谓词.随着互联网兴起,虽然依靠专家

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.3 KS-Studio 知识计算引擎

1.3 KS-Studio 知识计算引擎 2012年,中国工程院启动建设"中国工程科技知识中心(CKCEST)"项目1.该项目是我国工程科技领域重要的大数据项目,旨在打通和汇聚各类工程科技数据资源,通过技术分析处理形成知识库,并开发各种应用提供知识服务,推动国家工程科技战略思想库的建设,服务于国家的战略决策. 从数据的性质看,建设知识中心所需的知识是高度结构化的,而分散在各工程科技领域的数据资源绝大部分属于非结构化数据.如何将无序繁杂的文本.图像.视频等原始的非结构化数据加工转化为有序

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.4 结束语

1.4 结束语 下一代人工智能(AI 2.0)将改变计算本身,将大数据转变为知识以支持人类社会作出更好决策[19].目前KS-Studio正在以知识图谱的自动构建为基础,不断丰富对于非结构化数据的知识加工处理的能力,并在不断探索将数据驱动方法与人类常识先验与隐式直觉有效结合起来的可能,我们认为只有如此才能实现可解释.更鲁棒和更通用的人工智能.

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.1 背景

1.1 背景 人工智能正再次成为国际国内学术界和产业界关注的热点,深度学习.迁移学习和增强学习等方法在诸多领域得到了成功应用.图灵早期对获得机器智能进行了一些设想[1],即通过添加遗传物质,辅以变异.进化.教育与自然选择等手段来使得"the child machine"成熟,并进一步去模仿成人的思维,这一设想至今仍具借鉴意义.与孩童成长类似,这个"child machine"首先需要对语言.文字.图像等非结构化数据所蕴含的(常识性)概念进行理解,来感知外界环境,这是

《中国人工智能学会通讯》——1.3 若干研究结果

1.3 若干研究结果 本课题组从 2004 年开始了对问答系统的研究,对于各种细分的问答系统都有所涉及.这也是随着时代的发展以及我们对于问答系统的理解不断加深而产生 的变化. 1.基于搜索引擎的事实性开放域问答系统 QUANTA 2005 年前后的搜索引擎是基于关键词的,网页链接作为信息获取的输出,用户并不能直接获取答案(搜索引擎更新换代的进步与问答理念与技术息息相关).从智能信息获取的角度出发,我们最初的愿景是给用户一个确切答案,不需要用户自己去选择链接,点击进入相关页面再寻找答案.选择自然语

《中国人工智能学会通讯》——11.32 国内外研究现状

11.32 国内外研究现状 迁移学习最初是在 1995 年举行的 NIPS 神经信息处理系统进展大会"Learning to Learn"研讨会上由卡耐基梅隆大学 Tom Mitchell 等人提出,并迅速发展起终身学习.归纳迁移等多个学习范式,其中发展最快的是多任务学习[6] ,已成为具有严格理论保证的迁移学习方向.随着迁移学习研究的进展,2005 年美国国防部国防高等计划研究署(DARPA)赋予了迁移学习新的研究使命:学习系统应具备将过去任务学习的知识和技能应用于新任务的能力.此后

《中国人工智能学会通讯》——2.9 国内外研究现状

2.9 国内外研究现状 腿式机器人的研制 从上世纪 50 年代开始,各国科学家开始致力于腿式机器人的研究,希望在借鉴腿式动物的骨骼结构.肌腱驱动.运动特点和控制模式等基础上,研制出运动能力强.环境适应性好和能量效率高的腿式仿生机器人. 在双足机器人研究领域,目前最具代表性的双足机器人主要集中在日本和美国.日本本田公司2000 年发布了双足机器人 ASIMO [1] ,其最新版本身高 130 cm,体重 48 kg,最高运动速度 9 km/h,可以步行.奔跑.跳跃,甚至上下楼梯和微不平整地面行走,

中国人工智能学会通讯——弱监督机器学习的研究进展 1.3 日本理化研究所先进智能研究中心

1.3 日本理化研究所先进智能研究中心 最后介绍一下我所在的研究所--日本理化研究所先进智能研究中心,也就是AIP.我们所关注的更多是先进的.智能的研究项目.2016年时就成立了这个研究中心,我们有5个任务,分别是开发下一代的AI技术.加速科学研究.把AI用于决策日本的社会重大的问题,以及研究AI道德.法律和社会问题的问题,还有希望解决人力资源发展. 研究中心有三大集团,我们只关注基础的研究,所有的应用都是和合作伙伴付诸实施.目前我们目标的导向型技术研究集团,让更多的技术人员和产业量化人员在这边