《中国人工智能学会通讯》——6.14 知识图谱中的推理技术

6.14 知识图谱中的推理技术

知识图谱的概念由谷歌 2012 年正式提出,旨在实现更智能的搜索引擎。知识图谱本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体(entity)或者概念(concept),而图的边代表实体 / 概念之间的各种语义关系,比如说两个实体之间的相似关系。谷歌知识图谱很重要的一部分是一个大规模的协同合作的知识库,叫 Freebase。Freebase 采用的数据结构是图模型,即可以把一个 Freebase 的知识库看成是有向图,这种数据模型相对于传统数据库的优势在于可以处理更复杂的数据以及方便数据的插入。谷歌知识图谱的模式(Schema)是由谷歌自己的专业团队在 Freebase的基础上开发和设计的。谷歌知识图谱中,所有的对象都有属于它的Type。Type的数量不是固定的,有一个数据结构 Collection 记录的是计算机自动抽取出的类型,Collection 中有成千上万种类型,有些今天生成后第二天就被删除了,有些则能长期的保留在 Collection 中。如果 Collection 中的某一种类型能够长期的保留,发展到一定程度后,由专业的人员进行决策、命名,最后上升为一种 Type,作为 Knowledge Graph 的一种类型保存在模式中。Knowledge Graph 的 Type 有音乐家、网球运动员等。不过谷歌的知识图谱中的模式并没有太多去考虑类型的层次性。

知识图谱的概念于 2013 年以后开始在学术界和业界普及,并在智能问答、医疗、反欺诈等应用中发挥重要作用。虽然很多文献都把知识图谱看成是一个实体 - 关系的有向图。但是也有一些观点认为知识图谱应该包含更抽象的概念之间的关系,比如说,谷歌和必应、雅虎一起推出了 Schema.org 1来提供一个覆盖广泛主题(包括人物、地点、事件等)的模式(schema)。随着知识图谱研究的深入,研究人员发现知识图谱在应用中存在以下质量问题:第一个问题是知识图谱的不完备性,即知识图谱中有些关系会缺失;第二个问题是知识图谱中存在错误的关系,这是因为知识图谱的构建一般需要用到统计方法,而统计方法很难保证学习的知识是绝对正确的。这两个问题对于智能问答等应用来说是很严重的,前者会导致提出的问题没有答案,而后者会导致系统给出的答案是错误的。为了解决这两个问题,就要求对知识图谱的推理进行研究。知识库推理可以粗略地分为基于符号的推理和基于统计的推理。在人工智能的研究中,基于符号的推理一般是基于经典逻辑(一阶谓词逻辑或者命题逻辑)或者经典逻辑的变异(比如说缺省逻辑)。基于符号的推理可以从一个已有的知识图谱推理出新的实体间关系,从而有助于解决第一个问题;而且基于符号的推理可以对知识图谱进行逻辑的冲突检测,从而有助于解决第二个问题。基于统计的方法一般指关系机器学习方法,通过统计规律从知识图谱中学习到新的实体间关系,从而处理第一个问题;并且对新学到的关系进行评分,去掉那些可能错误的关系,从而处理第二个问题。下面分别就这两类方法进行介绍。

时间: 2025-01-19 16:52:30

《中国人工智能学会通讯》——6.14 知识图谱中的推理技术的相关文章

中国人工智能学会通讯——NLP与知识图谱的对接

两个问题 第一个问题是,为什么有人说"中文知 识图谱"?难道知识图谱是有国籍的吗?知 识是无国界的,这个当然是理论上的说法. 具体到一个国度,一个语言文化的大环境, 我们就会发现,事实上知识是有母语的. 理论依据就是所谓的语言相对论.可能大 家最近都看了<降临>,<降临>讲的就 是语言相对论.其要点为:一种思维方式. 一种文化是被它的语言.它所操的母语所 塑造.这是一个很重要的论断,也正因为它, 在英语世界里搞得非常好的一些技术,到 汉语的世界来,就有可能水土不

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.2 知识图谱构建

1.2 知识图谱构建 知识图谱由实体.实体的属性描述以及实体和实体之间的关联构成.尽管其对于大数据人工智能的实现意义非凡,但其构造过程却极为困难.在早期,知识图谱构建单纯依赖于人类专家.在这一方法中,知识图谱中的实体.实体属性与实体关联关系完全由专家人工构造,此类知识图谱包括WordNet[2].CyC[3]等.WordNet定义了词汇之间的特定语义关系,包含约15万个词汇.20万个词汇语义对:CyC 包含了320万条人工定义的断言,涉及30万个概念.1.5万个谓词.随着互联网兴起,虽然依靠专家

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.3 KS-Studio 知识计算引擎

1.3 KS-Studio 知识计算引擎 2012年,中国工程院启动建设"中国工程科技知识中心(CKCEST)"项目1.该项目是我国工程科技领域重要的大数据项目,旨在打通和汇聚各类工程科技数据资源,通过技术分析处理形成知识库,并开发各种应用提供知识服务,推动国家工程科技战略思想库的建设,服务于国家的战略决策. 从数据的性质看,建设知识中心所需的知识是高度结构化的,而分散在各工程科技领域的数据资源绝大部分属于非结构化数据.如何将无序繁杂的文本.图像.视频等原始的非结构化数据加工转化为有序

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.4 结束语

1.4 结束语 下一代人工智能(AI 2.0)将改变计算本身,将大数据转变为知识以支持人类社会作出更好决策[19].目前KS-Studio正在以知识图谱的自动构建为基础,不断丰富对于非结构化数据的知识加工处理的能力,并在不断探索将数据驱动方法与人类常识先验与隐式直觉有效结合起来的可能,我们认为只有如此才能实现可解释.更鲁棒和更通用的人工智能.

中国人工智能学会通讯——KS-Studio:一个知识计算引擎 1.1 背景

1.1 背景 人工智能正再次成为国际国内学术界和产业界关注的热点,深度学习.迁移学习和增强学习等方法在诸多领域得到了成功应用.图灵早期对获得机器智能进行了一些设想[1],即通过添加遗传物质,辅以变异.进化.教育与自然选择等手段来使得"the child machine"成熟,并进一步去模仿成人的思维,这一设想至今仍具借鉴意义.与孩童成长类似,这个"child machine"首先需要对语言.文字.图像等非结构化数据所蕴含的(常识性)概念进行理解,来感知外界环境,这是

《中国人工智能学会通讯》——1.28 智能助手背后的技术

1.28 智能助手背后的技术 呈现在人们眼前的智能助手几乎都是"小而美"的,但其背后却是一个十分复杂的系统,需要多种技术的集成和联动.本文将智能助手背后的技术归为四类,分别是需求理解技术,需求满足技术,推荐引导技术,以及交互技术.接下来,将分别介绍这四大类所涵盖的具体内容. 需求理解技术 准确理解用户需求是智能助手提供服务的基本前提.对于智能助手,人们更倾向于使用自然语言句子来表达需求,而非简单的关键词,这给需求理解增大了难度.这里所说的需求理解是一系列处理技术的总称,包括基本的分词.

《中国人工智能学会通讯》——8.35 软件工程中的演化计算研究

8.35 软件工程中的演化计算研究 演化计算(Evolutionary Computation)是通过模拟生物进化过程与机制来求解问题的自组织.自适应的人工智能技术,在模式识别.机械工程.电气工程.生物学等众多领域都获得成功[1-2] .近年来,演化计算在软件工程领域也获得了广泛应用,形成了新的学科交叉方向--基于搜索的软件工程(SBSE,Search-Based SoftwareEngineering). 2001 年,Mark et al [3] 首次提出了"基于搜索的软件工程"的

《中国人工智能学会通讯》——4.6 研究现状及关键技术

4.6 研究现状及关键技术 在大部分基于路网的空间关键词查询研究中,路网以有向图的形式表示,即 G=(V,E),其中 V 表示路网中的交叉结点或者根据计算需要人为引入的结点:E 表示连接结点与结点之间的有向边.城市空间文本数据则由大量带有位置属性和文本属性的空间文本对象(Spatio-Textual Objects)组成.空间文本对象可以是物理世界中的实体对象,如商店和公共设施:也可以是各类和实体对象相关联的虚拟对象,如针对实体对象的广告和网络评论.每个空间文本对象表示为 o=(loc, t),

《中国人工智能学会通讯》——1.10 社区问答系统及相关技术

1.10 社区问答系统及相关技术 近年来,随着 Web 2.0 的飞速发展,社区问答系统(Community Question Answering, CQA)逐渐成为一种非常流行而实用的互联网应用.通过使用社区问答系统,人们不但可以发布问题进行提问以满足自己的信息需求,而且还可以回答其他用户提问的问题来分享自己的知识,此外用户还可以对系统所积累的问题答案库进行检索,以快速地满足自己的信息需求.目前,在互联网上已经出现了很多社区问答系统,根据系统所涉及的领域面的不同,可以将已有的社区问答系统分为两