《中国人工智能学会通讯》——2.23 贝叶斯规划学习

2.23 贝叶斯规划学习

BPL 算法通过学习简单的随机规划来表示概念,这些规划是由部件(见图 3A iii)、子部件(见图 3A ii)以及空间关系(见图 3A iv)组合而成的。BPL 定义了一个生成过程,它可以通过用新的方式组合部件以及子部件来采样出新的概念类型。每种新的类型也表示为一个生成模型,这个较低层次的生成模型可以产生概念的新样例(或者记号)(见图 3A v),从而使 BPL 成为一个产生生成模型的模型。模型的最后一步用原始数据的格式来渲染记号级变量(见图 3A vi)。我们把类型 ψ、类型对应的一组 M 个记号 θ (1) ,θ (2) ,…,θ (M) ,以及相应的二值图片 I (1) ,I (2) …,I (M) 的联合分布分解为


类型 P(ψ) 和记号 P(θ (m) |ψ) 的生成过程由图 3B的伪代码描述,具体细节参见补充材料 S2 章节的图片模型 P(I (m)|θ(m) ) 部分,源代码可在线获得。该模型同时利用图片和笔画数据,通过对来自 30 个字符系统的背景字符集的条件分布拟合来学会学习,而这个图片集合也用来对其他深度模型进行预学习。这些生产数据以及这个集合中的任何字符都没有用于后续的评价任务,在评价时只提供给模型新字符的原始图片。

手写字符类型 ψ 是部件、子部件以及空间关系的一种抽象模式。字符部件 S i 是从落笔到提笔的笔画过程(见图 3Aiii),体现了手写过程的因果性结构,而子部件 si1,si2,…, si1则是由笔的停顿分隔形成的元轨迹(见图3A ii)。为了构建一种新的字符类型,模型会先采样出部件数目 κ,并对每个部件根据背景集合测得的经验分布采样出子部件数目 n i ,i=1,2,…,κ。接着,模型从背景集合学得的一组离散的元轨迹中采样出子部件,其中下一个轨迹的概率依赖于前一个,从而为部件 S i 构建出一个模板(见图3A i)。然后,通过从每个子部件采样控制点和尺度参数,部件被具化为参数化曲线(样条函数)。最后,依据关系 R i 的定义,这些部件会被当作独立的起始、置于前端、置于尾端或沿着前一个部件的方式大致地进行放置。

字符记号 θ (m) 通过对部件及关系的实施并建模油墨从笔流向页面的方式产生出来。首先,通过对子部件的控制点和尺度参数加入噪声来创建记号层次的笔画轨迹 S (m) 。接着,轨迹的精确起始位置 L (m)会依据它和之前笔画的关系 R i 所形成的模式采样得到。然后,采样出全局变形参数,包括仿射变形A (m) 以及可以简化概率推断的自适应噪声参数。最后,基于一个随机渲染函数,用灰色的墨水描出笔画轨迹并用独立的伯努利概率建模像素值,从而创作出一个二值图片 I (m) 。

后验推断需要对庞大的规划组合空间进行搜索以找到可以生成原始图片 I (m) 的规划。我们采用快速的自底向上策略来产生一定范围的候选解析集。最有可能的候选集会进一步采用连续域优化和局部搜索的方式进行精炼,形成对后验分布 P(ψ,θ (m)|I(m) ),在一个离散域上的近似逼近(见 S3 章节)。图 4A展示了一些根据训练图片 I (1) 得到的一些规划,以及它们是如何来拟合不同的测试图片 I (2) 以计算分类得分 log P(I (2)|I(1) ) 的(对数后验预测概率),得分越高说明其越有可能来自同一个类别。当至少有一组部件和关系能同时成功地解释训练和测试图片,并满足学得的类内变形模型的软约束条件时,该得分才会高。图 4B 对一些字符上模型最优得分的解析结构和真实的人类解析结构进行了对比。

时间: 2024-10-02 05:52:30

《中国人工智能学会通讯》——2.23 贝叶斯规划学习的相关文章

《中国人工智能学会通讯》——4.41 两种学习之间有什么区别?

4.41 两种学习之间有什么区别? 来 看 一 下 剑 桥 大 学 信 息 工 程 教 授 ZoubinGhahramani 对贝叶斯规划学习(BPL)的评价,他认为 BPL 对人工智能.认知科学和机器学习是一个重大的贡献.深度学习目前已取得了重要的成功,但是也必须非常清醒地认识到深度学习的局限性,因为深度学习需要大量的数据,并且在很多任务上表现很差. 深度学习(DL)主要解决的是计算机"运筹帷幄"的问题,实现"要从大量数据形成抽象":而贝叶斯规划学习(BPL)主要

中国人工智能学会通讯——当知识图谱“遇见”深度学习 1.1 知识图谱与深度学习融合的历史背景

大数据时代的到来,为人工智能的飞速 发展带来前所未有的数据红利.在大数据的 "喂养"下,人工智能技术获得了前所未有 的长足进步.其进展突出体现在以知识图谱 为代表的知识工程以及深度学习为代表的机 器学习等相关领域.随着深度学习对于大数 据的红利消耗殆尽,深度学习模型效果的天 花板日益迫近.另一方面大量知识图谱不断 涌现,这些蕴含人类大量先验知识的宝库却 尚未被深度学习有效利用.融合知识图谱与 深度学习,已然成为进一步提升深度学习模 型效果的重要思路之一.以知识图谱为代表 的符号主义,以

《中国人工智能学会通讯》——2.27 利用深度学习改进统计机器翻译

2.27 利用深度学习改进统计机器翻译 利用深度学习改进统计机器翻译的核心思想是以统计机器翻译为主体,使用深度学习改进其中的关键模块,如语言模型[1] .翻译模型 [2] .调序模型 [3] .词语对齐[4]等. 深度学习能够帮助机器翻译缓解数据稀疏问题.以语言模型为例.语言模型能够量化译文的流利度,对译文的质量产生直接的重要影响,是机器翻译中的核心模块.传统的语言模型采用 n-gram方法,通过极大似然估计训练模型参数.由于这种方法采用离散表示(即每个词都是独立的符号),极大似然估计面临着严重

《中国人工智能学会通讯》——6.4 基于深度学习的知识图谱构建

6.4 基于深度学习的知识图谱构建 随着深度学习在自然语言处理领域应用的不断深入,人们也开始尝试将深度神经网络用于知识图谱的自动构建.在此,以实体和关系的表示学习技术为基础,讨论深度学习在命名实体识别.关系抽取.关系补全等任务上的应用. 命名实体识别 命名实体识别是从文本中提取出和人名.地名等特定的短语或名称的任务.早期的命名实体识别主要基于规则和词典来进行,对规律性较强的文本环境较为适合,但难以摆脱对领域专家的的依赖,费时费力且难以移植[28] .随着语料数据的增长,研究者逐步将机器学习和统计

《中国人工智能学会通讯》——7.2 基于深度学习的自然语言处理

7.2 基于深度学习的自然语言处理 深度学习旨在模拟人脑对事物的认知过程,一般是指建立在含有多层非线性变换的神经网络结构之上,对数据的表示进行抽象和学习的一系列机器学习算法.该方法已对语音识别.图像处理等领域的进步起到了极大的推动作用,同时也引起了自然语言处理领域学者的广泛关注. 如图 1 所示,深度学习为自然语言处理的研究主要带来了两方面的变化,一方面是使用统一的分布式(低维.稠密.连续)向量表示不同粒度的语言单元,如词.短语.句子和篇章等:另一方面是使用循环.卷积.递归等神经网络模型对不同的

中国人工智能学会通讯——金融博弈下的价值学习 1.1 多代理环境下的博弈与学习

1.1 多代理环境下的博弈与学习 我们考虑的是多代理环境下的博弈与学习.对于通常情况下的机器学习,我们有很多的知识了解,那么在我们不知道的环境下该怎么处理?这种情况下我们考虑的是对抗性学习和博弈学习.这样的应用目前已经越来越多,特别是在金融和经济学里. 关于对抗性学习,前面的报告提到GAN的网络,在这方面我们也可以考虑到反垃圾邮件时,filter要经常转变. 博弈学习是另外一种情况,博弈学习时,并不是完全对抗的,可能还会合作.在这种情况下我们对学习有什么样的理解. 这里最重要的一点是,我们有时并

《中国人工智能学会通讯》——3.4 网络表示学习的应用

3.4 网络表示学习的应用 由于基于神经网络的网络表示方法的高效性,它被越来越多地应用到除传统应用场景(如网络节点分类.推荐和链接预测等)之外的其他方面(如文本建模[17,28]和可视化处理[29] ). 文本语料可以表示为一个带权重的网络结构(节点表示词,边权重表示词与词之间共现的程度),因此网络的表示方法同时也可以应用到文本建模中.LINE [17] 模型一个重要的应用就是学习词的向量表示,相比现在流行的 Skip-gram 词向量模型,它具有效率更高和效果更好的特点.在文献 [17] 中,

《中国人工智能学会通讯》——11.30 深度迁移学习

11.30 深度迁移学习 随着互联网技术在各个领域的广泛应用,特别是社会网络,以及移动计算的崛起,文本.图像.视频等非结构化数据呈现出指数式增长,迫切需要有效的数据分析方法和高效的数据处理算法.机器学习作为大数据智能化分析的主要技术基石,在理论和实践两方面都取得了飞速进展,特别是在深度学习[1]上取得了革命性突破. 虽然人们已经能够通过信息系统.社会媒体.移动计算.工业互联网等渠道收集到大规模.多模态.高维度.快速变化的大数据,但大数据中高价值的标记数据还是比较稀缺的.从监督机器学习的视角来看,

《中国人工智能学会通讯》——2.22 通过概率规划归纳的人类层次概念学习

2.22 通过概率规划归纳的人类层次概念学习 尽管人工智能和机器学习取得了显著的进步,但是机器系统始终还未能触及人类概念性知识的两个方面.首先,对于大多数自然和人工的类别,人们可以仅从一个或少量的一些样例中学得一个新概念,而标准的机器学习算法则需要几十或上百的样例来达到类似的能力.例如,人们可能只需要看到一种新型两轮车的一个样例(见图 1A),就可以掌握这个新概念的范畴,甚至连孩子们都可以利用"单次学习"形成有意义的泛化能力.相反,很多领先的机器学习算法却恰恰对数据需求极高,特别值得一