《中国人工智能学会通讯》——11.52 基于直推式学习的异质人脸图像 合成

11.52 基于直推式学习的异质人脸图像 合成

前面介绍的方法都是基于归纳式学习(InductiveLearning) 的,这些方法取得了不错的效果,但是它们也使得测试样本风险误差增加,进而可能影响合成图像的质量。这是因为归纳式学习是对训练样本进行最小化经验风险误差,学习得到一定的规则,然后在此规则指导下,对测试样本进行分类、回归或者其他操作,这个过程中测试样本完全不参与训练过程。而直推式学习 (Transductive Learning) 是将所有的样本(包括测试样本和训练样本)一起进行学习,以最小化损失函数在测试样本上的风险误差为目标,因而有望能够从一定程度上提高在测试样本上的表现。结合直推式学习与贝叶斯推理[14] ,下面提出一种贝叶斯框架下的基于直推式学习的人脸画像 - 照片合成方法,且仍以人脸画像合成为例详细介绍该方法。

用 Y 表示训练和测试照片划分成的块组成的矩阵,X 表示对应的训练画像和待合成的画像划分成的块组成的矩阵,W 表示重构权值组成的矩阵。这些列向量均按行排列,即 Y 中的每个行向量代表一个照片块,X 与 W 中的行向量有类似的含义。

画像和照片块采样由隐含变量 W 控制的联合概率分布 P(X,Y,W),可以分解这个产生过程如下:P(X,Y,W)=P(X,Y|W)P(W)=P(X|Y,W)P(Y|W)P(W) (2)这里,P(W) 表示隐含变量 W 的先验;P(Y|W) 表示在已知隐含变量 W 的情况下产生照片 Y 的条件概率;P(X|Y,W) 表示在隐含变量 W 和照片 Y 已知的情况下产生画像 X 的条件概率。先验概率通常被当作对 W 约束的一个正则项,这里我们用相邻合成画像块之间的覆盖区域要尽量兼容来对先验概率进行建模。

在人脸画像合成中,照片集 Y 是已知的,因而 P(Y|W) 是一似然函数,可以由高斯函数进行建模 ( 使用高斯函数建模首先是因为模型容易优化求解;其次是因为高斯分布是常见的比较合理的模型假设 )。当 W 已知情况下,X 是条件独立 于 Y 的, 即 P(X,Y|W)=P(Y|W)P(X|W), 因 而P(X|Y,W)=P(X|W)。比较直观的是,P(X|W) 可以用一系列独立同分布的高斯函数来表示。可以使用交替优化的方法来求解上述问题,得到一个局部最优解,算法框图见图 4。

时间: 2024-10-24 06:24:17

《中国人工智能学会通讯》——11.52 基于直推式学习的异质人脸图像 合成的相关文章

中国人工智能学会通讯——一种基于众包的交互式数据修复方法 5 相关工作

5 相关工作 数据修复旨在发现和修正数据库中错误的数据.在过去的几十年里,研究人员提出了各种各样自动发现并修复数据库中错误数据的方法[1].这些方法大致可以分为如下三类. (1)传统的方法先依赖各种约束条件,包括FDs[5,7].CFDs[6].完整性约束[4]和包含关系(INCs)[5]来检测数据中的由错误数据引起的不一致性(或冲突):然后用文献[2-4]中的方法修正所有的错误数据,从而解决所有的冲突.对一般的文本数据库,这一类方法中的大部分工作都是使用FD/CFDs进行修复,因为FD/CFD

《中国人工智能学会通讯》——6.23 Yoshua Bengio: 深度学习崛起带来人工智能的春天

6.23 Yoshua Bengio: 深度学习崛起带来人工智能的春天 20 世纪 50 年代,计算机开始在象棋领域战胜人类,证明数学定理,让人类狂喜不已.60 年代,人们越来越希望,不久以后,科学家就能用硬件和软件复制人类大脑,"人工智能"可以完成任何任务,其表现不逊于人类.1967 年,今年年初逝世的麻省理工学院教授 Marvin Minsky(MIT 人工智能实验室的联合创始人,人工智能先驱)宣称,十年之内,人们可以解决人工智能这个难题. 当然,结果表明,当时就持有那份乐观主义,

《中国人工智能学会通讯》——2.20 专用的深度学习处理器

2.20 专用的深度学习处理器 尽管使用现有商用技术构建的 GPU 集群已经可以训练大规模神经元网络,但其所需要的平台仍然需要很高的成本和能耗.随着深度学习的应用日益广泛,业界迫切需要比现有通用平台更加低成本和低功耗的深度学习硬件平台. 现有的商业通用处理器和 GPU 都不是为深度学习专门设计的,其中有很多部件对深度学习来说是浪费的,能否设计专用的机器学习处理器,使其性能和功耗特征能够大大优于通用处理器? 令人欣喜的是,中国科学家在这个方向的研究工作走在了世界前列.中国科学院计算所的陈天石等研制

《中国人工智能学会通讯》——2.23 贝叶斯规划学习

2.23 贝叶斯规划学习 BPL 算法通过学习简单的随机规划来表示概念,这些规划是由部件(见图 3A iii).子部件(见图 3A ii)以及空间关系(见图 3A iv)组合而成的.BPL 定义了一个生成过程,它可以通过用新的方式组合部件以及子部件来采样出新的概念类型.每种新的类型也表示为一个生成模型,这个较低层次的生成模型可以产生概念的新样例(或者记号)(见图 3A v),从而使 BPL 成为一个产生生成模型的模型.模型的最后一步用原始数据的格式来渲染记号级变量(见图 3A vi).我们把类型

《中国人工智能学会通讯》——9.14 从多标记学习到标记分布学习

9.14 从多标记学习到标记分布学习 现有的机器学习范式中,与一个示例对应的标记复杂度相关的主要包括单标记学习(SLL, Single-Label Learning)与多标记学习(MLL, Multi-LabelLearning).其中 SLL 假设每个训练示例对应一个标记,而 MLL 允许一个训练示例对应多个标记.MLL 能够处理示例与标记之间一对多的不确定性,因此比 SLL 更具有通用性. MLL 与 SLL 类似,旨在解决"哪些标记可以描述示例",而不能解决"标记在多大

《中国人工智能学会通讯》——11.53 合成人脸画像质量评价

11.53 合成人脸画像质量评价 下面对以上三章中提到的基于稀疏近邻选择方法(SFS, Sparse Feature Selection).基于人脸幻 象 思 想 的 合 成 方 法(SFS-SVR, Sparse FeatureSelection & Support Vector Regression) 和 基 于 直推式学习的方法(TFSS, Transductive Face SketchSynthesis)三种算法,以及基于位置的人脸画像合成方法 (PFSS, Position base

《中国人工智能学会通讯》——11.51 基于幻象技术的异质人脸图像合成

11.51 基于幻象技术的异质人脸图像合成 基于稀疏特征选择的方法,以及现有的大部分算法在合成人脸图像时,多是采用线性组合的方式.线性组合,即线性加权平均,可以看作一低通滤波器,会过滤掉一些高频细节信息,如图2所示.此外,由于现有的异质人脸图像合成算法对图像分块多采用相邻块覆盖的方式,故在最后融合生成一整张人脸时需要将重叠区域平均,这也会带来一定的模糊效应,过滤掉部分高频细节信息. 那么是否能够通过学习输入测试照片到残差图像之间的映射关系来学习丢失的高频细节信息?而人脸幻象 (face hall

《中国人工智能学会通讯》——11.49 异质人脸图像合成及其应用研究

11.49 异质人脸图像合成及其应用研究 安城市和智慧城市建设构建了大量的视频监控网络,从而获得了大量的视频以及图像数据.基于这些图像和视频数据,可以利用模式识别技术进行事件分析和身份认证.传统的模式识别方法利用传感器将将现实世界的感兴趣的目标进行图像采集,从而在信息空间中进行目标识别,构建一个基于物理 - 信息空间融合的自动模式识别系统.然而由于视频监控中感兴趣的目标(人或物)成像分辨率低或刻意隐藏身份(伪装.遮挡.侧面.光照等因素),导致传统的基于两元空间(物理空间和信息空间)的模式识别方法

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍