11.52 基于直推式学习的异质人脸图像 合成
前面介绍的方法都是基于归纳式学习(InductiveLearning) 的,这些方法取得了不错的效果,但是它们也使得测试样本风险误差增加,进而可能影响合成图像的质量。这是因为归纳式学习是对训练样本进行最小化经验风险误差,学习得到一定的规则,然后在此规则指导下,对测试样本进行分类、回归或者其他操作,这个过程中测试样本完全不参与训练过程。而直推式学习 (Transductive Learning) 是将所有的样本(包括测试样本和训练样本)一起进行学习,以最小化损失函数在测试样本上的风险误差为目标,因而有望能够从一定程度上提高在测试样本上的表现。结合直推式学习与贝叶斯推理[14] ,下面提出一种贝叶斯框架下的基于直推式学习的人脸画像 - 照片合成方法,且仍以人脸画像合成为例详细介绍该方法。
用 Y 表示训练和测试照片划分成的块组成的矩阵,X 表示对应的训练画像和待合成的画像划分成的块组成的矩阵,W 表示重构权值组成的矩阵。这些列向量均按行排列,即 Y 中的每个行向量代表一个照片块,X 与 W 中的行向量有类似的含义。
画像和照片块采样由隐含变量 W 控制的联合概率分布 P(X,Y,W),可以分解这个产生过程如下:P(X,Y,W)=P(X,Y|W)P(W)=P(X|Y,W)P(Y|W)P(W) (2)这里,P(W) 表示隐含变量 W 的先验;P(Y|W) 表示在已知隐含变量 W 的情况下产生照片 Y 的条件概率;P(X|Y,W) 表示在隐含变量 W 和照片 Y 已知的情况下产生画像 X 的条件概率。先验概率通常被当作对 W 约束的一个正则项,这里我们用相邻合成画像块之间的覆盖区域要尽量兼容来对先验概率进行建模。
在人脸画像合成中,照片集 Y 是已知的,因而 P(Y|W) 是一似然函数,可以由高斯函数进行建模 ( 使用高斯函数建模首先是因为模型容易优化求解;其次是因为高斯分布是常见的比较合理的模型假设 )。当 W 已知情况下,X 是条件独立 于 Y 的, 即 P(X,Y|W)=P(Y|W)P(X|W), 因 而P(X|Y,W)=P(X|W)。比较直观的是,P(X|W) 可以用一系列独立同分布的高斯函数来表示。可以使用交替优化的方法来求解上述问题,得到一个局部最优解,算法框图见图 4。