《中国人工智能学会通讯》——10.27 提出的方法

10.27 提出的方法

在此我们将详细描述所提到的方法,来匹配带有姿态、光照及分辨率变化的人脸图片。该框架包括两个阶段——计算转换矩阵的训练阶段和测试阶段。在训练阶段,转换矩阵从高分辨率和低分辨率非正面人脸图片中学习得到。在测试过程中,训练图片和测试图片被转换到通用空间,在那时两个转换图片间的立体代价被计算,给出了两图片简单的距离。

学习转换矩阵
在训练过程中,高分辨率正面图片和低分辨率非正面图片被用于学习转换矩阵。在训练数据库中的每个人脸图片被表示是通过聚集局部图片表示,局部图片的表示是通过基准位置计算的,它通过使用 STASM [26] 在人工监督下被提取,去改正一些在基准点位置上孤立的总误差。在这篇文献中,我们计算人脸内部的 15 个基准位置的 rootSITF [27] 描述子作为人脸的表示。

转换被定义为 g,: ,n 是输入特征矢量的维数,d 是转换空间的维数。投影 g 可以被表示为 k 个基准向量的线性组合,如下:
式中, (f),j=1,2,…,k,是一个线性的或非线性的函数;f 是输入特征向量;W 是转换矩阵,其中元素由计算得到。我们的目的是找到一个满足以下两个准则的转换:① 在转换空间中高分辨率和低分辨率图片的特征向量 ( 分别用 f i 和 f j ) 间的距离应该是接近于在相同可控环境下得到的图片的距离(用d ij 表示);② 在转换空间中同一个人的特征向量间的距离相对比不同人的应该更小,这样才能确保被识别。为了达到这样的目的,我们通过最小化下式得到转换 W:
其中,J 1 (W) 是保留质量的距离;J 2 (W) 是判别项。参数 λ 决定了距离保留和类可分性的相对重要性。第一项通过下式得到
其中 D ij 表示第 i 个高分辨率图片的特征向量和第 j个低分辨率图片的特征向量间的距离。第二个判别项通过如下式得到
其中,如果 ω i =ω j ,则 δ(ω i ,ω j )=1;反之则为 0。以上的公式与文献 [5] 中的相似 , 主要有以下不同:

● 学习到的转换矩阵 W 适用于人脸部分特征的提取,与只有一些基准位置相反。因此在测试人脸过程中它可以用于整个人脸的特征转换。因为在测试过程中没有发现特殊的基准位置,因此这个是必需的。

● 例如 PCA 的维数约简技术在此方法中可能并不适合,这是因为在测试阶段并没有假设基准位置的一致性。

最后,转换矩阵 W 通过使用迭代主算法[28]解式(2)计算得到。

测 试
在测试阶段,在测试和训练图片的每一点上得到 SIFT 描述子,然后通过在训练阶段学习到的转换矩阵 W,将这些描述子转换到常见的空间。表示在 M 个人脸网格位置的 SITF 描述子,转换后的特征表示为
训练图片和测试图片间的距离通过两图片间的立体匹配代价计算得到。在此方法中,立体代价在HR 正面人脸图片的每行转换的 SITF 特征和在学习到的识别空间中 LR 测试图片之间得到。Criminisiet al [29] 提到的四种情形的立体公式被用于计算在转换空间中的立体匹配匹配的代价。为了完整性,我们提供了算法的一些细节。

立体算法包括四个累积的代价矩阵,分别为M Lo 、M Ro 、M Lm 和 M Rm 。在这四个代价矩阵之间,M Lo 和 M Ro 被用来获得遮挡,M Lm 和 M Rm 分别被用来在左边和右边图片中获得匹配。四个矩阵的输入除在右边遮挡的累积代价矩阵 M Ro 外,其余的初始化为 + ∞。
其中 q 表示输入图片一行特征的数量。四个累积代价通过动态规划算法计算得到如下递归过程:
其中 M(l,r) 表示转换特征描述符的匹配代价,分别相应于在从左到右观察中的第 l 和第 r 个网格位置。在这里,l和r从0变化到q-1。M R0 和M Rm 是对称的。匹配代价 M(l,r) 的计算公式如下:
其中 Ω 是在特征位置 (l,r) 周围的 3×3 网格块;上标 1 和 2 表示正在计算的立体代价的两个图像;P k是在第 k 个网格位置计算的转换 SIFT 描述子。一个块的均值用条形来表示。在我们的实验中,参数设置为 α=0.5、β=1、β’=1、γ=0.25。通过设置不同的参数值,实验中发现算法对于参数值是鲁棒的。假设 l 1 和 l 2 是两个图像中的两条扫描线,匹配这两条线的代价表示为Cost(l 1,l2 ) = M Ro (q-1, q-1)。因此匹配测试图像 I 1 和训练图像 I 2 的代价为
其中 和 是转换的特征向量,分别对应于测试图片和训练图片第 i 个扫描线;N s 是观扫描线的个数。最后两个图片间的距离计算公式如下:
这样做的原因是在实际环境中并不知道哪一个图片在左,哪一个图片在右。训练和测试阶段的流程如图 1。

时间: 2024-11-13 08:18:11

《中国人工智能学会通讯》——10.27 提出的方法的相关文章

《中国人工智能学会通讯》——3.8 主要方法概述

3.8 主要方法概述 跨网络链接预测方法--跨网络匹配 从更广义的角度来说,跨网络链接预测不仅可以用于上述的发现并集成同一用户在不同社交网络的不同账号[5] ,还能用于异构数据源间的实体匹配 [4]以及跨网络合作关系推荐[6]等.这里主要的挑战是跨网络之间的链接往往非常稀疏:同时由于两个网络可能高度异构,使网络间节点共性少.关联度低. 用户名匹配:最简单的方法是直接使用用户名进行匹配,或者计算不同网络之间用户名的相似度.Zafarani 等[7-8]最早提出使用用户名前缀.后缀进行不同网络用户账

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——人工智能发展的思考

2016 年是充满了纪念意义的特殊的一年:80 年前的 1936 年,"人工智能之父"图灵提出了"可计算机器"的概念,为人工智能乃至现代信息科技奠定了基础:70年前的 1946 年,世界上第一台电子计算机ENIAC 在美国滨州诞生:60 年前的 1956年"人工智能"的概念首次被提出:50 年前的 1966 年,第一次颁发"图灵奖",到目前为止已经有 64 位获奖者:10 年前的2006 年,深度学习概念开始为大家所熟悉,并流

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景