《中国人工智能学会通讯》——10.29 实验结果

10.29 实验结果

我 们 在 Multi-PIE 数 据 集[7] 、SurveillanceCameras 人脸数据集[8] 、Multiple Biometric GrandChallenge 数据集[9]以及 Chock Point 数据集[10]上做了大量的实验来验证我们方法的适用性。我们使用了免费公开的基于主动形状模型(ASM)的 C++软件库、STASM [26] ,自动地去检测特征点位置 ; 然后手动纠正那些不正确的位置。注意,所检测到的位置只在训练过程中才需要。在测试过程中,只需要眼睛的位置对齐人脸。

在 Multi-PIE 数据集上的实验
Multi-PIE 数据集[7]包含了在 4 个阶段不同光照和视角下的 337 个人的人脸图像。在我们的实验中,使用四种标记的带有不同姿态(pose04_1,05_0,以及 13_0)的图像进行测试。正面姿态的高分辨率图像用于训练。训练集中的训练图像分辨率为36×30,测试图像的分辨率为 18×15 的(采样因子为 2)。

在识别实验中,来自于一种光照条件下的的图像组成训练集,另外一种光照条件下的的图像组成测试集。在我们的实验中,使用5种不同的光照条件;针对不同的光照条件反复进行实验 ; 识别性能以不同光照条件下的秩 -1 识别性能显示。

50 个随机选择的类别用于训练,剩下的类别用于测试。用于训练和测试的类别之间没有重叠。在全部的实验中,λ 的值被设置为了 0.9,MDS 的输出维度 d 被设置为了 100。为了强调所提出方法的性能,我们固定核映射 (x) 为 x,当然也可以使用其他的映射。


识别率性能:不同姿态,光照,分辨率
我们的实验将从匹配不同姿态、光照以及分辨率的图片开始。

在表 1 中,我们也列出了所提出方法与基于MDS 的方法[5]和立体匹配算法[6]之间的比较结果。实验结果是通过运行在通信作者网站[37] 、文献 [38]上公布的代码获得的。在表1中,HR-LR(参考基准)显示的是文献 [5] 中使用 SIFT 描述子但不学习转换矩阵。对于立体基线方法[6] ,在计算立体匹配代价前,先用双线性插值方法应用于 LR 测试图像,使得其分辨率与 HR 训练图像一致。当测试图像和训练图像拥有相同姿态和分辨率时,此时的识别性能(HR-HR)将达到 93.55%。所提出的方法不仅性能大大优于基线方法[5-6] , 其性能也非常接近 HR-HR的性能。对于基于参考的方法,参考图像的数量被设置为 50。基于参考方法的性能略差于在第 3 部分中提出的方法,但它的效果仍然要比基线方法好。虽然 LSML 算法的性能要比我们的基于参考的方法好,LSML 在训练和测试时都要求几个目标点(比如眼角、鼻子和嘴巴等)的位置,特别在对于低分辨率的、非正面姿态图像的情况

性能比较:度量学习方法
我们还评估了三个较先进的基于度量学习 / 分类器的算法:① 已被成功用于面部图片识别[39]的距离度量学习方法,如大间隔最近邻(LMNN) [32] 。我们采用不同的参数(最近邻的个数、最大迭代次数)配置进行实验。表 1 显示了最小,最大以及平均的秩 -1 识别率。② 从基于统计推断角度的等价约束学习度量准则的大尺度度量学习方法 (LSML) [33] 。M v =1 的情况表示度量标准是从相似对的 Mahalanobis距离学习得到的。③ 整合了人脸不同区域的描述子的成对多度量学习(PMML)方法[34] 。表 1 显示了由作者主页中公布的代码进行实验产生的实验结果。除了在一种姿态下所提方法表现略差外,其余情况所提方法均要优于上述三种方法。

性能比较:跨模态与字典学习
最近,跨领域图像合成与识别方法已在许多应用中表现出很好的性能。跨领域识别算法能够解决不同领域中的识别 / 分类任务。我们对文献 [30-31,35-36] 中的方法进行了评估。算法[30-31]联合解决耦合字典及公共特征空间学习问题以合成跨领域图像并执行识别任务。广义的多视角分析方法[35]通过在不同的特征空间中解决一个联合的、松弛的二次约束的二次规划问题 (QCQP) 得到一个单一的线性子空间。文献 [36] 中的算法通过建立对偶的偏微分模型来解决跨姿态的人脸识别问题。我们使用作者主页中的源代码,并通过设置不同参数来评价各种算法。表 1 中列出了各种算法最好的实验结果。由表 1 可看出,在所有的姿态下,所提方法都能得到最好的识别性能。

性能比较:超分辨率方法
匹配一个 LR 测试图片与 HR 训练图片的最一般的方法,就是在匹配进行前对 LR 测试图像使用超分辨率。我们将所提方法与两个具有代表性的 SR技术、SR1 [40] 以及 SR2 [41] 进行了比较。在 SR1 中,核脊回归方法被用于学习从 LR 图像到 HR 图像的映射,而在 SR2 中,两个不同的字典被用于训练LR 和 HR 图像,同时 LR 图像的稀疏表示被用于获得对应的 HR 图像。实验中,我们采用作者主页上的源代码来产生实验结果。从图 5 中可以观察到,所提出的方法显著优于所有用来比较的方法
不同分辨率测试集上的实验结果
此实验中,我们分析了所提算法在测试集分辨率不同情况下的性能。我们将训练图像的分辨率保持在 36×30,同时改变测试图像的分辨率。我们使用了三个不同的测试分辨率,15×12,12×10 以及10×9。实验中采用了姿态 05_0 的 LR 测试图像。

所提出的方法和基于 MDS 的方法[5]的秩 -1识别性能如图 6 所示。可以看出,在所有情况下,所提出的方法的性能都要明显优于所比较的方法。
基于参考的方法的优点
我们通过改变参考图像的数量来研究所提出的基于参考的方法的识别性能和计算优势。

表 2 显示了基于参考的方法在采用不同数量的参考图像时的秩 -1 识别性能及运行时间。本实验是在Muliti-PIE 数据上进行的,采用与 pose04_1 数据库上一样的实验设置来测试。对于一个待测图像,采用基于参考的方法将类似的训练图片返回后,测试图片和前 10 幅相同的训练图片之间的立体匹配的花费也被计算出来,这显著提高了秩 -1 识别的准确性。


在监视相机数据库中的实验
现在,我们用从检测相机数据库[8]中采集得到的真实环境下的数据对我们所提出的方法进行评估。该数据库包含了在不受控制的环境中,使用 5个不同的视频监控摄像机所拍摄的 130 名受试者的图像,而其中的训练图像都是由高品质的相机拍摄得到的。我们使用与文献 [5] 中同样的实验配置进行实验,使用的所有图像均是由这 5 个监视相机采集获得,因此共有 650 幅图像。

时间: 2024-08-21 10:20:14

《中国人工智能学会通讯》——10.29 实验结果的相关文章

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——人工智能发展的思考

2016 年是充满了纪念意义的特殊的一年:80 年前的 1936 年,"人工智能之父"图灵提出了"可计算机器"的概念,为人工智能乃至现代信息科技奠定了基础:70年前的 1946 年,世界上第一台电子计算机ENIAC 在美国滨州诞生:60 年前的 1956年"人工智能"的概念首次被提出:50 年前的 1966 年,第一次颁发"图灵奖",到目前为止已经有 64 位获奖者:10 年前的2006 年,深度学习概念开始为大家所熟悉,并流

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智