《中国人工智能学会通讯》——11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法

11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法

如引言所述,视觉目标跟踪中表观建模主要分为目标表示和统计建模两部分。上两节主要关注的是在跟踪中如何设计一种有效的统计模型。本节主要关注的是表观建模中的目标表示策略。近年来,稀疏表示作为一种有效的物体中层表示策略在视觉跟踪中得到了广泛应用[2] 。稀疏表示的核心思想就是将数据表示为一个字典中基元的线性组合,而且只需要较少的几个基元就可以将数据表示出来,线性组合权重向量称之为稀疏参数。目前基于稀疏表示的跟踪方法都假定数据位于欧式空间 。然而,在实际应用中,特征数据往往位于具有某种潜在几何结构的黎曼流形 M 上。如果直接用欧式空间中获得数据稀疏表示的策略来处理位于黎曼流形的数据既不合理也不恰当,因为黎曼流形 M 上的点不能简单地表示为字典中某些基元的线性组合。

为了能使用欧式空间的理论和方法,首先需要将位于黎曼流形的数据嵌入到某个欧式空间中,然而,这种嵌入映射很难得到。即使我们能获得嵌入映射,在映射过程中很难保证原始数据内在的几何结构。例如,假设黎曼流形 M 上两个点 x 和 y 有很大的测地线距离足以将它们分开。但是当经过嵌入 f:M 后,在欧式空间中的 f(x) 和 f(y) 可能会有很小的距离。因此在欧式空间中对 f(x) 和 f(y)进行稀疏编码是会有非常相近的稀疏系数,这与在原始黎曼流形中不相似的两点 x 和 y 相违背。

为了解决上述难点,一种很自然的方法就是利用黎曼对数映射构造 M 上每个数据点的切空间[10-11] ;在切空间中计算流形数据点的稀疏表示。因为 M上每个点的切空间就是一个欧式向量空间,所以在切空间中可以将每个数据点表示为基元的稀疏线性组合;然后再将数据点通过黎曼指数映射映射回流形 M 上。这类方法是利用切空间的欧式距离来近似流形上的真实距离。虽然比较简单,但是在切空间中只有切点间的距离是真正的测地线距离,其他任意两点间的距离不能表示流形的几何结构。也就是说,在稀疏表示过程中,这类方法没有考虑真正的黎曼几何结构。此外,迭代地使用黎曼对数映射和黎曼指数映射无疑增加了计算负担。

本节提出了一种新的流形自适应核稀疏表示方法。流形自适应核函数将黎曼流形嵌入到高维的可再生核希尔伯特空间(Reproducing Kernel HilbertSpaces,RKHS)。在 RKHS 上,每个数据点可表示为字典基元的稀疏线性组合。图拉普拉斯(GraphLaplacian)算子被整合到 RKHS 中可以有效地反映数据中潜在的几何结构。同时,本章介绍并证明了两种定义在正定对称矩阵这类黎曼流形上的有效核函数。通过核变换,这两种核函数可直接构造出对应的流形自适应核。随后,在粒子滤波目标跟踪框架下用核稀疏表示建模目标区域中相互重叠的局部图像块,然后将每个图像块的核稀疏系数作为目标直方图描述子的一个簇。用簇比重直方图距离计算目标模板与候选目标之间的距离来作为粒子滤波的观测模型,以确定最终的跟踪区域。

时间: 2024-08-18 05:25:23

《中国人工智能学会通讯》——11.70 基于黎曼流形稀疏表示的视觉目 标跟踪方法的相关文章

中国人工智能学会通讯——一种基于众包的交互式数据修复方法 5 相关工作

5 相关工作 数据修复旨在发现和修正数据库中错误的数据.在过去的几十年里,研究人员提出了各种各样自动发现并修复数据库中错误数据的方法[1].这些方法大致可以分为如下三类. (1)传统的方法先依赖各种约束条件,包括FDs[5,7].CFDs[6].完整性约束[4]和包含关系(INCs)[5]来检测数据中的由错误数据引起的不一致性(或冲突):然后用文献[2-4]中的方法修正所有的错误数据,从而解决所有的冲突.对一般的文本数据库,这一类方法中的大部分工作都是使用FD/CFDs进行修复,因为FD/CFD

《中国人工智能学会通讯》——9.12 集成学习中的挑战性问题及解决方法

9.12 集成学习中的挑战性问题及解决方法 然而,传统的集成学习算法,特别是聚类集成算法,在集成器成员选择.聚类结果融合.集成器参数优化等方面还存在一些亟待解决的科学问题(见图 4): ① 集成器存在冗余成员,影响集成的最终结果:② 聚类集成算法集成器中多个聚类结果的融合质量有待进一步提高:③ 没有考虑到集成器参数往往受到外在环境(如样本空间和属性空间)和内在环境(如集成器基础模型的参数和权重)的影响. Yu et al [17] 针对上述科学问题,围绕"集成学习理论与应用",从集成器

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍