《中国人工智能学会通讯》——11.67 视觉目标跟踪中的表观建模研究

11.67 视觉目标跟踪中的表观建模研究

视觉目标跟踪(Visual Object Tracking)是指在图像序列中根据视频信息在空间或时间上的相关性,对特定目标进行检测、提取并获得目标的位置参数,如目标质心的位置、姿态、形状、轨迹等[1] 。根据跟踪结果,可以对目标进行后续深入的分析,以实现对特定目标的行为理解,或完成更高层的任务。因此,视觉目标跟踪是解决很多计算机视觉问题的基础,具有重要的理论研究价值。此外,视觉目标跟踪已在视频监控、智能交通、人机交互、行为分析、医学图像处理等领域得到了广泛应用,具有广阔的应用前景。

视觉目标跟踪算法主要分为目标初始化、表观建模、运动估计和目标定位四部分。跟踪中,一般手动或者使用检测器实现对目标的初始化。表观建模主要描述目标的视觉特征(颜色、纹理、边缘等),以及如何度量视觉特征之间的相似性,它是实现鲁棒跟踪的先决条件。运动估计则是采用某种运动假设来确定目标的可能位置,比如线性回归、卡尔曼滤波或粒子滤波。最后,在表观模型和运动估计的基础上,采用某种最优化策略确定目标最可能的位置以达到目标关联的目的,实现跟踪。由于受背景复杂、光照变化、非刚体形变、遮挡等因素的影响,设计一种鲁棒的表观模型一直是视觉目标跟踪中的难点。许多研究者运用不同的目标表示和(或者)统计模型提出了各种各样的表观模型,旨在克服跟踪所面临的各种挑战。如何设计一种鲁棒的表观模型还存在一些值得深入探索的问题。

(1)产生式的表观建模通过在线更新机制增量地学习目标区域的表示,却忽略了背景信息。判别式的表观建模可以更好地适应场景的变化,能将目标从背景中分离出来,但是它却依赖于大量地训练样本来拟合目标表观的数据分布。因此,在无需指定样本分布的情况下,如何利用少量的有标签样本来构建鲁棒的判别式表观模型是一个有挑战性的问题。

(2)大多数判别式表观模型,在学习分类器时利用采样和加标签两个独立的策略选择训练样本。即从已有的跟踪结果附近采集样本,然后使用某种启发式方法估计样本的标签。例如,将离跟踪结果较近的样本标记为正样本,将离跟踪结果较远的样本标记为负样本。然而,根据已有的跟踪结果为样本估计标签容易引起误差累积,并且样本的采集是无目的性的。因此,如何获取含有能提高分类器性能的有利信息的样本也是表观建模研究的方向。

(3)近年来,稀疏表示作为一种有效的物体中层表示策略,在视觉跟踪中得到了广泛应用[2] 。目前基于稀疏表示的跟踪方法都假定数据位于欧式空间 。然而,在实际应用中,特征数据往往位于具有某种潜在几何结构的黎曼流形 M 上。如果直接用欧式空间中获得数据稀疏表示的策略来处理位于黎曼流形的数据既不合理也不恰当,因为黎曼流形M 上的点不能简单地表示为某些字典中基元的线性组合。因此,研究黎曼流形上的稀疏表示是很有意思的课题。

(4)基于稀疏的跟踪算法中[3-9]大多以重构误差大小为衡量标准来确定最终跟踪结果。研究发现,以重构误差构造目标的观测似然概率存在一些问题。是否能够突破重构误差为衡量标准的思路从新的角度研究稀疏表观建模问题,也是一个有意思的工作。

时间: 2024-10-22 20:04:04

《中国人工智能学会通讯》——11.67 视觉目标跟踪中的表观建模研究的相关文章

《中国人工智能学会通讯》——10.23 能源互联网中的关键技术

10.23 能源互联网中的关键技术 现阶段可再生能源供应有很强的随机性.间断性和模糊性,成功并入电网并用其他形式高效利用存在很多技术上的难题:其次,对于能源互联网的建立,不仅要解决能源的高成本传输,以及能量输送损耗问题,还要对于能源互联网中产生的大数据进行实时处理,来预测和监控用户的需求变化,以及极端不稳定的能量生产供应变化.要解决上述问题并实现具体功能,能源互联网需要相应的技术体支撑.笔者认为,能源互联网的关键技术可以分为四个子技术,即体系架构技术.能源技术.信息通信技术和安全技术. 体系架构

《中国人工智能学会通讯》——8.16 演化计算中的机器学习

8.16 演化计算中的机器学习 演化计算与机器学习是同属人工智能的紧密相连的两个研究方向,一方面演化算法 (EAs,evolutionary algorithms) 可以用于求解机器学习中的复杂优化问题:另一方面机器学习可辅助 EA.本文侧重后者. 需要指出的是,EA 本身也具有内在学习的能力,演化计算研究者从最初即意识到学习在 EA 中的重要性,例如遗传算法 (genetic algorithm) 中的积木块 (building blocks) 假设就是利用积木块来学习自变量之间的关联性,以提

《中国人工智能学会通讯》——6.14 知识图谱中的推理技术

6.14 知识图谱中的推理技术 知识图谱的概念由谷歌 2012 年正式提出,旨在实现更智能的搜索引擎.知识图谱本质上是一种叫做语义网络(semantic network)的知识库,即具有有向图结构的一个知识库,其中图的结点代表实体(entity)或者概念(concept),而图的边代表实体 / 概念之间的各种语义关系,比如说两个实体之间的相似关系.谷歌知识图谱很重要的一部分是一个大规模的协同合作的知识库,叫 Freebase.Freebase 采用的数据结构是图模型,即可以把一个 Freebas

《中国人工智能学会通讯》——9.12 集成学习中的挑战性问题及解决方法

9.12 集成学习中的挑战性问题及解决方法 然而,传统的集成学习算法,特别是聚类集成算法,在集成器成员选择.聚类结果融合.集成器参数优化等方面还存在一些亟待解决的科学问题(见图 4): ① 集成器存在冗余成员,影响集成的最终结果:② 聚类集成算法集成器中多个聚类结果的融合质量有待进一步提高:③ 没有考虑到集成器参数往往受到外在环境(如样本空间和属性空间)和内在环境(如集成器基础模型的参数和权重)的影响. Yu et al [17] 针对上述科学问题,围绕"集成学习理论与应用",从集成器

《中国人工智能学会通讯》——3.20 在线社会网络中的信息传播预测

3.20 在线社会网络中的信息传播预测 在线社会网络 (Online Social Network) 作为一种虚拟的社会平台,在人与人之间建立起具有社交.联系.分享和协助等功能的网络结构.近年来,互联网上涌现出的各种类型的社会网络深刻地改变了人们获取信息和相互沟通的方式.在线社会网络作为新的传播媒介,对传统媒体在信息传播中的主导地位产生了巨大的冲击.现阶段主要的在线社会网络包括微博.微信.博客.论坛及各类社交网站等.社会网络中的用户不仅仅是信息的受众,而且是信息的生产者和传播者.这种"去中心化&

《中国人工智能学会通讯》——4.17 智能信息服务中的粒计算

4.17 智能信息服务中的粒计算 所谓智能信息服务,是针对用户的信息需求,智能地对信息进行生产.收集.处理.加工.存储.传输.检索和利用,并以信息产品的方式为用户提供服务.信息即数据,智能信息服务和数据的分析与挖掘是紧密相关的,甚至可以说,数据分析与挖掘是当今智能信息服务的关键所在.随着信息通信技术的迅猛发展,特别是以博客.社交网络.基于位置的服务为代表的新型信息发布方式的不断涌现,数据正以前所未有的速度呈爆炸式增长.来势汹涌的数据浪潮,将人类带进了大数据时代. 然而,大数据自身存在的诸多问题,

《中国人工智能学会通讯》——3.15 社交媒体中的谣言识别研究及其发展趋势

3.15 社交媒体中的谣言识别研究及其发展趋势 随着计算机和互联网技术的不断发展,社会已经进入了信息互联和人的互联高度融合的时代,人们可以在网络上自由地发布.传播和获取信息:人与人之间的联系也更加紧密,已经打破原有的六度分离空间现已不足五度,信息传播的方式发生了翻天覆地的变化.尤其微博(如 Twitter.新浪微博)已经成为一种新兴的.传播速度最快的在线社会媒体.截止 2015 年 9 月 30 日,新浪微博月活跃用户数已经达到 2.12 亿人1 .在这样的平台上,信息可以在几小时甚至几十分钟内

《中国人工智能学会通讯》——11.72 结束语

11.72 结束语 视觉目标跟踪是计算机视觉和模式识别领域的热点问题.其中,表观建模是实现鲁棒跟踪的先决条件.尽管国内外研究学者对视觉目标跟踪中的表观建模进行了一些研究,由于受复杂背景.光照变化.非刚体形变.遮挡等因素的影响,设计一种鲁棒的表观模型还存在一些值得深入探索的问题.本文研究了如何构造有效的目标表示和表观统计模型,并提出了针对性的模型和算法.

《中国人工智能学会通讯》——11.71 在线多示例度量学习的结构化稀 疏表观模型

11.71 在线多示例度量学习的结构化稀 疏表观模型 正如上一节所述,稀疏表示作为一种有效的物体中层表示策略,在视觉目标跟踪中得到了成功应用.然而,基于稀疏的跟踪算法中[3-9]最终跟踪结果的确定大多以重构误差大小为衡量标准.研究发现,以重构误差构造目标的观测似然概率存在一些问题. (1)重构误差的大小很大程度上依赖于字典的构成.很多跟踪算法[12-13]采用在线地更新字典基元的方式以适应目标表观变化,即所谓的跟踪中字典学习策略.然而,用最新的跟踪结果来更新字典基元,由于潜在的误差累积很容易造成