中国人工智能学会通讯——基于视频的行为识别技术 1.4 早期行为识别方法

1.4 早期行为识别方法

下面讨论如何让计算机去识别视频中 行为?首先,对于很多图像视频分类问 题来讲,最核心地找到一个好的表示。 下面我们先介绍如何利用非深度学习方 法。早期做图像识别时,利用兴趣点和 局部图像特征构建视频表示,这个方法可 以被推广到视频。 这是 IJCV2005 年发 表的一篇论文,提出了 Spatial-temporal interest points 时空兴趣点,像下图中运 动员当头顶到球的时候,在这个位置和 这个时刻会形成一个识别兴趣点。

行为中包含的运动信息不仅仅是某一 个点的运动或者某一个时刻的运动,而 是一个连续的过程。因此运动轨迹可以 为行为的描述提供丰富的信息。我们可 以通过短时光流获取运动轨迹,并在视 频中去密集地跟踪一些运动轨迹,沿着 这些运动轨迹再提取一些图像区域。这 些区域通常对于运动显著性区域,运动 轨迹比原来点的描述更加丰富一些。

通常,沿着运动轨迹我们会提取三个 类型的直方图特征。第一个是 HoG 梯度 的直方图,这个是描述图像的。第二个 是光流直方图 HoF,光流是描述运动很 重要的信息,用于表示一个像素点到下 一帧图像中 x、y 方向发生的偏移。最后 一个是,MBH 运动边缘直方图。它是由 光流沿着 x 方向和 y 方向去做一次差分梯 度后获得。这样操作的好处在于可以把 物体边缘的运动提取出来。

我们会在时空信息点,或者沿着运动 的边缘,把 HoG、HoF、MBH 三种特征 都抽出来。当然除了这三类还有其他局 部特征,我们之前的一个工作就是把图 像的梯度和光流进行联合编码,实验表 明这样的方法可以提高识别率。对于给 定的一个视频,可以在视频里可能找到 很多点或者找到很多轨迹,在每个点、 每条轨迹周围提取一个三维小的立方体; 然后围绕这个立方体提取局部特征,包 括 HoG、HoF 或者 MBH;接着采用 Bag of Visual Words 框架或其改进的方法, 对局部特征进行编码,以获取全局表示。 这个过程,设计很多环节,包括特征预 处理、字典学习方法、参数的选择等, 我们的一个工作就是把这些环节涉及的 各种选择进行充分的对比,后面这个工 作也被期刊 CVIU 录用,代码也公开了。 后期不少论文引用了我们的工作。

在研究行为识别问题时,我们观察到 一个问题,对视频来讲既有静态的特征, 也有动态的特征。动态的特征像 HoF,这 些特征联合使用可以提高识别率。怎么来 用?一个简单的方法,可以把这些特征串 起来,再去学习字典。但是这个方法效果 并不好,因为串起来后特征维度高了,增 大了字典学习的难度。因此,大家传统的 做法就是,静态图像的特征和动态的光流 分别学习字典,然后分别编码,这个方法 可行性比较强,但忽略了特征间的相关性。 我们提出把不同类型的局部特征进行联合 编码,区分出共享的部分和各自独立的部 分。这就需要一个更好的字典,这个字典 不仅仅是对一种特征,而是对多种特征进 行联合建模。

这里我们利用混合概率典型相关分析 模型作为我们的字典。该字典可以对不 同类型特征间相关部分和独立部分进行 建模。实验表明,该方法可以提高识别率。

除此之外,我们还有其他工作,简单的 分享一下。之前这些局部描述的一个缺陷就 是仅仅描述局部区域能力有限,所以我们提 取中层运动子 Motionlet 特征,这个中层特 征是靠机器学习的方法从视频数据中学习获 得的。我们还根据中层运动子特征构建运动 词组 Motion Phrase,细节可以参见我们发表 在 CVPR13 和 ICCV13 的论文。

时间: 2024-10-27 15:43:42

中国人工智能学会通讯——基于视频的行为识别技术 1.4 早期行为识别方法的相关文章

中国人工智能学会通讯——基于脑机接口的机械臂遥操作控制

摘要: 脑机接口作为一种新型的人机交互方式,在心理认知.智能控制.康复训练等方面具有很大的应用潜力.基于稳态视觉诱发电位(SSVEP)的脑机接口(BCI)系统具有较高的信息传输速率,而且校正时间较短,一直以来都是脑机接口研究中的热点.本文使用基于多导同步指数(MSI)识别算法进行SSVEP信号的识别分类:结合SSVEP-BCI系统,实现了基于脑机接口的机械臂遥操作系统,为脑机接口的实用化提供了一种可应用范例.脑电识别出来的结果将产生机械臂运动的期望轨迹:在系统的视觉反馈交互设计方面,实现了监控图

《中国人工智能学会通讯》——6.11 链接数据技术

6.11 链接数据技术 数据链接的建立涉及多个方面,包括数据资源标识.资源描述模型.词汇与本体定义.链接数据格式.自动链接抽取.链接预测等. 资源标识资源标识是构建数据链接的第一步.LOD 要求每个实体资源都要用类似于网页 URL 一样的 HTTPURI(Unified Resource Identifier) 来进行标识.但与维护传统网页之间的链接不同,一个网站的数据集中通常有数量巨大的实体资源.要维护不同数据集之间的 URI 链接,将带来巨大的工作量. Schema.org 鼓励采用一种称为

中国人工智能学会通讯——基于图像认知的心理测评方法及系统

摘要:长久以来心理障碍的诊断和评估通常都是建立在晤谈.观察.量表测验的基础上,交互繁琐困难,主观性比较大,使得人的心理特征难以快速获取和量化.本研究创新性地将心理学和信息科学结合在一起,建立了情绪图像库,通过考察前景人脸和背景情绪图像的不同交互效应,收集反应时.眼动轨迹等生理特征,结合机器学习算法的数据分析,提出了一种全新的基于图像认知,以及人的生理特征的客观.便捷地提取人的心理特征的方法. 关键词:图像认知:心理测评:情绪图像库:反应时:眼动轨迹:机器学习 图像心理学测试系统 随着社会压力的增

中国人工智能学会通讯——电子商务中的个性化推荐技术剖析 1. 基于人生阶段建模的商品推荐

1. 基于人生阶段建模的商品推荐 经典的基于协同过滤的推荐,通常结合用户近期行为,给用户推送已知范围内的商品.随着用户对推荐系统和产品期望的提高,也需要向其呈现部分他们需要,但自己尚不清楚的领域的产品.用户的人生阶段建模及基于它的推荐算法就是针对这类问题研发的.它利用半监督马尔可夫建模技术,利用少量的标注数据,根据用户有行为的类目,去精准预测用户所处的人生阶段,以提供当前或未来所需要的商品.详细算法见KDD'15上我们发表的文章"Life-stage Prediction for Product

中国人工智能学会通讯——基于众包的数据清洗模型研究 3. 实验

3. 实验 本章我们将在真值发现和缺失填充两个数据清洗代表性应用上,验证提出模型的高效性和准确性. 数据集: (1)stock.该数据集收集了2011年7月的所有工作日约1 000只股票的信息,其中包括分别来自55个数据源的16个属性.我们用该数据集验证提出的模型,在真值发现应用上的有效性. (2)wine.该数据集包括200条记录,13个属性.我们用该数据集验证提出的模型,在缺失填充应用上的有效性. 实验设置:所有的实验在Intel(R) Core(TM) i5-2400 (3.10 GHz)

《中国人工智能学会通讯》——1.14 聊天机器人技术的研究进展

1.14 聊天机器人技术的研究进展 近年来,聊天机器人受到了学术界和工业界的广泛关注.一方面,聊天机器人是图灵测试的一种实现方式,而图灵测试是人工智能领域王冠上的明珠:另一方面,微软推出了基于情感计算的聊天机器人"小冰",百度推出了用于交互式搜索的聊天机器人"小度",进而推动了聊天机器人产品化的发展.聊天机器人系统可以看作是机器人产业与"互联网 +"的结合,符合国家的科研及产业化发展方向. 智能问答类的聊天机器人主要功能包括回答用户以自然语言形式

《中国人工智能学会通讯》——1.5 智能问答技术

1.5 智能问答技术 从早期的数字图书馆.专家系统到如今的搜索引擎,人们一直致力于追求快速.准确的信息获取方法.目前,网络上的数据资源浩如烟海.错综复杂,而用户的信息需求又千变万化.千姿百态,基于关键词组合的信息需求表示方式和基于浅层分析的语义分析这类传统的信息检索技术俨然不能满足当下用户的需求,智能问答技术通过对数据的深度加工和组织管理,以更自然的交互方式满足用户更精确的信息需求. 智能问答技术可以追溯到计算机诞生初期的上世纪五六十年代,其中,代表性的系统包括 Baseball [1]和 Lu

《中国人工智能学会通讯》——11.56 情境感知的移动用户个性化偏好 挖掘方法

11.56 情境感知的移动用户个性化偏好 挖掘方法 近年来,随着移动产业的高速发展,智能手机.平板电脑等移动设备已经成为了人们最重要的社交娱乐和信息获取媒介.与此同时,这些新型的移动设备都配备了许多高性能的情境传感器,例如GPS.3D 加速及光学传感器等.这些情境传感器能够捕获到来自于移动用户的丰富情境数据,从而帮助实现一系列基于情境感知的移动服务. 这些情境信息和相应的用户活动记录,均可以被移动设备记录成情境设备日志(Context Log),从而帮助我们深入挖掘和理解移动用户基于情境的个性化

《中国人工智能学会通讯》——9.12 集成学习中的挑战性问题及解决方法

9.12 集成学习中的挑战性问题及解决方法 然而,传统的集成学习算法,特别是聚类集成算法,在集成器成员选择.聚类结果融合.集成器参数优化等方面还存在一些亟待解决的科学问题(见图 4): ① 集成器存在冗余成员,影响集成的最终结果:② 聚类集成算法集成器中多个聚类结果的融合质量有待进一步提高:③ 没有考虑到集成器参数往往受到外在环境(如样本空间和属性空间)和内在环境(如集成器基础模型的参数和权重)的影响. Yu et al [17] 针对上述科学问题,围绕"集成学习理论与应用",从集成器