《中国人工智能学会通讯》——4.25 总结与展望

4.25 总结与展望

计算机的出现为人类科学技术的发展提供了十分强大的工具。随着计算机性能的不断提高,人们不仅希望它能够完成人类难以完成的计算工作,也希望它能够完成过去只有人类才能完成的一些工作。让机器具有类似于人的视觉注意功能是神经生物学、心理学、计算机视觉、图像处理、模式识别、人工智能等多个学科的共同问题。几十年来,各领域的研究者们从未停止过对视觉显著性的关注,并得出了很多具有代表意义的成果,但我们还远不能使机器像人一样“自然而然”的分配注意,进而像人一样进行视觉认知。然而,得益于对人的视觉认知机制日渐深入的理解,以及计算机科学技术的进步,计算驱动的视觉显著性分析技术也将不断成熟发展。目前而言,存在以下四个关键问题。

(1) 高层语义特征提取与表达的有效性。高层语义信息的合理建模和提取能有效地提高计算系统的智能性和有效性,这也将是视觉显著性分析方法取得更大进步的关键所在。目前而言,“语义鸿沟”仍是制约多媒体数据处理领域发展的瓶颈问题之一。

(2) 视觉显著性分析模型的学习能力。传统的视觉显著性分析方法大多都是基于非监督的模型,即对于给定的输入图像,使用预先设计好的模型来计算显著度图,导致所设计的算法对特定种类的数据缺乏适应能力,并不能很好地应对数据的固有特点。因此,能自适应地根据训练数据特点学习出相应模型,是显著性检测中面临的一个重要问题。目前来看,基于学习的视觉显著性分析方法已逐渐成为主流。

(3) 跨学科研究中的学科交叉深度。视觉显著性研究还属于跨学科研究的初步阶段,研究仅限于从本学科角度的动因出发,未能在多种学科中汲取有益的思路。如果在科学研究过程中集中聚焦问题本身,注重问题发现与解决的深度和广度,不仅能够比目前的跨学科研究更加突出对象的复杂性和研究活动的群体性,还能显著地放大实践效果。

(4) 视觉显著性分析结果的应用策略。在不同的应用情境中,人们所关注的视觉信息的类型有很大差异,对于分析结果的应用策略也不尽相同。现有工作中仅能看到有限几种应用情境下视觉显著性分析结果的作用,比如目标跟踪、图像压缩 / 缩放等。但实际上,各类视觉显著性分析方法还可以作为更多实际应用的良好基础。这些算法的应用潜力需要在未来的工作中进一步开发,以解决更多的具体问题。

时间: 2024-10-31 17:02:17

《中国人工智能学会通讯》——4.25 总结与展望的相关文章

《中国人工智能学会通讯》——2.29 未来展望

2.29 未来展望 综上所述,机器翻译研究 60 多年来的发展趋势是不断降低人在翻译过程中主导作用:基于规则的方法完全靠人编纂翻译规则:基于统计的方法能够从数据中自动学习翻译知识,但仍需要人来设计翻译过程的隐结构和特征:基于深度学习的方法则可以直接用神经网络描述整个翻译过程.近年来,端到端神经机器翻译成为最热门的研究领域,未来的研究方向可能集中在以下五个方面. ● 架构:如何设计表达能力更强的新架构?近期提出的神经网络图灵机[15]和记忆网络[16]可能成为下一个关键技术. ● 训练:如何降低训

《中国人工智能学会通讯》——7.14 研究展望

7.14 研究展望 基于上面的讨论,可以看到目前神经网络模型(特别是深度模型)在推荐系统中的应用还是处于很初步的阶段,在未来会有更多.更广泛的尝试.下面对于未来四个可能的研究方向进行简要介绍. 结构化神经网络模型 目前在推荐系统已发表的学术论文中,比较成功的神经网络模型还是基于多层感知器架构进行变型的模型,很少有相关公开的科研成果报道基于结构化的神经网络模型取得了显著提高.这里结构化神经网络主要包括基于序列的循环神经网络或者树结构的递归神经网络.目前推荐系统面临的数据附加信息不断增加,因此原始的

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——Master虽优势较多 但仍有缺陷

近日,Master 在各大围棋网站横扫顶尖职业棋手,随后,谷歌 DeepMind 创始人德米什 • 哈萨比斯在 Twitter 上发布消息,证实了 Master 是 AlphaGo 的升级版.众所周知,围棋困难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆:同时状态空间大,也没有全局的结构.这两点加起来,迫使目前计算机只能用穷举法,并且因此进展缓慢.但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的.这些规律远远不是几条简单公式所能概括,但所需的信息量