4.25 总结与展望
计算机的出现为人类科学技术的发展提供了十分强大的工具。随着计算机性能的不断提高,人们不仅希望它能够完成人类难以完成的计算工作,也希望它能够完成过去只有人类才能完成的一些工作。让机器具有类似于人的视觉注意功能是神经生物学、心理学、计算机视觉、图像处理、模式识别、人工智能等多个学科的共同问题。几十年来,各领域的研究者们从未停止过对视觉显著性的关注,并得出了很多具有代表意义的成果,但我们还远不能使机器像人一样“自然而然”的分配注意,进而像人一样进行视觉认知。然而,得益于对人的视觉认知机制日渐深入的理解,以及计算机科学技术的进步,计算驱动的视觉显著性分析技术也将不断成熟发展。目前而言,存在以下四个关键问题。
(1) 高层语义特征提取与表达的有效性。高层语义信息的合理建模和提取能有效地提高计算系统的智能性和有效性,这也将是视觉显著性分析方法取得更大进步的关键所在。目前而言,“语义鸿沟”仍是制约多媒体数据处理领域发展的瓶颈问题之一。
(2) 视觉显著性分析模型的学习能力。传统的视觉显著性分析方法大多都是基于非监督的模型,即对于给定的输入图像,使用预先设计好的模型来计算显著度图,导致所设计的算法对特定种类的数据缺乏适应能力,并不能很好地应对数据的固有特点。因此,能自适应地根据训练数据特点学习出相应模型,是显著性检测中面临的一个重要问题。目前来看,基于学习的视觉显著性分析方法已逐渐成为主流。
(3) 跨学科研究中的学科交叉深度。视觉显著性研究还属于跨学科研究的初步阶段,研究仅限于从本学科角度的动因出发,未能在多种学科中汲取有益的思路。如果在科学研究过程中集中聚焦问题本身,注重问题发现与解决的深度和广度,不仅能够比目前的跨学科研究更加突出对象的复杂性和研究活动的群体性,还能显著地放大实践效果。
(4) 视觉显著性分析结果的应用策略。在不同的应用情境中,人们所关注的视觉信息的类型有很大差异,对于分析结果的应用策略也不尽相同。现有工作中仅能看到有限几种应用情境下视觉显著性分析结果的作用,比如目标跟踪、图像压缩 / 缩放等。但实际上,各类视觉显著性分析方法还可以作为更多实际应用的良好基础。这些算法的应用潜力需要在未来的工作中进一步开发,以解决更多的具体问题。