《计算机视觉度量深入解析》—译后记

译后记
计算机视觉度量深入解析
计算机视觉是使计算机能够模拟生物视觉的一门学科,更具体来讲,就是让计算机代替人眼对目标进行识别与分类、跟踪目标和理解场景的一门学科,它是人工智能的重要分支。计算机视觉是一门综合性的学科,它涉及计算机科学与工程、信号处理、光学、应用数学、统计学、神经生理学和认知科学等。

特征描述子是计算机视觉的研究重点,它主要用来提取图像中的特征,而所提取特征的好坏直接影响计算机视觉的后续操作(如目标识别)结果。目前特征描述子的种类有上百个。

本书是读者理解特征描述子的不二选择。它首先介绍了图像的获取与表示,这部分重点介绍了传感器的数据处理与校正、最新的3D深度处理技术,这些内容是计算机视觉的基础。对于不同类型的特征描述子,需要采用不同的图像预处理算法来对传感器数据进行增强、滤波等操作,第2章全面介绍了与各种特征描述子相关的图像预处理操作。有了这两章的基础知识后,就可以介绍具体的特征描述子。特征描述子可分为全局描述子、区域描述子和局部描述子三类。第3章介绍了四大类全局描述子和区域描述子,它们分别是用于特征描述的纹理区域度量、共生矩阵和Haralick特征、用于描述纹理的统计区域度量以及用于描述特征的基空间度量。第4章介绍了局部特征的设计与分类,这一章从局部特征的定义和属性出发,对局部描述子的表示、形态拓扑以及判别性进行了介绍,同时还介绍针对稀疏局部特征的搜索策略。在对各种特征描述子有了基本的了解后,第5章从鲁棒性属性和计算机视觉度量来对特征描述子进行分类,从而建立了特征描述子的分类学,这也是本书的一大贡献之一。在所建立的分类标准的基础上,第6章对各种特征描述子的属性进行了详细介绍。若要测试特征描述子的属性,需要有基准数据集,第7章介绍了如何根据需要来建立基准数据集。第8章通过4个不同的计算机视觉应用来介绍如何设计计算机视觉流程以及与计算机视觉相关的优化方法,这一章是对前面7章内容的综合应用。

本书的第4章、第6章、第8章由重庆工商大学计算机科学与信息工程学院的刘波博士翻译,第1章、第5章、第7章由河南工业大学信息科学与工程学院的靳小波博士翻译,第2章、第3章以及附录由河南工业大学信息科学与工程学院的于俊伟博士翻译。刘波负责全书的审稿工作。

翻译本书的过程也是我们学习的过程,虽然辛苦但也不觉得累。为了力求做到专业词汇准确权威、内容正确、意译部分既不失原著意境又无偏差,我们在翻译过程中查阅了大量相关资料。但由于时间和能力有很,书中内容难免出现差错。若有问题,读者可通过电子邮件liubo7971@163.com或jxb9801@126.com与我们联系,也可以加入QQ群434580938进行交流探讨。本书翻译的勘误信息会发布在http://www.epubit.com.cn/book/details/4227

本书的翻译过程得到如下项目资助:(1)重庆市教委研究项目“多核正则化机器学习理论研究”,项目号:KJ130709;(2)重庆工商大学研究项目“基于多核学习的高维数据分析研究”,项目号:2013-56-09;(3)大数据稀疏表示判别字典学习及其应用技术研究,项目号:KJ1400612。(4)自然科学基金项目“作弊环境下的网页排序问题研究”,项目号:61103138;(5)河南工业大学 河南省省属高校基本科研业务费专项资金;(6)自然科学基金项目“基于多尺度几何分析的三维表面稀疏表示和快速重构方法研究”,项目号:61300123。

本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。

时间: 2024-08-13 11:15:38

《计算机视觉度量深入解析》—译后记的相关文章

《计算机视觉度量深入解析》目录—导读

版权 计算机视觉度量深入解析 • 著 [美]Scott Krig 译 刘 波 靳小波 于俊伟 责任编辑 王峰松 • 人民邮电出版社出版发行 北京市丰台区成寿寺路11号 邮编 100164 电子邮件 315@ptpress.com.cn 网址 http://www.ptpress.com.cn • 读者服务热线:(010)81055410 反盗版热线:(010)81055315 版权声明 计算机视觉度量深入解析 Computer Vision Metrics: Survey, Taxonomy,

《计算机视觉度量深入解析》—第1章1.3节三维深度处理

1.3 三维深度处理 由于历史原因,在深入讨论深度感知和相关方法时,会同时涉及到一些专用词汇和它们的缩写词,所以本节会提到一些相互重叠的主题.前面的表1-1从上物理方法对深度感知进行了简要介绍.不管是哪种深度感知方法,它们之间有许多相似之处.考虑到摄像机系统的校准精度.景深的几何模型.深度数据的测量精度.深度数据中存在的任何噪声以及预期应用,深度信息的后处理是至关重要的. 本节会介绍几个深度感知的主题,这些主题之间相互关联,包括几种主题. 稀疏深度感知方法 稠密深度感知方法 光流 同步定位和映射

《计算机视觉度量深入解析》—第1章1.5节总结

1.5 总结本章介绍了图像感知方法和传感器的图像处理方法,它们是视觉流程的第一步.本章还介绍了实际中可行的一些图像传感器技术,并着眼于图像预处理,它对于从图像数据中获取尽可能多的信息是很有用的,因为图像感知方法往往决定了所需的图像预处理(更多的图像预处理会在第2章讨论).本章还讨论了用于二维和三维成像的传感器配置,以及用于计算成像所广泛使用的摄像机配置,以便在获取数据之后创建新图像(如HDR图像和图像的再聚焦).这章也讨论了深度成像方法(包括立体方法和飞行时间方法),因为移动设备为消费者的应用越

《计算机视觉度量深入解析》—第1章1.4节三维表示:体元、深度图、网格和点云

1.4 三维表示:体元.深度图.网格和点云深度信息会根据需要采用各种可转化的格式进行表示和存储.这里总结了一些常见格式(如图1-23所示). 图1-23 各种三维深度格式.Zernike多项式的效果图,从左图到右图分别是:深度图.使用三维四边形绘制的多边形网格.点云渲染(相当于体元)在深度格式之间进行转换的能力对不同的算法而言是有必要的,并且也非常容易实现.常见的三维深度格式包括以下几种. 二维像素阵列,三维深度图:二维像素阵列是二维图像在内存中的缺省格式,它对许多处理操作而言是一种比较自然的存

[译]C语言协程

C语言协程 by Simon Tatham 原文链接:http://www.chiark.greenend.org.uk/~sgtatham/coroutines.html 引言 为大型程序设计一个良好的结构通常是一件困难的事情.其中一个经常出现的问题是:如果你有一段代码产生数据,另一段代码消费数据,那么谁应该作为调用者,谁应该作为被调用者? 下面是一段很简单的Run-Length(游程编码)解压缩代码(Decompressor): /* Decompression code */ while

解析MYSQL BINLOG 二进制格式(6)--UPDATE_ROW_EVENT/DELETE_ROW_EVENT

原创:转载请说明出处谢谢! 上接 http://blog.itpub.net/7728585/viewspace-2133188/ 解析MYSQL BINLOG 二进制格式(1)--准备工作  http://blog.itpub.net/7728585/viewspace-2133189/ 解析MYSQL BINLOG 二进制格式(2)--FORMAT_DESCRIPTION_EVENT  http://blog.itpub.net/7728585/viewspace-2133321/ 解析MY

Web设计之道

道之于90年代恰如禅之于70年代.事无巨细,皆可受之道,或推之道.Web 设计之事,虽小技,然而通览道德经,我们仍然会发现其中包含深刻的道理.道是哲学,象佛,是一种生活与处世的方式,来自古老的<道德经>,这部拥有81个章节的晦涩经文涵盖了人类的经验,但它始终讲述一个主题,和谐. 过去几年,或好或坏,我的生活与 Style Sheet 有关,我为之编写软件,教程与指南:回答了数不清的问题,通过新闻组或电子邮件:通过 The Web Standards Project 推而广之.慢慢的,我对 We

Visual Basic 2005在语言上的增强(十三)显式的数组范围及小结

visual|数组 显式的数组范围 你现在可以使用显式的数组范围来声明数组,这样的声明更加清晰可读了:Dim a(10) As Integer '旧方式Dim b(0 To 10) As Integer '新方式 Visual Basic中的数组范围仍然是以零为起始,所以如果你想声明一个不是以零为起始范围的数组,你就会得到一个编译器错误. 小结 Visual Basic 2005语言获得了一些重要的特性以及诸多细微的增强,这些都极大地提高了它的易用性和开发人员的生产效率.这个语言变得更加完善,并

如何破解YouTube视频推荐算法

如果你是某个发行渠道(比如电影.戏剧.电视节目.网络视频)的内容工作者,那么内容的成败就取决于发行机制的运转逻辑.比如说,你制作了一档电视节目,你很想它能火起来,那么你就得知道该在哪里切入广告,怎么宣传节目,上哪个频道播放,所选的频道能被多少家庭收看,等等,诸如此类. 如果你的发行渠道是YouTube,那么你最应该搞清楚的是YouTube的算法是怎么工作的.然而,全天下所有由算法来运营的平台,要搞清楚这一点那不是一般的困难. YouTube没有把他们算法用到的变量公之于众.要搞清楚其算法的运转原