《计算机视觉度量深入解析》—译后记

译后记
计算机视觉度量深入解析
计算机视觉是使计算机能够模拟生物视觉的一门学科，更具体来讲，就是让计算机代替人眼对目标进行识别与分类、跟踪目标和理解场景的一门学科，它是人工智能的重要分支。计算机视觉是一门综合性的学科，它涉及计算机科学与工程、信号处理、光学、应用数学、统计学、神经生理学和认知科学等。

特征描述子是计算机视觉的研究重点，它主要用来提取图像中的特征，而所提取特征的好坏直接影响计算机视觉的后续操作（如目标识别）结果。目前特征描述子的种类有上百个。

本书是读者理解特征描述子的不二选择。它首先介绍了图像的获取与表示，这部分重点介绍了传感器的数据处理与校正、最新的3D深度处理技术，这些内容是计算机视觉的基础。对于不同类型的特征描述子，需要采用不同的图像预处理算法来对传感器数据进行增强、滤波等操作，第2章全面介绍了与各种特征描述子相关的图像预处理操作。有了这两章的基础知识后，就可以介绍具体的特征描述子。特征描述子可分为全局描述子、区域描述子和局部描述子三类。第3章介绍了四大类全局描述子和区域描述子，它们分别是用于特征描述的纹理区域度量、共生矩阵和Haralick特征、用于描述纹理的统计区域度量以及用于描述特征的基空间度量。第4章介绍了局部特征的设计与分类，这一章从局部特征的定义和属性出发，对局部描述子的表示、形态拓扑以及判别性进行了介绍，同时还介绍针对稀疏局部特征的搜索策略。在对各种特征描述子有了基本的了解后，第5章从鲁棒性属性和计算机视觉度量来对特征描述子进行分类，从而建立了特征描述子的分类学，这也是本书的一大贡献之一。在所建立的分类标准的基础上，第6章对各种特征描述子的属性进行了详细介绍。若要测试特征描述子的属性，需要有基准数据集，第7章介绍了如何根据需要来建立基准数据集。第8章通过4个不同的计算机视觉应用来介绍如何设计计算机视觉流程以及与计算机视觉相关的优化方法，这一章是对前面7章内容的综合应用。

本书的第4章、第6章、第8章由重庆工商大学计算机科学与信息工程学院的刘波博士翻译，第1章、第5章、第7章由河南工业大学信息科学与工程学院的靳小波博士翻译，第2章、第3章以及附录由河南工业大学信息科学与工程学院的于俊伟博士翻译。刘波负责全书的审稿工作。

翻译本书的过程也是我们学习的过程，虽然辛苦但也不觉得累。为了力求做到专业词汇准确权威、内容正确、意译部分既不失原著意境又无偏差，我们在翻译过程中查阅了大量相关资料。但由于时间和能力有很，书中内容难免出现差错。若有问题，读者可通过电子邮件liubo7971@163.com或jxb9801@126.com与我们联系，也可以加入QQ群434580938进行交流探讨。本书翻译的勘误信息会发布在http://www.epubit.com.cn/book/details/4227。

本书的翻译过程得到如下项目资助：（1）重庆市教委研究项目“多核正则化机器学习理论研究”，项目号：KJ130709；（2）重庆工商大学研究项目“基于多核学习的高维数据分析研究”，项目号：2013-56-09；（3）大数据稀疏表示判别字典学习及其应用技术研究，项目号：KJ1400612。（4）自然科学基金项目“作弊环境下的网页排序问题研究”，项目号：61103138；（5）河南工业大学河南省省属高校基本科研业务费专项资金；（6）自然科学基金项目“基于多尺度几何分析的三维表面稀疏表示和快速重构方法研究”，项目号：61300123。

本文仅用于学习和交流目的，不代表异步社区观点。非商业转载请注明作译者、出处，并保留本文的原始链接。

时间： 2024-08-13 11:15:38

《计算机视觉度量深入解析》—译后记

《计算机视觉度量深入解析》—译后记的相关文章

《计算机视觉度量深入解析》目录—导读

《计算机视觉度量深入解析》—第1章1.3节三维深度处理

《计算机视觉度量深入解析》—第1章1.5节总结

《计算机视觉度量深入解析》—第1章1.4节三维表示：体元、深度图、网格和点云

[译]C语言协程

解析MYSQL BINLOG 二进制格式(6)--UPDATE_ROW_EVENT/DELETE_ROW_EVENT

Web设计之道

Visual Basic 2005在语言上的增强（十三）显式的数组范围及小结

如何破解YouTube视频推荐算法