如何搞研究?我想是仁者见仁,智者见智。我认为,除了许多个人的因素之外,外部的激励因素也是必不可少的。在这点上,中国计算机学会(CCF)就做得很好。每年,CCF都会选出该年度的“优秀博士论文”,并给予一定的奖励。被选中的论文会被学术界的很多人阅读,这既扩大了作者的知名度,又传播了自己的科学理念。
最近,我阅读了“2011年CCF优秀博士学位论文”,受益颇多。2011年,CCF一共奖励了9篇优秀的博士学位论文,分别来自9个不同的学校,包括:国防科技大学、山西大学、复旦大学、清华大学、北京交通大学、北京大学、浙江大学、南京大学和中国科技大学。内容涉及:演化算法、网格、漏洞挖掘、多媒体内容搜索、互联网图像、用户数据的隐私性与安全性保护、复杂数据、编译优化技术等。
以下,我将分别介绍各篇论文的主要内容及创新点,并发表一下自己的看法。
(一) 论文主要内容及创新点
在《演化算法的计算复杂性研究》中,作者从多个方面开展演化算法的计算复杂性研究,主要贡献包括:1)研究了种群经典演化算法的计算复杂性;2)研究了一类新型演化算法(分布评估算法)的计算复杂性;3)研究了在动态优化问题背景下随时间可变的变异率策略(随着算法的运行,变异率参数可发生变化)对经典演化算法性能的影响。
在《演化计算理论分析与学习算法的研究》中,作者对演化算法的理论基础进行了研究,并在此基础上提出了一种基于演化算法的新型学习算法,主要工作包括:1)提出一种基于收敛率的演化算法复杂度分析方法,并对多种演化算法在困难问题上的复杂度下界进行了分析;2)提出一种基于马氏链交换的演化算法复杂度分析方法,并对交叉算子和种群对演化算法性能的影响进行了分析;3)提出一种基于隔离函数的演化算法优化性能分析方法,建立了取得优化近似解的一般条件;4)提出演化Boosting学习框架及多核算法,并用于求解单帧正类扩张学习问题。
在《高质量大规模网格形变技术》中,作者围绕网格形变中的数值计算方法,分析现有方法的不足,针对性地提出了一系列具有很大创新性的高效数值计算方法,形成了新的网格形变技术。论文的主要贡献有:1)提出“层叠优化策略”,通过开启多条优化路径,对包含多个非线性形变约束的形变能量进行有效优化;2)提出“动态蒙皮”技术,在GPU上实现了实时地给蒙皮网格形变添加物理动态效果,使形变结果的细节更具真实性;3)提出“流多分辨率网格”算法,高效地求解定义在不规则核外网格模型上的泊松方程,实现了对核外网格模型的梯度域几何操作(如网格形变,编辑,拼接,光顺等)。
在《面向二进制程序的漏洞挖掘关键技术研究》中,作者重点研究了动态漏洞挖掘过程中如何加强畸形样本在程序执行中的纵深传递和静态漏洞挖掘过程中漏洞建模与空间遍历方法。本文主要贡献包括:1)首次提出校验和(checksum)感知的模糊测试方法;2)提出了一种基于roBDD的离线细颗粒度污点分析方法;3)为进一步提高模糊测试的挖掘效率,提出了一种基于细颗粒度污点分析(Fine-grained Taint Analysis)的导向性样本生成方法;4)为进一步加强模糊测试的安全分析能力,提出了一种基于混合符号执行(Conclic
Execution)的智能样本生成方法;5)提出了一种面向脆弱性包络(Vulnerable Component)的整数溢出漏洞静态挖掘方法;6)设计实现了软件安全漏洞动态挖掘系统TaintScope和整数溢出漏洞静态挖掘系统IntScope,并应用这些系统在Microsoft、Adobe、Google等著名IT公司的产品中发现数十个零日漏洞。
在《基于信息融合的多媒体内容搜索》中,作者对当前多媒体搜索系统中存在的一些问题进行了深入的研究,并试图从多媒体内容分析及融合的角度加以解决,所取得的主要创新性研究成果包括:1)提出了基于多视角协同学习的交互式多媒体搜索方法;2)提出了基于多模态信息融合的视频重排序方法;3)提出了基于语义关联信息融合的高层概念检测方法;4)提出了基于帧融合的拷贝检测方法。
在《基于图形交互的互联网图像合成及绘制》中,作者围绕基于图形交互的互联网图像的分析、合成与绘制,研究了互联网图像的特征分析和语义单元提取,互联网图像的有序组织和语义索引数据库构建,网络海量图像的高质量合成方法等难点问题,并实现了基于互联网的图像合成系统。论文的工作包括:1)提出了一种基于用户草图和特征分析过滤算法的互联网海量图像提取方法;2)提出了一种基于人体检测和级联姿态匹配的人物角色图像数据库构建方法;3)提出了基于混合梯度场和混合边界条件的图像融合方法;4)实现了基于互联网过滤和图像库构建的图像合成系统。
在《公共云计算环境下用户数据的隐私性与安全性保护》中,作者的主要贡献包括:1)提出了用户数据在云服务器端从生成到销毁全过程完整的隐私保护技术,并且威胁模型达到实用意义;2)提出了用户数据在云服务器端的强制自我销毁技术,能够保证在云计算平台受到恶意攻击的情况下用户数据仍然能够按时销毁;3)针对基于虚拟机监控器的用户进程保护系统,提出了虚拟机安全动态迁移协议,保证用户数据在迁移的全过程的隐私性和完整性;4)在虚拟机监控器不受信任的前提下,首次提出通过运行在最高特权级的资源监控层来保护整个用户虚拟机的数据;5)借助在CPU中加入安全模块,首次提出基于CPU对整个用户虚拟机的数据的隐私性与完整性实施保护。
在《复杂数据的粒化机理与数据建模》中,作者在信息粒化、粒化不确定性、建模策略与模型选择四个数据建模阶段都获得了重要的研究成果。获得的主要研究成果和创新概括如下:1)完善了复杂数据的信息粒化方法与算法体系,深刻揭示了复杂数据的粒化机理,为基于粒化机理的复杂数据建模提供了基础;2)建立了粒空间的运算方法,从代数角度和几何角度刻画了粒空间的结构特征;3)借鉴人类的粒化认知能力,发展了基于多粒度认知的、基于动态粒度认知的以及基于序化粒度认知的三大类复杂数据建模理论与方法,极大地推动了基于粒化认知的数据建模发展;4)建立了基于整体决策性能评价的模型选择方法,为知识发现的模型选择提供了理论依据与技术支持。
在《面向软件管理片上存储器的编译优化技术研究》中,作者重点研究了面向软件管理片上存储器的编译优化问题。本文的主要工作和创新概述如下:1)提出了基于置换图着色的便笺存储器分配算法;2)提出了基于存储器着色的流寄存器文件分配框架;3)提出了基于最佳有向路径寻找的流寄存器文件分配算法;4)提出了基于层次图着色的软件管理多级存储层次分配算法。
(二) 个人看法
可以看出,论文的题材非常的广泛,涉及到计算机理论、算法、网络安全、图像处理、网格和云计算等。
各篇论文的相似之处包括:1)创新点都很多,而且大多都是首次提出算法;2)都涉及到比较深的数学理论,用数学支持的应用就更具备说服力;3)每一篇论文的分析都很详尽,有的包括定理的证明,有的包括算法的伪代码,没有空洞的形容词;4)论文后的参考文献很多,可见都是收集了大量的材料,进行了精心的准备,有很大量的数据、理论以及研究的支撑。
当然,论文之间的差别还是存在的,包括:1)有关算法的论文主要是涉及到数学理论以及理论的证明,极少谈到应用;2)有关图像处理的论文就重在算法的应用,用数学这个武器去处理图像;3)有关网络安全、网格和云计算方面的论文是学术界研究的热点,着重于解决实际问题;4)部分论文强调数学模型,部分论文强调算法,而有些论文则强调仿真和实验。
从这9篇论文中,还可以看出科学界所赞赏的研究方法,包括:建立数学模型,做大量仿真实验,对理论进行应用等。
此外,从作者所处的学校可以看出,名校的博士生居多,当然也用少量非名校的。因此,事在人为,只要肯钻研、选好题、做事坚持不懈,那么大家都是有机会上这个排行榜的。
向优秀的人学习,不是看他们有多优秀,而是要让自己变得和他们一样优秀,甚至更优秀,这也就是所谓的“站在巨人的肩膀上”!