2017年5月21日至22日,由中国人工智能学会、中国中文信息学会主办的“2017全球人工智能技术大会”将在北京国家会议中心拉开序幕。本次大会为中国人工智能权威大会,以“交叉、融合、相生、共赢”为主题,将汇聚多位全球人工智能学术界和产业界著名学者、顶级专家和业界精英。
为了探寻这次国际顶尖AI大会的风采,大会组委会走访了本次大会“程序委员会”主席,微软亚洲研究院常务副院长,首席研究员,ACL候任总裁周明,他对于自然语言理解, 人工智能产业结构以及自然语言处理的未来的话题给出了独特的见解。以下是他分享的主要观点:
自然语言理解角度的人工智能的定义
人工智能肯定是每个人都有一个自己的定义。我是站在自然语言理解的角度来给它一个定义的。我认为人工智能就是一组关键的技术,使得电脑或者设备具有听、说、读、写、问、译等方面的能力,听就是语言识别,说就是语言合成,读就是阅读理解,写就是自然写作,问就是提出问题或者回答问题,译就是翻译。
如果电脑或者设备具有这样的能力,它就可以支撑其做智能的人机接口,或者提供无障碍翻译系统。支持现在流行的无人驾驶汽车或者智能家居、智能设备等方面的应用,或者出国旅游和同声翻译。
自然语言处理本身它的作用和价值
自然语言处理它是这样的一个技术,就是给定人类的语言,有时候是一句话或者一篇文章,或者一个网页,分析出这个语言中包含的主要内容,出现了哪些词,每一个词是什么意思,句子结构是什么;再进一步,谁做了什么事,在什么时候,什么结果,再进一步还有它的观点是什么?表达的情感是正面的、负面的,还是悲哀的、喜怒、愤怒的等等。然后基于这些理解的结果来支持一些应用,虽然不同的应用所涉及的语言理解的程度可以不同。常见的应用包括机器翻译:把一种语言理解的结果翻译成另外一种语言;搜索:给定用户的查询表达,理解用户的查询表达到语料库或者网页中,找到最合适的答案或者所在的网页;阅读理解: 就是让机器扫描了这篇文章或者网页之后,机器可自动生成关于一些问题,或者针对问题,机器可以基于文本理解的结果给出精准的回答;
我觉得如果自然语言能够把这一系列技术都做出来,将来就有很多的重要的用途。像语言翻译、语言助手,以及更下一代的搜索引擎都可得到长足的支持。
人工智能两种模式思维
一种是说模拟人脑的结构,如果我们对人脑的机理研究的比较清晰的话,就可以把有些机制加入到我们学习模块里,从而改进学习机能。但是目前这方面的进展似乎并不那么明显;
第二种,利用大数据做深度学习来做一个黑箱式的学习,利用大数据反映出来的从输入到输出的映射,自动学习数据内部的规律。但是所采取的神经网络架构不一定完全跟人脑机理完全一致,只不过这从结果上来看跟人类的能力可以类比。目前集中在如何获得大数据、如何提高学习能力,如何提高学习效率.这是目前的一个研究主流。
当然我们不排除未来随着人们对人脑机理更深的了解,会把一些新的发现融入到神经网络或者机器学习里面去,然后更有效的利用数据来提高学习的效果。但是这件事目前来讲还在探索之中。
人工智能产业的结构性层面
人工智能的产业的结构,我的认为是这样的:第一层是数据层。首先要做好包括大的数据获取、存储、以及基于大数据的大数据信息的抽取和知识的获取,这是数据层;
第二层学习层,利用强大的计算能力,支持利用大规模数据来建立模型包括机器学习和深度学习的模型,来发现数据中的规律,使得系统可对预期的输入获得预期的输出。
第三层就是应用层。基于这些机器学习或者深度学习所训练的模型,来支撑一些可以落地的应用,比如我刚才说到的听、说、读、写、问、译这些问题,或者在智能家居、智能汽车等方面人机接口。
这样逐层开展起来,使它每一层互相衔接。而且在任何一个阶段都可以提供一些方便的技术接口的支持,便于维护、更新、管理和升级。
深度学习现在对自然语言贡献
第一个,表达字符串或者句子、篇章的语义(embedding),在此基础上计算词汇、句子之间的语义距离,一种典型的做法是用卷积神经网络来做;
第二个,对一个输入串进行某种序列标注或者序列变换。比如说机器翻译就是某一种意义上的序列变换。一种典型的做法是通过循环神经网络的编码解码机制来做。
自然语言处理的未来
我想举两个例子,也是我所从事的领域来说明自然语言的未来。
第一个是语音翻译。它提供语音对语音的直接翻译,你可以设想我们出国的时候,即使你不懂某一国家的语言,你也可以跟本地人进行自如的沟通。你可以询问,跟他聊天,看当地的一些介绍,买火车票、住旅馆、在餐馆吃饭,一点障碍都没有,我觉得这是一件非常了不起的事;
第二件事,语音助手。我们早上起来跟语言助手说话,了解当天新闻、股票,了解今天的日程,它都会很方便地告诉你。然后你可安排它帮你做一些事情,比如买个火车票、订一个会议室,安排一些跟重要贵宾的会见。你告诉语音助手,它就帮你把这些事安排出来了,你就可以腾出时间做一些你认为更加重要的事情。
我个人认为两件事不是一个梦想,都是目前正在发生的一些事情,只不过还没有那么好,我们需要耐心地一点一点把它做得更好。
本文来源于"中国人工智能学会",原文发表时间" 2017-05-09 "