作为人工智能皇冠上的明珠,自然语言理解不断吸引着学术界与产业界的目光。然而,在这个极具挑战性领域,若干理论问题和技术难题尚未得到根本解决,而现实生活和社会中又面临着巨大的应用需求。如何通过学术界和产业界的共同努力,让其在实际应用中发挥更大的作用,在研究与应用的相互反馈中共同进步呢?
为此,在即将于 7 月 22 - 23 日举行的中国人工智能大会(CCAI 2017)上,中国科学院自动化研究所研究员宗成庆博士牵头组织了一场以“语言智能与应用”为主题的专题论坛,邀请了中国科学技术大学计算机学院副院长、CCF 会士陈恩红教授,阿里云智能语音交互技术总监初敏博士,香港中文大学工程学院副院长黄锦辉教授,北京云知声信息技术有限公司创始人、董事长、CTO 梁家恩博士,奇点机智联合创始人、ACL Fellow 林德康博士,哈尔滨工业大学博士生导师刘挺教授和上海交通大学计算机系研究员、思必驰公司首席科学家俞凯博士七位嘉宾莅临现场,共同围绕着“目前自然语言处理(NLP)面临的问题”、“深度学习在 NLP 中的局限性与可能的黑马”、“学术界与企业界各自对 NLP 技术的关注焦点和预期”、“产学研合作的理想模式”等若干问题展开深度讨论,希望在讨论过程中所闪现的真知灼见能够对正在进行相关领域研究与技术开发的从业者提供有益的参考。
作为本次“语言智能与应用”论坛的主席,宗成庆研究员在自然语言处理、机器翻译和人机对话等领域拥有多年的研究经验和丰富的技术积累。在大会召开前夕,我们就语言智能相关研究中的若干问题对他进行了先行采访,他为我们答疑解惑,一解当下之急。
宗成庆,中国科学院自动化研究所研究员、博士生导师,主要从事自然语言处理、机器翻译和人机对话系统等相关研究,主持国家项目 10 余项,发表论文 200 余篇,出版学术专著和译著各一部。目前担任国际计算语言学委员会(ICCL)委员、亚洲自然语言处理联合会(AFNLP)副主席、中国中文信息学会副理事长、中国人工智能学会理事和 CCF 中文信息技术专委会副主任等学术职务。
问:当前在语言智能方面我们面临着哪些主要挑战?对此又该如何攻克?
宗成庆:语音和文字是语言的两个基本属性,我们通常所说的语言包括声音和文字两种不同的表现形式。所谓的语言智能,在广义上涵盖所有以语音和文本为主要处理对象的科学问题和应用技术。对于不同的应用任务而言,所面临的挑战也不一样,例如,文本机器翻译和人机对话系统,各有各的难点,不能一概而论,但无论什么样的任务,语义理解是最核心、最本质的问题。
在语言智能研究领域,目前业界与学界采用的技术手段和方法并无本质区别,有的方法原创自学界,而有的技术来自业界,学界和业界已经成为“同一战壕里的战友”,就像现代战争,难以区分真正的前线和后方一样,双方面对共同的“敌人”。如果说有所区别的话,业界拥有更多的数据和计算资源,而学界更多的是在理论方法和模型上追求完美,双方的协作已经成为共同发展的必然趋势。
问:那么目前在语言智能方面已经有哪些能够让大家学习与借鉴的成功案例?在下一阶段,语言智能在行业应用方面又有着怎样的突破口?对于人工智能的快速发展,作为人类的我们总会产生一种即将失业的恐慌,比如对于自然语言理解研究的深入以及应用普及,诸如同声传译、语言速录师等的从业人员是否会面临将被淘汰的窘境?
宗成庆:首先,在语言智能方面,现在已经有了许多相当成熟的落地项目,譬如本次论坛我们邀请到的初敏、梁家恩、林德康和俞凯以及他们的公司(阿里云、云知声、奇点机智、思必驰),都已经研发出在语言智能方面的成功产品,此外,Google、微软、百度研发的机器翻译系统,以及“出门问问”系列产品都是很好的例子。
其次,对于探讨在业界应用的突破口,实际上并非我个人能力所能预测,但随着机器学习和自然语言处理研究的深入,以及计算机硬件性能的快速提高,智能语言技术在很多特定领域趋于实用已经是不争的事实。
人工智能的高速发展加快了行业的变迁,但关于“人类是否即将失业”的讨论却也一直不绝于耳。在此,我个人并不想用“失业”这个词把形势说得那么严峻,我也不相信某一项技术可以使人彻底没事干。我认为,机器的确在很多任务上可以替代人工做大量工作,减轻人的劳动强度,或者大幅度减少人工的需求量,但对于一些需要高度精准处理的任务,完全不需要人的参与恐怕并不现实,同传和速记也是如此。任何夸大和忽悠某一项技术的做法,都是不负责任的。
问:CCAI 大会即将在 7 月与大家见面,每年大会论坛的主题都会紧紧围绕着当前的热点趋势进行设置。那么,作为连续三届的重要参与者和见证者,尤其是今年的语言智能与应用论坛主席,对于组织这一论坛,您的出发点是什么?
宗成庆:近年来,人工智能研究获得了较大的突破和进展,而自然语言理解作为人工智能皇冠上的明珠,不断吸引着越来越多的学术界和产业界的目光,很多挑战性的理论问题没有得到根本性解决,而现实生活和社会中又面临着巨大的应用需求。
因此,我们选定“语言智能与应用”作为论坛主题,一方面是希望更多从事人工智能、自然语言理解和机器学习等相关理论方法研究的学者关注语言智能的挑战性问题;另一方面,希望产业界朋友从实际应用的角度,提出对语言智能技术的具体需求和预期。学界和业界共同探讨在自然语言理解技术尚不成熟,理论体系尚未建立,技术性能仍有待于提高的情况下,如何让其在实际应用中发挥更大的作用,在研究和应用的相互反馈中共同进步。
问:我们可以看到,本次论坛所邀请的对话嘉宾,既有来自学术界的顶级专家,也有来自产业界资深大牛,这样的对话组合又会迸发出怎样的火花?您希望通过此次讨论能够为听众带来怎样的价值启示?
宗成庆:学术界和产业界的朋友往往对同一个问题有不同的看法和观点。学界更多地看重理论方法和模型是否完美、性能是否能够进一步提升,而业界则更多地关注技术在多大程度上可以满足用户和市场的需求、成本是多少,二者有共同的地方,也有彼此矛盾的地方,那么,如何找到二者的和谐和统一,如何通过头脑风暴相互启发,为学界和业界提供可借鉴的思路,便是本论坛发起的初衷。
最后,我真心地期待能够有更多的朋友来到大会现场一起互动。当然,想要通过一个论坛就能够彻底解决参会者所面临的困惑和难题是不可能的,恐怕现在也没有哪个会议能有如此神奇的功效,但我相信,每一位参会者都能够在思维的碰撞中大获裨益。
7月22-23日,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN承办,阿里云作为独家直播合作伙伴的2017中国人工智能大会(CCAI 2017)将于中国杭州举办,预计将有2000多位技术精英和专业人士参加此次盛会。本届CCAI由中国科学院院士谭铁牛、阿里巴巴技术委员会主席王坚、香港科技大学计算机系主任杨强、蚂蚁金服首席数据科学家漆远、南京大学教授周志华共同甄选本年度海内外最值得关注的学术进展案例。
其中,语言智能与应用论坛将在会议第一天的下午举行,欢迎大家访问大会官网立即抢票,来到大会现场,与宗老师等 8 位专家一起进入语言智能的前沿殿堂。
立即抢票:http://ccai.caai.cn/