机器翻译的前世今生

这是">日本发明的爱犬翻译机。狗狗的颈部套上一只无线麦克风,主人握有一只手持接收器。爱犬的吠声、狂叫和哀呜将分别与数据库存贮的声音对比后翻译成为“好无聊呀”、“我喜欢你”等。CFP

近年来,各种翻译机不断问世。人们在关注软件质量的同时,对外形的要求也越来越高。图为卡通造型的翻译机器人。资料图片

美国南加州大学的科学家们最近提出一种全新的机器翻译方法——解码外语。科学家认为这种翻译方法今后甚至可以破译“海豚音”或“外星人语言”。

机器翻译,简称“机译”,是利用计算机实现从一种自然语言(源语言)文本到另一种或多种自然语言(目标语言)文本的翻译;而用以翻译的软件叫做机译系统。机译涉及语言学、计算机科学、认知科学、数学等多个学科,是一门前沿交叉学科。这一充满挑战的研究领域,被列为21世纪世界十大科技难题的第一位。

最新成果

新思路:

解码外语

美国南加州大学的科学家们最近提出一种全新的机译方法——解码外语。之所以叫“解码”,是因为他们把英语视为一种初始语言,把需要翻译的外语看成类似一种加密后的高级文字,通过解码破译,把外语“破解”成英语。这种翻译方法可以运用到任何一种语言中。虽然目前还只能翻译一些短句或电影字幕,尚未运用到长句或片段翻译中,但它却给机译研究打开了一条新的思路。科学家声称:因为不需要任何既有的文本为基础,这种翻译方法今后甚至可以对“海豚音”或“外星人语言”进行破译。

新应用:

即时翻译

日前,谷歌推出了一款手机翻译软件,能让手机即时翻译用户通话。对着谷歌Android智能手机讲话的用户,将会听到他们的话被翻译成另外一种语言;而通话对方的话也会被翻译成该用户的母语。这是因为它拥有较强的语音识别技术,可以通过声音实现自动检索,再将语音识别和机译结合在一起。这款软件的翻译语言目前仅限于英语和西班牙语。但谷歌表示,不久的将来将会推出包括其他语言的升级版本。

从盲目乐观到“不可行”——机译发展浮沉

早在古希腊时代就有人提出利用机械装置来进行语言翻译的想法;然而,只有在计算机问世后,机译的梦想才逐渐变成现实。被誉为机译鼻祖的美国数学家、工程师沃伦·韦弗(Warren Weaver)于1947年的各类交谈和信件中多次提到机译的设想,并于1949年7月发表了其有着广泛而深远影响的备忘录——《翻译》,正式提出了机译问题。此后的60多年中,机译研究经历了艰难而曲折的发展历程,有成功和兴奋,但更多的是挫折和困惑。

1954年,美国乔治敦大学在IBM公司协助下,用IBM-701型计算机首次完成了英俄机译试验,向公众和科学界展示了机译的可行性,从而拉开了机译研究的序幕。随后苏联、英国、中国、法国、日本、加拿大等也相继进行了机译试验。机译研究一时出现热潮;在这个时期,机译虽然刚刚处于开创阶段,但很快就进入了盲目乐观的泡沫期。

当时由于人们忽略了自然语言和翻译本身的复杂性以及机器自身的局限性,机译系统的翻译质量很差,还闹出了不少笑话。最著名的例子是,当英语谚语“心有余而力不足”翻译成俄语时,其意思却变成“酒是好的,肉变质了”。1964年,为了对机译的研究进展作出评价,美国科学院成立了语言自动处理咨询委员会(ALPAC),开始了为期两年的综合调查分析和测试。ALPAC于1966年11月公布了一个题为《语言与机器》的报告;该报告全面否定了机译的可行性,并建议停止对机译项目的资金支持。这份报告的公开发表给了正在蓬勃发展的机译当头一棒,各国的机译研究陷入了近乎停滞的僵局。

打开电脑上网翻译 ——互联网让机译再次风靡

全球化进程的加速以及国际交流的日趋频繁,让人们对于翻译的需求空前增长,而互联网的发展让机译迎来了一个全新的机遇。从上世纪80年代中期开始,基于语料库或多引擎的机译方法在研发中得以广泛运用,机译系统的性能、效率和译文质量都有了明显的提高;各式各样的翻译软件如雨后春笋般层出不穷。

(责任编辑:吕光)

时间: 2024-08-02 22:39:05

机器翻译的前世今生的相关文章

(转)word2vec前世今生

  word2vec 前世今生   2013年,Google开源了一款用于词向量计算的工具--word2vec,引起了工业界和学术界的关注.首先,word2vec可以在百万数量级的词典和上亿的数据集上进行高效地训练:其次,该工具得到的训练结果--词向量(word embedding),也是很多NLP任务的基础.随着深度学习(Deep Learning)在自然语言处理中应用的普及,很多人误以为word2vec是一种深度学习算法.其实,读了Mikolov在2013年发表的论文[1][2]就会知道,w

深度!市场已经存在成熟产品,阿里为什么还要做机器翻译?

阿里云机器翻译是阿里语言服务发布的在线翻译服务,致力于帮助用户跨越语言鸿沟.它依托海量的互联网数据资源和领先的自然语言处理技术优势,能更加方便快捷地获取信息和服务. 机器翻译开放平台 目前阿里机器翻译支持全球19种热门语言互译,中文.英语.俄语.葡萄牙语.西班牙语.法语.印尼语.阿拉伯语.德语.希伯来语.印地语.意大利语.日语.韩语.荷兰语.波兰语.泰语.土耳其语.越南语. 为什么要做阿里云机器翻译? 根据中国电子商务研究中心发布的<2015年(上)中国电子商务市场数据监测报告>显示,2015

阿里十年经验输出,大数据平台“数加”的前世今生

2016 年1月20日,在云栖大会上阿里云发布了一站式大数据平台"数加",该平台集合了阿里巴巴十年的大数据能力以及上万名工程师实战检验,该平台是一站式的解决方案,首批亮相20款产品,覆盖数据采集.计算引擎.数据加工.数据分析.机器学习.数据应用等数据生产全链条. 数加平台由大数据计算服务(MaxCompute).分析型数据库(Analytic DB).流计算(StreamCompute)共同组成了底层强大的计算引擎,速度更快.成本更低.计算引擎之上,"数加"提供了丰

手游开发工具CocoStudio的前世今生

要了解CocoStudio,需要先了解Cocos2d-x,Cocos2d-x是开源的游戏引擎,一个支持多平台的2D手机游戏引擎,使用C++开发,基于OpenGLES,基于Cocos2d-iphone,支持iOS4.1,Android2.1,WindowsPhone7及更高版本. Cocos2D-X引擎的来历 Cocos2D-X游戏引擎并不是最初的版本.从名字读者就能看出最早的版本其实为Cocos2D引擎版本.追溯起来,Cocos2D引擎已经有5 年的历史了.在2008年3月,Ricardo Qu

SEO研究中心:实例解析SEOER的前世今生

今天来说说SEOer的前世今生,如果我没有猜错,多少看了这篇文章标题的人都会认为我有标题党的嫌疑.各位看官,请往下接着看.我会说SEOer的前世今生是因为源于我的一个想法,一个合格的seo他必须具备什么?曾经有很多seo朋友经常问我这个问题,我的回答里面经常会忽略掉一个很重要的点,那就是文字的编辑能力,事实上它是非常的重要以至于很多人都忽略它了,也许是因为认为它不太重要. 我总结了目前国内seo技术不错的一些人,包括我的一些徒弟,我发现一个问题,凡是我们认为厉害的seo一般写文章的技术都相当了得

WPF基础到企业应用系列2——WPF前世今生

1.开篇前言 很多时候了解一项新技术的历史和趋势往往比这项技术的本身价值还要重要.WPF作为一项新技术(已经三年多了,或者应该叫老技术了),我们都有必要了解它的来龙去脉,尤其是公司的CTO.技术总监.架构师等决策层,因为他们对技术的选型及应用具有决定权.对于开发者来说,了解自己正在从事的这个技术的前世今生,有助于我们更好的认识技术本身的价值,也可以避免我们少走一些弯路(圣殿骑士 就走过很多弯路,所以对此比较感慨).从IT技术发展的这些年可以看出,技术对于各大公司只是竞争的一种手段,而对于大多数程

从头带你认识面包屑导航的前世今生!

  面包屑导航,一个曾经风靡武林,不经意间已默默无闻的古老控件.很多交互设计师在刚听闻它大名的时候,它就隐退江湖了.不过,在某些类型的网站上,它还是必不可少的导航方式.今天美团网的交互设计师@德川亮 特意重新梳理资料,从头开始带你认识面包屑导航的前世今生. 什么是面包屑导航 网页上让用户感知当前页面所在的层级位置,或者是产品的属性之间的关系的控件.面包屑的一般样式是用链接文字加上">",横向排布 ,也有一些其他的样式. 这里用到了"感知",就是说面包屑导航不会

Android零基础入门第1节:Android的前世今生

原文:Android零基础入门第1节:Android的前世今生 现在网上有很多各色Android资料了,但相对来说还是比较零散,Android覆盖的范围极广,最近刚好有机会全部拉通整理一遍,也保存起来方便后期学习. 这一系列资料从最初的Android认识到Android高级开发,会免费共享出来分享给大家,包括中间会涉及到的一些源码.今天这是开篇,赶紧上车一起来聊一聊Android的前世今生.   一.IT行业发展几个阶段   IT行业是个年轻的行业,共总也才60多年时间,大致分为硬件.软件.互联

ACL 2017 | 三位阿里人工智能专家独家解密NLP、机器翻译优秀论文

7月底到现在,全球最顶尖的人工智能会议已在全球各地先后落幕: CVPR 2017(国际计算机视觉与模式识别会议,Conference on Computer Vision and Pattern Recognition) ACL 2017(国际语言学协会,The Association for Computational Linguistics)) ICML 2017(国际机器学习大会,International Conference on Machine Learning) SIGIR 201