号称要砸翻译饭碗,神经机器翻译哪家强?

前段时间,一则新闻几乎刷遍了整个网络。Google新发布了神经机器翻译(GNMT:Google Neural Machine Translation)系统,并称该系统使用了当前最先进的训练技术,能够实现到当下机器翻译质量上最大的提升。

有从事翻译职业的网友甚至这样形容:

作为翻译看到这个新闻的时候,我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。

这种看法未免有点杞人忧天。尤其是在业内专家看来,机器翻译的效果还远未达到取代人类专家翻译的水平。实际上,谷歌此次应用的技术并非最新的“黑科技”。早在2015年百度就已经发布了基于深度神经网络的端到端翻译系统,微软的必应翻译也同样使用神经网络技术来改善自身的翻译质量。 与传统的基于短语的翻译(PBMT)相比,基于神经网络的翻译系统对整个输入句子进行编码,能够更充分的利用上下文信息,生成较高质量的译文。

最近大家热议的Google神经机器翻译目前只是在应用在中译英中,所以以下测试都是在中译英部分下进行。分别从几个角度来参看百度、Google、必应等几个翻译软件的实际使用效果如何:

  • 复杂语句翻译

1. 定语从句(用一个句子修饰一个名词短语):

我没有可以跟你说的事情。  

从上至下依次为Google翻译、百度翻译、必应翻译

2. 多个修饰形容词

从上至下依次为Google翻译、百度翻译、必应翻译

3. 长短句翻译

从上至下依次为Google翻译、百度翻译、必应翻译

4.  俚语翻译

从左至右依次为Google翻译、百度翻译、必应翻译

可以看到,在定语从句部分Google与百度的翻译结果相差无几,语句通顺连贯,两者比较的话Google翻译的结果更为接近标准答案一些。另一方面,必应翻译的结果则与本意有所出入。

在多个形容词部分,三者翻译出了大概意思,但是遇到黄老板以及黄山这类在名词与形容词中易混淆的部分时,似乎百度翻译要更为准确一点。

在长短句部分,Google翻译与必应翻译都出现了同时翻译两次时态及动词“have seen"的情况,虽然百度翻译并未出现这种情形,但是其在两个名词之间并未翻出连接词"and“,对语句理解有一点影响。

涉及到俚语翻译部分时,Google翻译几乎完全是根据词组翻译出了字面的意思,而必应则出现了奇怪的省略情况,语义并不连贯。相较之下,百度翻译将原句引申含义也翻译了出来,并保持了语句连贯与准确度。

  • 口语化表达翻译

1. 修饰词,如:的、了、好

2. 省略与重复叠加短语句子

在口语化翻译部分中,涉及到修饰词部分,Google与百度翻译大同小异,必应翻译与本意出入较大。

但是在重复叠加短语部分,从主观上来看百度翻译将”冒着“翻译为”Take“,相比Google与必应的”Brave“,其在语义通畅易读以及连贯度上表现要更好一些。

  • 段落整体翻译

1. 短段落 

2. 长段落

在段落整体翻译部分中,三者对于段落基本语义都翻译出来了。其中Google翻译在某些连接词的翻译上更为简洁一些,而百度与必应则会在某些位置增加一些连接词汇。

但是在涉及到长短句、语气词、多重修饰词部分,三者在某些地方都表现一般。

例如:“父亲是一个胖子,走过去自然要费事些。”

Google译为“Father is a fat man, go over the natural to be more trouble. ”

百度译为“My father was a man, go to some trouble.”

必应则译为“ Father is a fat man, walk naturally want to bother about.”

三者从连贯性来看都不算太好,但是从语义上来看Google翻译更为优秀一些。

再如:“于是扑扑衣上的泥土,心里很轻松似的,过一会说,“我走了,到那边来信!”

Google译为“So flutter clothes on the soil, and my heart is very easy to like, after a while that, "I go; to the other side of the letter!””

百度译为“Then suddenly the dirt on the clothes, he looked somewhat relieved and said after a while, "I will go over there; letter!"”

必应则译为“ Poop clothing and boots, felt very relaxed, one would say,"I'm leaving; to write! "”

此处三者的翻译都不太好,从对应词组的翻译来看,必应翻译的效果要好一些,但在缺少主语的情况下翻译成“One”并不正确。Google翻译直接理解将整个句子中的主体都默认是一个人,百度翻译准确识别出了讲话的是父亲,即“He”,但其在从句部分结构有错误。

  • 特色功能对比

1. 离线翻译

在离线翻译部分,从测试的语句来看,Google翻译的效果勉强能看懂,百度需要先购买离线包才能进行翻译,必应则不提供离线翻译功能。

2. 图片翻译

图像翻译部分使用今日头条的统一页面

从左至右依次为Google翻译、百度翻译、必应翻译

其中谷歌翻译可以做到手机放在图片前面,不做任何操作开始实时翻译。按拍照按钮后,涂抹想翻译的部分,然后翻译出相应的结果。

相比谷歌翻译,百度没有放在图片前面不做任何操作开始实时翻译的功能。不过百度翻译在按拍照按钮后,也能涂抹想翻译的部分翻译出相应的结果。但百度翻译的个性化功能最全,有

实物翻译

长句翻译

菜单翻译

单词翻译

四大类,且自定义功能最完善。

另外,百度翻译提供的实物翻译与菜单翻译功能在某些场合也能派上用场。

必应翻译只能先拍照再进行翻译,也无自定义功能选项。

3. 语音翻译

在语音翻译部分,正确的句子是:你好,我想打死李某。 Google和百度的翻译效果差不多类似,必应则不提供语音翻译功能。

此外,Google翻译提供多种语言的语音输入功能,百度目前只提供中文、英文、粤语(Google翻译中并未提供)语音输入功能。两者的语言识别输入功能也都十分不错,准确率很高且语句通顺连贯。并且两者都能以对话模式呈现,相信在商务或者旅行过程中会带来不少便利。

从上至下依次为Google翻译、百度翻译

总结

从上面的各项对比中可以看到,采用了神经机器系统的翻译相比之前基于短语的翻译确实要进步了许多。再也不是之前那种读起来总感觉哪里不对的感觉,甚至有些翻译结果已经到了稍加修改勉强能用的地步。

但是具体到使用过程中,比如需要对复杂语句以及口语化表达进行翻译时,大部分时候Google翻译与百度翻译的表现相对优秀一些。不仅在流畅度、语义保持上效果相对优秀,而且在句子错误率以及单词错误率上也要相对少一些。

另外,在图片翻译部分,Google翻译能做到实时翻译的效果,且准确度不错。百度翻译虽然没有实时翻译的功能,但是其自定义功能最完善,且能选择四大类个性化功能,针对性更强。

综上所述,添加了神经网络的机器翻译相较于往日的确不可同日而语了。在某些方面已经隐隐约约接近人类翻译的水准,所以有相关翻译人员担心也不算夸张。不过对于普通人而言,在有相关翻译需求时,综合词语、段落准确率以及语义流畅度来看,百度翻译目前是一个不错的选择。

本文作者:李尊

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-08-01 22:07:13

号称要砸翻译饭碗,神经机器翻译哪家强?的相关文章

【深度】AI 入侵翻译,神经机器翻译进化让巴别塔7年内成真

"从事翻译的人很可能会看到一些工作机会在不断消失,他们必须要习惯一种'创业思维'." 5月27日,中国围棋大师柯洁在与AlphaGo的围棋对决中输掉最后一盘,0:3输掉全部比赛.当下,AI 所激起的惊慌不仅在围棋界蔓延,而且扩展到了几乎每一个领域,翻译受到的冲击尤为严重.现在,谷歌等公司向全世界提供免费的翻译服务,并且,已经可以提供"可理解"的翻译结果. 牛津大学最近完成了一项对机器学习研究人员的大型调查,调查内容是他们对 AI 进展的看法.综合这些研究人员的预测,

哈佛神经机器翻译系统 OpenNMT 更新等 | AI 开发者头条

▲ 内容预览: 哈佛大学神经机器翻译系统 OpenNMT 新版本发布 癌症检测突破!谷歌深度学习算法的乳腺癌检测准确率超病理科大夫 两大 AI 平台联手!IBM Watson 与 Salesforce"爱因斯坦"进行对接 布朗大学人机交互新算法,让 AI 学会提问 每日推荐阅读 博弈论与深度学习 █  哈佛大学神经机器翻译系统 OpenNMT 新版本发布 OpenNMT 是哈佛大学 NLP 研究小组去年年底开源的产品级翻译工具,基于 Torch/Pytorch,一经发布便被谷歌采用,是

F8 2017 | 技术负责人为你解析 Facebook 神经机器翻译

该讲座主题为 Facebook 机器翻译的两代架构以及技术挑战. 雷锋网消息:在昨日的 F8 会场,该讲座吸引了众多开发者到场,主讲者是 Facebook 语言翻译部门技术负责人 Necip Fazil Ayan. Necip Fazil Ayan 首先介绍了 Facebook 翻译业务的使命和愿景,以及对机器翻译的应用. 使命与愿景 Necip Fazil Ayan:Facebook 希望推动建立一个真正的全球社区,即"连接世界":每个人都能与全世界任意国家的人.任意语言内容自如交互

阿里云PAI将神经机器翻译训练效率提升5倍

近两年,神经机器翻译(NMT: Neural Machine Translation)技术异军突起,翻译质量取得大幅提升.但不幸的是,NMT 系统的训练成本非常高,限制了这一技术的大范围使用. 阿里翻译团队通过使用阿里云机器学习平台PAI实现了模型训练效率5倍的飞跃,并已应用在英俄电商翻译质量优化项目中. 1,什么是NMT NMT一词的出现要追溯到2014年9月1号,加拿大蒙特利尔大学Bengio教授研究组在开放论文网站arxiv上发布了他们最新的研究成果『neural machine tran

一窥谷歌神经机器翻译模型真面貌,其底层框架开源!

去年,谷歌发布了 Google Neural Machine Translation (GNMT),即谷歌神经机器翻译,一个 sequence-to-sequence ("seq2seq") 的模型.现在,它已经用于谷歌翻译的产品系统. 虽然消费者感受到的提升并不十分明显,谷歌宣称,GNMT 对翻译质量带来了巨大飞跃. 但谷歌想做的显然不止于此.其在官方博客表示:"由于外部研究人员无法获取训练这些模型的框架,GNMT 的影响力受到了束缚." 如何把该技术的影响力最大

《中国人工智能学会通讯》——2.28 端到端神经机器翻译

2.28 端到端神经机器翻译 端 到 端 神 经 机 器 翻 译(End-to-End NeuralMachine Translation)是从 2013 年兴起的一种全新机器翻译方法,其基本思想是使用神经网络直接将源语言文本映射成目标语言文本.与统计机器翻译不同,不再有人工设计的词语对齐.短语切分.句法树等隐结构(latent structure),不再需要人工设计特征,端到端神经机器翻译仅使用一个非线性的神经网络便能直接实现自然语言文本的转换. 英 国 牛 津 大 学 的 Nal Kalch

斯坦福大学 NLP 组开放神经机器翻译代码库

近日,斯坦福大学自然语言处理组(Stanford NLP)发布了一篇文章,总结了该研究组在神经机器翻译(NMT)上的研究信息.在这篇文章中,他们还放出了在多种翻译任务上(比如英德翻译和英语-捷克语翻译)实现了当前最佳结果的代码库(codebase).除此之外,「为了鼓励再现和增加透明」,他们还放出了他们用于训练模型的处理过的数据以及可以通过他们的代码库使用的预训练好的模型. 参与成员: Christopher D. Manning(斯坦福大学计算机科学和语言学教授) Minh-Thang Luo

谷歌启用神经机器翻译系统:准确率大增

11月16日消息,谷歌曾于今年9月底公布了全新的神经机器翻译系统(Google Neural Machine Translation:GNMT),现在这一全新翻译系统已经在谷歌翻译应用和网页版翻译中启用,能够大大提高翻译的准确度. 据悉,谷歌此前的翻译服务基于词组机器翻译系统(PBNT),即独立翻译句子中的每个单词和词组表达,这种翻译有时会错误百出,而新的GNMT翻译系统则对整个句子进行分析,将减少55%-85%的机翻错误,并且系统还会自行在翻译中进行学习和训练,并使翻译水平获得进一步提升. 目

网友解读:大数据处理工具哪家强?

文章讲的是网友解读:大数据处理工具哪家强,近年呈爆发之势的大数据随着两会的召开再次被聚焦,在两会议题中成为高频词汇.各大报道中,利用大数据打造智慧城市.促进金融行业发展.建立两会大数据平台--两会委员"提案夹"中关于大数据的提案层出不穷."大数据外部环境推动着商业模式及行为的变化,对于企业来说,不对大数据善加利用就等于折了翅膀.面对亟待处理的庞大数据资源,企业遇到了哪些困难?处理数据的"利器"该如何选择? Hadoop高人气获最佳工具,魅力何在? 当讨论到