摘要: 机器翻译出错闹笑话的段子数不胜数,但大数据的应用却令这种技术手段日趋完善。甚至有支持者认为,机器翻译终将取代人力,让人类克服语言障碍交流。然而,技术真能参透人类语
机器翻译出错闹笑话的段子数不胜数,但大数据的应用却令这种技术手段日趋完善。甚至有支持者认为,机器翻译终将取代人力,让人类克服语言障碍交流。然而,技术真能参透人类语言的丰富和微妙之处吗?
初级机器翻译更像一部电子词典,擅长翻译单个字词和简单句子,但对多义词却束手无策。正因如此,尽管发展多年,纯粹的机器翻译仍然错漏百出。大数据时代的来临,可能彻底改写这种局面。
输入的文本资料越多,机器翻译的准确率越高。各门语言的情况不一样,建立一个机器翻译模式,通常需要3000万个单词或者100多万个句子。多亏有联合国和欧盟这样的机构存在,其翻译人员历经多年积累起丰富的平行语料库(也称翻译记忆库),为机器翻译研发人员省去不少麻烦。
这也解释了以数据和资料庞大著称的谷歌为何在机器翻译领域表现卓越。谷歌的机器翻译专有系统堪称业界典范,能够实现63种常用语言的交互翻译。
然而,人类语言如此复杂、微妙,远非平行语料库能够囊括。如果涉及比喻或者任何诗意的语言,就非常困难,专家表示,如果用到一个翻译系统从未见过的双关语,电脑只会字面直译。
如果考虑各种语言的出处和文化差异,有些字词无法翻译,即所谓的不可译性现象,则根本不能指望机器翻译取代人工翻译。
时间: 2024-09-21 01:40:27