谷歌依靠算法和大数据“干掉”语言学家

  你能想象一个致力于打破语言障碍的项目小组里竟然没有一位语言学家吗?但是谷歌就是这么做了,这家公司打算依靠算法和大数据最终“干掉”语言学家。

  谷歌是一家极度看重算法、充满工程师文化的公司,但或许你还是会为此而感到惊奇——他们认为翻译是一个数学和统计学方面的问题。最近,位于谷歌总部的">谷歌翻译团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家。

  谷歌翻译部门主管Franz Josef Och同样也是德国计算机科学家出身,他不但并不精通语言学,甚至并不擅长语言学习。他认为,机翻的关键在对数学、统计和编程方面的擅长。

  谷歌翻译团队并不会去模仿人工翻译的方式,这就是他们没有去开发字典、定义语法结构和规则的原因。事实上,语法规则对目前的计算机来说仍然难以掌控。谷歌更着重于以大数据和统计的方式入手,翻译系统会不断地调整翻译结果的相关性并自我学习如何处理数十亿的文字。通过这种方式,计算机最终能不断优化翻译结果。

  以大数据方式做翻译的一个好处是,翻译系统会随着数据的积累而不断地改善。谷歌翻译目前已经支持71种语言的互译,去年用户的使用次数已经达到2亿次。此外,索引全球网页的谷歌还能够依靠互联网上已经存在的翻译内容改善自己的翻译系统。

  尽管如此,依赖算法的翻译系统仍然远远无法做到像人工翻译那么精准。句法、语调、歧义都是自动翻译软件很难处理的问题。谷歌翻译的翻译结果仍然只能帮助人们对陌生语言进行大致上的理解,8630.html">有时候得到的翻译结果很难让人通顺地阅读下来。

  此外,谷歌翻译在不同的语系之间的翻译结果质量也各不相同。例如,英语和西班牙语之间的互译翻译质量良好,英语和日语之间的互译不怎么样,英语和德语之间的互译则非常糟糕。

  尽管如此,机翻有一个人工翻译难以做到的优势——它让更多的人接触到了更多的信息。试想一下如果你举着手机就可以与世界上任何语种的任何人交流,那会是多么棒的体验。

时间: 2024-07-31 15:07:02

谷歌依靠算法和大数据“干掉”语言学家的相关文章

科大讯飞刘庆峰:AI要改变世界,算法、大数据、行业专家缺一不可

10月24日,科大讯飞在其大本营安徽合肥举办了首届全球1024开发者节.会上,科大讯飞董事长刘庆峰发表了<1024 AI因你而来>的主题演讲. 刘庆峰指出,人工智能是这个时代最伟大的技术,其对当前社会的改变,将会超出我们常人的想象.目前来说,人工智能现在有两个主要方向:一个是基于数学统计.建模的人工智能发展模式,以深度学习为代表:一个是对人类大脑科学的研究. 刘庆峰还表示,通过与教育.医疗等领域的机构通力合作,科大讯飞的开放平台与传统领域的应用程度正在逐步加深. "目前,讯飞开放平台

【Spark Summit East 2017】将HPC算法引入大数据平台

本讲义出自Nikolay Malitsky在Spark Summit East 2017上的演讲,主要介绍了使用轻量级源工具集开发的,基于MPI的Spark平台的扩展,扩展的背景和原理正如题目所示:将HPC算法引入大数据平台.

挑战霸主地位 PK谷歌的唯一利器大数据

编者的话:谁能挑战谷歌的搜索霸主地位,苹果?微软?雅虎?No!真正能对谷歌构成威胁是拥有大数据的公司.不管多么NB的产品或技术都需要大数据的支持,大数据才是其他公司挑战谷歌霸主地位的唯一出路.在这一领域,亚马逊和Salesforce最具潜质,前者拥有海量的用户购物信息,后者将通过其强大的数据分析工具,将社交营销支出与获得收入相结合,从而引导企业将投到搜索领域的钞票花在在线社交领域领域.(kirk) 毋庸置疑,谷歌在网页搜索领域的霸主地位无人撼动,但谷歌其他令人印象深刻的产品和服务并不局限于一个"

结合AlphaGo算法和大数据的量化基本面分析法探讨

   ◆ ◆ ◆ 序 本文是以郝伯特·西蒙的过程理性理论结合AlphaGo算法步骤探讨量化基本面分析法的分析方式,而不是讨论如何使用量化基本面分析法预测公司股价.   量化基本面分析法(Quantamental)将量化和基本面两种方法结合起来,是近几年随着市场电子化.大数据.自然语言处理技术快速发展产生的新的基本面分析法.现在已经是DT时代,发挥海量数据价值已成为可能.以下讨论都是假设已合法的收集相关数据包括交易.消费.关注度.GPS.卫星数据等等.   ◆ ◆ ◆ 一.基于大数据的量化基本面分

翻译这事儿,Google认为算法和大数据比语言学靠谱

我相信你已经能知道 Google 是一家极度看重算法.充满工程师文化的公司,但或许你还是会为此而感到惊奇--他们认为翻译是一个数学和统计学方面的问题.最近,位于 Google 总部的 Google Translate 团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家. Google Translate 部门主管 Franz Josef Och 同样也是德国计算机科学家出身,他不但并不精通语言学,甚至并不擅长语言学习.他认为,机翻的关键在对数学.统计和编程方面的擅长. Go

“谷歌流感趋势”把大数据推上风口浪尖

大数据是时下最时髦话题,技术专家.企业家为人们描绘了大数据下的美好生活.近期,美国学界和媒体有关"谷歌流感趋势"的讨论,又把大数据推上了风口浪尖. "谷歌流感趋势"是谷歌公司多年前推出的一款预测流感的产品.该公司的工程师认为,搜索流感信息的人数与实际患病人数之间存在密切关联.通过汇总用户的相关搜索记录,"谷歌流感趋势"可以预测出世界上不同国家和地区的流感传播情况.2009年,http://www.aliyun.com/zixun/aggregat

谷歌 HBaseCon West 2017 大数据研讨会开幕在即,搞 Apache HBase 的开发者不可错过

日前谷歌通过官方博客宣布,基于 Apache HBase 社区的官方研讨会 HBaseCon West 2017 将于美国当地时间 6 月 12 日在加州山景城正式开幕,目前参会注册和论文征集活动已同步启动.对各位 Hadoop Hbase 相关的大数据从业人员及开发者而言,这场量身定制的免费技术研讨活动可绝对不能错过. Apache HBase 是基于 Hadoop 框架和谷歌 Bigtable 技术建立起来的一款分布式.可拓展的开源数据库实现.谷歌在博客中表示,得益于阿里巴巴.苹果.Face

想压制谷歌?先搞大数据!

Google在搜索的地位是无人能及的.但是,Google的产品和服务早已不仅仅局限于搜索. Google的产品包括广告(AdWords).交流和分享(Drive和Hangouts).开发资源(OpenSocial).社交网络(Google +).地图(Google Maps).流媒体(Google Play).统计工具(Analytics).操作系统(Android和Chrome OS).桌面和移动应用(Gmail),以及硬件(Galaxy Nexus). Google 的搜索业务在持续增长,在

Yuval Noah Harari 谈论大数据,谷歌和自由意志的终结 -- 忘记聆听自己。在数字时代,算法会找出答案。

千百年来,人类相信众神给予了权力.直至现代,人们渐渐地把权力从神明手中接受了下来.卢梭(Jean-Jacques Rousseau) 在他的1762年的教育著作,<爱弥儿>(Emile),中总结了这场变革.当在探寻生命中的规律时,卢梭发现这些规律"存在于我的内心深处,循着不被影响的自然的轨迹.我只需要扪心自问我想要什么.我觉得好的就是好的,我觉得坏的就是坏的."和卢梭一样的人文主义思想家说服我们,我们自己的感觉和渴望是所有事物的源泉,是我们的自由意志,是最高的权力. 现在,