谷歌或利用大数据研发通用翻译器

  ">谷歌翻译以能够快速粗略地将网页或短文本翻译成另外一种语言而著称。
但是有专家称,该服务的核心技术的下一步规划是研发出一种类似于“星际迷航”中的通用翻译器。

  在这方面谷歌并不是孤军奋战。显然,
Facebook和微软等公司也都有相同的雄心壮志:创建一些能够消除语言障碍的服务。这是一个切实可行的目标还是天方夜谭?它们的代价是什么呢?

  机器翻译已经以这种或那种形式发展了数十年时间,但是它们与人工翻译相比仍然存在很大的差距。许多具有机器翻译功能的软件涉及定义不同语言的语法和词典,以及死板而晦涩的程序。

  在Franz Och的指导下,谷歌的解决方案是用一种纯统计法解决方案替代上述方案。与老式算法所驱动的方案相比,以查阅
大量平行数据的方式——
例如,各种公共文本的英语和法语翻译——能够生成更出色的翻译。语料库或平行文本库越大,翻译效果也就越好。(存储和处理能力在过年二十年中的提升也提供了帮助。)

  如果谷歌的计划是从零开始创建一种属于自己的技术,那么Facebook的策略似乎是引入谷歌的技术。在8月份,Facebook选择了Mobile Technologies公司所开发的语言翻译软件。对此,Facebook的产品管理总监称“这是一项对公司长期产品路线图的投资”。在Mobile Technologies公司的产品当中有
一款名为Jibbigo的应用,该应用能够翻译语音。

  从这两个独立的项目,我们能够很容易地发现一个共同点:公司拥有大量可供他们使用的语言数据。谷歌和微软都有自己的搜索引擎,它们可以实时对网页进行搜索;Facebook则拥有大量的用户文字
聊天记录。所
有的这些构成了一个庞大的数据,这些数据可以作为翻译语料库。

  迄今为止,一个最大的未知问题是:如果谷歌、Facebook和微软等公司计划使用实时
对话来生成一个用于翻译的语料库,那么这些数据是否会进行匿名化处理,甚至是否有这种可能性。创建一个选择加入程序,让人们有选择地将他们的谈话加入语料库中似乎是一个
最好的解决方案。但是对于他们之前的行为,似乎不太可能写入到服务条款协议之中。

时间: 2024-09-20 16:45:47

谷歌或利用大数据研发通用翻译器的相关文章

谷歌利用大数据提高通用翻译

谷歌翻译(Google Translate)是目前翻译网页或简短的文字片段使用最多的一个快捷工具.据德国媒体Der Spiegel报道,支持该服务的后台核心技术,会在不久的将来被改进为类似"星际迷航(Star Trek)"那样的通用翻译器. 当然,谷歌并不是唯一一家致力于此事的公司.从Facebook到微软的每个人都有这样一个野心,那就是创建一个能最终彻底解决语言障碍的服务.而这个野心实际吗?如果想要实现又需要付出多大的努力? 机器翻译的存在由来已久,但一直远远落后于人工翻译. 很多机

亚马逊Facebook谷歌试图利用大数据治愈癌症

亚马逊.http://www.aliyun.com/zixun/aggregation/1560.html">Facebook和谷歌帮助英国癌症研究所举行了一个周末编程马拉松活动,研究移动应用如何通过游戏化的细胞分析功能治愈癌症. 这次活动在谷歌的东伦敦校区举行,从周末开始举行维持数天时间,希望找出一种帮助癌症研究所分析大量癌症相关数据的方法,而且最好是以游戏化的方式呈现. 这个想法以前就有了:Call Slider是一种基于网络的体验,从10月开始启动,针对那些希望找出癌细胞的人,当然人

大卖场等实体零售如何利用大数据

大数据我们已经谈了很多年,但是真正能做好的没有几家,特别是实体零售在运用过程中遇到了各种各样的问题.为此,联商网新零售顾问团邀请了部分资深业内人士,组织了一场线上沙龙,讨论超市大卖场等实体零售到底如何利用大数据. 雷俊杰:保定杰出便利店董事长 微信:leizi_ming 说起今天话题,很有感慨,本人愿意就出互联网软件开发和一些新颖的科技类的事物.在跟张陈勇等交流中也学习了很多东西.大数据我认为他是一个应用技术,更是一种思维.在零售行业运用上非常的宽泛,由于我们本身是经营者不是开发者,在商业运用上

美国大数据研发关键领域的七个战略

大数据有可能从根本上改善所有美国人的生活.为了从资源丰富的大数据中获得最大的效益,奥巴马政府于2012年3月29日推出了"大数据研究与开发计划".在此基础上,美国又于2016年5月发布了<联邦大数据研究与开发战略计划>(以下简称"计划"),其目标是对联邦机构的大数据相关项目和投资进行指导.该"计划"主要围绕代表大数据研发关键领域的七个战略进行,包括促进人类对科学.医学和安全所有分支的认识;确保美国在研发领域继续发挥领导作用;通过研发来

看ZARA亚马逊沃尔玛如何利用大数据

  大数据时代正在以我们可感知的方式到来,无数公司和创业者都纷纷跳进了这个狂欢队伍.   <连线>杂志(台湾版)最新制作了一期大数据特刊,其中涉及到三家零售公司.这三家公司很有代表性:ZARA,一家发家于线下的快时尚品牌商:亚马逊,电商巨头:沃尔玛,全球最大的传统零售企业.   这组报道从不同角度来分析它们是怎么利用大数据的:ZARA运用大数据让自己既有的快时尚模式如虎添翼:亚马逊实现基于大数据的精准营销:沃尔玛分析社交网站海量数据上显露的消费者偏好与需求.   它们在三个方向上的实践样本也许

VIPKID项碧波:利用大数据实现个性化教育规模化

"因材施教"的教育方式自古有之,互联网时代,要实现真正意义上的个性化教育,离不开大数据技术的扶持. 10月27日,2017易观A10大数据应用峰会现场,VIPKID高级副总裁项碧波提出大数据具体应用于教育领域的观点.项碧波说:"大规模的个性化教育可以说是每个教育者的梦想,但直到今天,人类才有可能借助大数据和人工智能解决这个问题." VIPKID是目前为止,在全球K12在线教育领域获得最大一笔融资的在线少儿英语品牌,8月23日,VIPKID在京宣布,完成总额达2亿美金

怎么利用大数据产生价值、驱动变革?瞧,这有答案

大数据怎么在业务里面产生价值,又是如何驱动业务变革的? 首先分享一个观点,大数据本身是一个业务问题,绝对不是一个简单的技术问题.今天讲大数据的技术也是从业务里面孵化出来的,最早大数据的起源来自谷歌,谷歌需要去检索整个互联网上的海量信息,这背后要有足够的计算能力和技术来支撑它做这个事情,后面才有大数据的概念出来. 业务需求倒逼技术发展 对于阿里巴巴而言也是一样的,今天阿里最典型的业务就是金融业务,数据显示阿里从最开始做小贷的业务,到2014年的时候计算量就翻了数十万倍.随着业务的指数级增长,客户越

让我们激情利用大数据 挖掘商业洞察

本文讲的是让我们激情利用大数据 挖掘商业洞察,当前,伴随电子商务.移动互联网.社交媒体的飞速发展,以及智能手机.平板电脑和3G网络的普及,企业随时面临着数据爆炸的环境.超级互联的社会.愈加苛求的客户以及持续创新的压力.这不仅增强了企业对于更广阔的市场.灵活的基础架构,也推动了移动应用.云计算.大数据及敏捷开发等新技术趋势的产生与发展.对于软件产业而言,这些新趋势在为企业带来可供实践的新思路和新手段的同时,也为软件业带来更多的机遇和更严苛的挑战. 大数据 企业热点 在众多的软件发展趋势中,我们看到

滴滴快的精打细算:利用大数据构建产业生态圈

ZDNet至顶网软件频道消息: 随着2014年初那场旷日持久补贴大战的落幕,"土豪"一词也随之成为人们对滴滴快的的印象标签.殊不知,在疯狂补贴的同时,滴滴快的也有一颗精打细算的"心"--利用大数据构建更广阔的产业生态圈. 其实从2012年开始,滴滴快的便迅速网罗了360个城市中近两亿"打车族".每天600多万订单生成,每个小时,数十万订单数据汇入滴滴快的后台.通过对这些人们出行数据的汇总.分析,滴滴快的构建出一套用户画像系统,由此而形成一个全新的