微软演示“实时语音翻译”

想象一下这样的场景:你在国外需要订餐,却不会说当地语言,但未来手机中只需要置入一款产品,就可以把中文在2-3秒钟时间里翻译成当地语音,并以你的发音、语调和当地人沟通。昨天,微软亚洲研究院在北京举办“创新日”,展示面向未来的各种前沿技术,其演示的实时语音翻译场景颇引人关注。不过,这项技术还在研发过程中,有些翻译会出点错误。微软亚洲研究院院长洪小文说,上述技术集合了语音识别、文本翻译、个性化语音合成等技术。据悉,该研究利用了深层神经网络技术,相较传统技术,提升了口语
对话识别成文本的准确度。此外,微软昨天重点展示了“基于Kinect的手语翻译系统”。该系统由微软亚洲研究院与中国科学院和北京联合大学合作开发,借助Kinect设备对手语进行识别和翻译,同时支持对汉语手语和英语手语的识别与翻译,并能将文本信息反向翻译为手语,可帮助不同文化和语言背景的听障人士实现“发声”的梦想。

时间: 2024-10-11 10:18:28

微软演示“实时语音翻译”的相关文章

谷歌开发实时语音翻译Android应用

http://www.aliyun.com/zixun/aggregation/17197.html">北京时间9月9日早间消息,据国外媒体报道,谷歌正在为Android系统开发一款实时语音翻译软件,手机在安装该软件后可立即将用户语音翻译为目标语言. 尽管该项目尚处于研究阶段,谷歌仍在本周的德国柏林国际电子消费品展览会上为其做了产品演示.据称,该软件的demo版本可实现英语与德语间的实时语音翻译. 自从Android商店上线以来,出现了大量有关翻译的应用,但直至最近,此类软件才开始涉及语音

微软Skype Translator将支持阿拉伯语即时语音翻译

据美国科技时代网(Tech Times)3月9日报道,日前,微软旗下即时翻译软件Skype Translator再添新语种,微软宣布Skype Translator已经支持阿拉伯语.Skype用户可通过使用阿拉伯语即时翻译与朋友.家人以及海外商业伙伴进行交流. 据报道,Skype Translator可自动将语音甚至是电脑合成的语音翻译并生成文本.至此,该应用已可以支持8种语言,分别是英语.德语.法语.意大利语.西班牙语.中文.巴西葡萄牙语以及新增的阿拉伯语. 此前,微软在搜集了大量阿拉伯语语言

微软开发实时翻译软件 “可像人脑那样工作”

[ 导读]一直以来,http://www.aliyun.com/zixun/aggregation/35618.html">实时翻译都是一个老大难的问题,因为人们的口语水平参差不齐,人们之间的嗓音也存在区别,接受和处理数据需要时间,而且人们也没有足够的时间来编辑修改不准确的地方. 北京时间11月11日消息,据国外媒体报道,微软正在开发一款实时翻译软件,该软件可"像人脑那样工作".它甚至还能够保留原讲话者的语调和节奏,从而让翻译出来的整体效果接近于讲话者. 去年,这款翻译

谷歌语音翻译给电影配字幕

  不知道大家还记得吗,前两年不管是在电视节目中还是在公司年会上,都会流行这样的一个游戏:放一段电影,但是没有声音,人物之间的对白需要游戏参与者临场发挥.重新设计,在现场配出来.这种配音游戏因为没有唯一的标准答案,可以充满恶搞或是吐槽的元素,往往显得特别妙趣横生. 现在,谷歌一项最新的Chrome实验性功能给我们带来了类似但却是全新的玩法,让你能够在家中自娱自乐.这个名为Peanut Gallery的功能只能在Chrome浏览器上体验,它并不实用,但却非常好玩. 简单来说就是,Peanut Ga

解码谷歌即时语音翻译:研发产品如同调校高级跑车

我们想知道,一个念头是如何破茧而出,最终发展成为优秀的产品.在这背后又有着怎样的技术与思考?我们想知道,成长道路上的合作.碰撞与收获.为此新浪科技推出<科技开讲>系列访谈,希望能远离喧闹纷繁的商战,寻找IT企业的灵魂. 访谈主题: 语言不互通,是否还能交流?谷歌即时语音翻译,就打开了这样的一扇门.借助谷歌的翻译技术,语言将不再是聆听演讲.查看文档的主要障碍.究竟冰冷的机器翻译,怎样向信达雅的目标前进?本期<科技开讲>将对这一产品进行解码. 做客嘉宾: 谷歌研发经理陈雍昇 互动交流:

web端支持实时语音和发送语音消息吗?

问题描述 web端支持实时语音和发送语音消息吗?就像手机上的那种. 解决方案 支持发送语音文件

环信支持Web实时语音吗?

问题描述 有没有提供web端的SDK,可以用来跟移动端streaming通信的? 解决方案 实时语音支持android及ios端.web不支持实时语音

实时语音Bug

问题描述 +(void)callSessionStatusChanged:(EMCallSession *)callSession changeReason:(EMCallStatusChangedReason)reason error:(EMError *)error 在实时语音页面会调用两次,model两次,同时以下判断条件永远为true(只有读没有写),真蛋疼  BOOL isShowPicker = [[[NSUserDefaults standardUserDefaults] obje

iOS 如何自定义实时语音?

问题描述 解决方案 请说明详细些.解决方案二:点击图片开始实时语音通话解决方案三:就是文件流 敏创解决方案四:那这个怎么搞 ?使用环信的