英伟达发布“后排驾驶员”AI,能够学习阅读唇语

英伟达公司在今年的消费电子产品展上公布的联合驾驶员"后座司机"AI可谓一鸣惊人。事实上,大多数与会者都被其在"车"中出色的唇语理解能力所震撼。

根据CES展会上公布的内容,这款联合驾驶员AI助手能够执行四项功能:面部识别、头部追踪、视线追踪与唇语阅读。自动驾驶AI属于GPU助力DRIVE PX 2平台的组成部分,其采用多款传感器以及由英伟达处理器支持的多种神经网络以实现功能。

英伟达公司的一位发言人在采访邮件中确认称,这款唇语阅读组件基于由牛津大学、谷歌DeepMind以及加拿大高级研究所的学者们共同撰写的一篇研究论文。

其实这篇论文在发布之初曾受到批评。虽然其中采用的神经网络LipNet拥有高达93.4%的识别准确率,但其测试场景仅限于一部分特定词汇而非连贯的句子。

在发表于arXiv上的第二篇论文中,我们看到LipNet的能力得到提升。其在通过数个小时的BBC新闻主持人唇部运动解析训练后,现在已经可以解读完整的句子。

英伟达公司的这款联合驾驶员助手显示,LipNet已经进一步获得了理解司机口头命令的能力,因此其能够处理各类常见指令--例如在噪杂的环境下准确选择播放某首曲目。

根据英伟达方面的说法,开发头部与视线追踪以及面部识别功能是为了向用户提供更出出色的安全性与驾驶体验。

"其中包含一套用于实现面部识别的AI,这样车辆就会了解到驾驶员是谁、设定个人偏好且不再需要使用钥匙启动车辆。另一套AI则用于视线追踪,这意味着车辆能够了解到您当前的注意目标,"英伟达公司在一篇博客中解释称。

英伟达公司向来以为游戏及高性能计算用例设计强大的GPU方案而闻名,但其近年来则一直把更多精力用于GPU加速型机器学习与AI的研发当中。“目前梅塞德斯-奔驰、奥迪、特斯拉以及丰田都已经成为该项新技术的客户,”一位英伟达公司发言人确认道。

原文发布时间为:2017年1月18日

本文作者:刘新萍

时间: 2024-09-19 10:12:39

英伟达发布“后排驾驶员”AI,能够学习阅读唇语的相关文章

Google Cloud Next 云技术大会开幕;英伟达发布全新 Jetson TX2 嵌入式开发组件 | AI 开发者头条

▲内容预览: ● Google Cloud Next 云技术大会开幕 ● 英伟达发布全新 Jetson TX2 嵌入式开发组件,强化 AI 智能运算 ● IBM研发大数据模型,为控制埃博拉病毒传播大显身手 ● 谷歌开放大规模音频数据集 AudioSet,助力 AI 音频算法研究    每日推荐 ● 盘点近年来引用最多的深度学习论文 █ Google Cloud Next 云技术大会开幕 Google Cloud Next 云技术大会将于当地时间3月8日上午8:30在美国加州旧金山开幕(北京时间约

阿里云战略合作英伟达 建联合实验室拓展深度学习市场

1月20日,2016云栖大会上海峰会在上海科技馆召开.全球领先的云计算服务提供商阿里云和全球视觉计算的行业领导者NVIDIA(英伟达)签署战略合作协议,双方将共同推广阿里云高性能计算平台HPC,大力拓展深度学习市场,并建立联合实验室,进行高性能计算领域相关技术的联合攻关. 阿里云HPC于去年底正式对外商用,每个计算节点配备2颗专属NVIDIA Tesla K40 GPU和2颗CPU.用户可通过阿里云官网(www.aliyun.com/product/hpc)购买GPU服务器实例.这是中国首个云上

英伟达发布TensorRT 3可编程推理加速器,比起CPU能实现高达40倍吞吐率

北京时间9月26日,在英伟达GPU技术峰会上,英伟达创始人兼CEO黄仁勋正式发布TensorRT 3 神经网络推理加速器.据官方介绍,TensorRT 3能极大改善处理性能,削减从云到边缘设备(自动驾驶汽车.机器人等)的推理开销.TensorRT 3 是在Volta GPU 实现最优推理性能的关键,比起CPU它能实现高达40倍的吞吐量,时延在7ms之内.目前,对于英伟达开发者计划成员,现在有针对Tesla GPU (P4, P100, V100)和Jetson嵌入式平台的TensorRT 3提供

英伟达凭借GPU与AI笑傲本届CES展会

 英伟达公司联合创始人兼CEO黄仁勋在本周三晚身着大家熟悉的黑色夹克再度亮相消费电子展(简称CES),并致开幕主题演讲. 我们很难想象其它芯片厂商的CEO会像他这样,在全球最大的贸易展会之一上受到与会者产如此热情的迎接.正如黄先生所言,该公司所打造的GPU与AI技术力量将成为未来游戏.娱乐乃至交通变革的强大推手,而事实上参与者们也对他的每一项发言给出热烈回应. 除了黄仁勋明星般的力量之外,英伟达公司还在本届CES上展示了其在AI驱动型自动驾驶车辆领域的开发成果. 英特尔公司同样在努力推动自己的开

英伟达发布GeForce Now,Mac也能玩大型PC游戏

英伟达为Mac电脑发布了GeForce NOW服务,让Mac电脑也能玩大型PC游戏! 苹果 Mac 电脑并没有专门为游戏优化,而且没有足够强大的显卡支持最新的 AAA 级 PC 游戏大作.这可以说是游戏爱好者们和果粉们的一大损失. GeForce NOW 测试版目前只面向北美用户提供,服务让玩家可以使用云端的 GeForce GTX 显卡,运行大型 PC 游戏.唯一的要求就是需要高速的互联网链接,虚拟游戏 PC 会负责所有的 CPU 和 GPU 需求. 那么内容方面如何解决呢?游戏厂商推出的游戏

英伟达发布Linux X32/X64显卡驱动 v319.49供下载

风信网(ithov.com)原创文章:近日,英伟达http://www.aliyun.com/zixun/aggregation/11307.html">官方网站发布Linux 32-bit ARM显卡驱动 v319.49供下载. 版本:319.49 Certified 发布日期:2013.08.20 操作系统:Linux 32-bit ARM/Linux 64-bit 语言:Chinese (Simplified) 文件大小:16.7 MB 下载地址:http://cn.download

英伟达面向开发者群体建立深度学习课程

 深度学习正在"转化计算"方式,英伟达公司在其本届GPU Tech大会上努力传达出这样一条信息.而围绕着这一主题,英伟达公司将自身打造为引领者.催化剂以及深度学习的推动者--当然,从长远角度来看,其自然也将成为主要获利方. 而且有迹象表明,英伟达公司正将其未来押注在人工智能(AI)这一领域当中.其最近发布的"深度学习研究所"项目计划在今年年内吸引到10万名开发人员.另外,英伟达公司已经在2016年年内培训出1万名开发者. 过去几年以来,AI已经逐步涉入"科

英伟达:超高的性能表现……足以支持AI应用

英伟达公司已经为AI应用设计出两款全新Tesla处理器,分别为P4与P40.   这款16纳米FinFET GPU采用英伟达Pascal架构,且延续今年6月发布的P100命名方式.其中P4为单高.单长PCIe卡,用于向外扩展服务器:而更为强大的P40则着眼于向上扩展设备. 这一新组合主要用于推理工作,即在硬件当中内置一套经过训练的AI模型.部分对应软件以及类似摄像头视频或者麦克风音频的输入数据,并由其据此提供决策.语音到文本转换以及对象分类等功能. 如今我们的深度学习模型已经发展到新的阶段--即

AI芯片大战愈演愈烈,英伟达能否领跑下去?

据Technologyreview报道,在机器学习"淘金热潮"中,芯片巨头英伟达正处于领先位置,但来自其他科技巨头和初创企业的竞争正变得日益激烈. 美国芯片巨头英伟达首席执行官黄仁勋(Jensen Huang)日前在加州圣何塞市一个拥挤的会议厅中宣布,该公司的最新芯片可帮助加速人工智能(AI)算法.过去几年中,英伟达的股价和盈利不断增长,因为其支持游戏和图形制作的图形处理器帮助机器学习领域取得许多突破.但是随着AI领域投资渐增,英伟达现在面临英特尔.谷歌以及其他科技巨头的激烈竞争,这些