【英伟达NIPS论文AI脑洞大开】用GAN让晴天下大雨,小猫变狮子,黑夜转白天

只“看”一次,把猫“想象”成狮子,冬日变为夏天

“在无监督学习中使用GAN并不是新鲜事,但我们取得了前所未有的成果,”英伟达在最新发表的一篇官博文章中表示。不仅如此,这项工作还能有效减少训练神经网络所需的标注数据数量。

这项成果指的是今年NIPS上英伟达的论文《无监督图像翻译网络》(Unsupervised Image-to-Image Translation Networks)。在这篇论文中,研究人员展示了一款具有“想象力”的机器学习系统,可以把图像中的白天转换成黑夜,猫变成狮子,等等。

研究人员首先假设,相似的图像都享有一个共同的latent空间,都可以映射为这个共享空间中的同一个latent表示。基于这个假设,他们提出了基于生成对抗网络(GAN)和变分自编码器(VAE)的一个框架。在图像转换(翻译)的过程中,首先,使用VAE-GAN对每个图像域进行建模。对抗训练目标与权重共享约束相互作用,强制共享latent空间在两个域中生成相应的图像,然后VAE将翻译后的图像与各个域中的输入图像相关联,最后就得到了“想象结果”。

论文中不同种类的狗的转换结果,左边一列是输入

英伟达的研究人员表示,这个框架在多种无监督图像翻译问题中,都生成了高清质量的图像。此外,将这个框架应用于领域自适应(domain adaptation)问题,也在基准数据集上取得了state-of-the-art的结果。

最关键的是,在高质量标注数据稀缺的当下,这种方法大大减少了网络训练所需的标签数据,进而减少AI的训练时间。研究人员表示,“以无人驾驶为例,只需捕获一次训练数据,便可在不同的虚拟情景下使用,如晴天、多云、下雪天、雨天、夜晚。”

无需预训练网络,合成2048×1024图像,添一棵树,加上胡子,任君编辑

类似的,就在上周,英伟达和伯克利合作,发布了一个名为pix2pixHD的项目。Pix2pixHD利用条件GAN进行高清图像合成和处理(分辨率2048x1024),输入语义标注图,系统能够生成逼真的现实世界图像,例如街景、人脸。

图:上方是输入的语义地图,下方是pix2pixHD合成图像

作者在论文《使用条件GAN进行高清图像合成和语义操纵》(High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs)中介绍了他们的方法。他们提出了一种多尺度的生成器和判别器架构,结合新的对抗学习目标函数。实验结果表明,条件GAN能够合成高分辨率、照片级逼真的图像,不需要任何手工损失或预训练的网络。

不仅如此,作者还提出了一种方法,让用户能够交互式地编辑物体的外观,大大丰富了生成的数据类型。例如,在下面的视频中,你可以发现用户能够选择更换街景中车辆的颜色和型号,给街景图增加一些树木,或者改变街道类型(例如将水泥路变成十字路)。类似地,利用语义标注图合成人脸时,给定语义标注的人脸图像,你可以选择组合人的五官,调整大小肤色,添加胡子等。

作者在文中指出,他们的方法可以扩展到其他领域,尤其是医疗图像这样缺乏预训练网络的领域。

在这里,还不得不提一下英伟达此前在官网发表了一篇已经提交给 ICLR 2018 的论文“Progressive Growing of GANs for Improved Quality, Stability, and Variation”,提出了一种以渐进增大的方式训练GAN的方法。作者表示,这不仅稳定了训练,还生成了迄今质量最高的GAN生成的图像。

例如上面的人像,忽略背景,几乎与真实照片无异。

英伟达:积极推进GAN在医疗图像和自动驾驶落地

这些研究充分证明了生成模型的潜力,尤其是在无监督的情况下。现在的英伟达,已经远远不止一家专注游戏的GPU公司,一直在试图将其硬件推向边缘设备,并使用人工智能作为实现这一点的手段和工具。

上周,英伟达宣布与通用电气医疗(GE Healthcare)达成协议,通过Revolution Frontier CT,更新全球部署的500,000台医疗成像设备,以便在医院进行更好的成像。而英伟达在自动驾驶领域更是布局已久,今年10月还发布了全球首款AI自动驾驶平台,瞄准L5级自动驾驶。而上述研究无一例外,均在医疗图像和自动驾驶领域有应用潜力。

英伟达第三季度财报显示,截至10月29日的第三季度英伟达营收26.4亿美元,同比增长31.5%,再次创新记录。其中,数据中心业务达到5.01亿美元,汽车业务收入1.44亿美元,增长至13.3%。截至目前,英伟达依靠其在人工智能和无人驾驶方面的优势,股价已经上涨了约92%。

原文发布时间为:2017-12-6

本文作者:费欣欣 常佩琦

原文链接:【英伟达NIPS论文AI脑洞大开】用GAN让晴天下大雨,小猫变狮子,黑夜转白天

时间: 2024-09-19 07:53:36

【英伟达NIPS论文AI脑洞大开】用GAN让晴天下大雨,小猫变狮子,黑夜转白天的相关文章

微软、英特尔、英伟达支持Element AI公司1.02亿美元A轮融资

加拿大人工智能初创公司Element AI宣布,已经在A轮融资中获得1.02亿美元,由旧金山风投公司Data Collective领投. 其他投资方还包括加拿大开发银行.加拿大富达投资银行.韩华投资.英特尔投资公司.微软风险投资公司.加拿大国家银行.英伟达.Real Ventures以及全球财富基金. 这家成立只有8个月的初创公司此前从微软.腾讯以及韩华集团获得资金,但是并没有透露金额. Element AI表示,最近一轮融资将用于来自加拿大高科技领域的250名新员工.大规模人工智能项目.以及在

AI 相助,时尚类电商跨入“新零售”;英伟达助力京东智能物流,5年投百万台无人机

英伟达助力京东实现人工智能物流与配送 京东创新实验室"京东X"推出的无人机和机器人9月26日亮相NVIDIA GTC CHINA大会.两款"快递员"分别为JDrone和JDrover. NVIDIA创始人兼CEO黄仁勋在会议中宣布NVIDIA将与京东共同合作,利用基于NVIDIA Jetson 超级计算机模块驱动的智能机器将人工智能引入物流与配送领域.其中,JDrone将主打高空配送业务.目前京东X已与北京.四川.陕西和江苏等省市合作推出了试点项目,旨在将无人机用于

【干掉英伟达?】DeepMind CEO哈萨比斯投资的AI芯片,性能超越GPU 100倍

被DeepMind联合创始人哈萨比斯投资的AI芯片公司 Graphcore,宣称自己的IPU芯片相比市场同类产品性能提升10~100倍,并且在训练和推理两方面都同样出色.现在他们发布初步的测试基准证实他们的宣言,对比GPU,在某些任务上IPU的性能提升甚至超过200倍. Graphcore 的 IPU(Intelligence Processing Unit,智能处理单元)是一种新的AI加速器,为当前和未来的机器学习工作负载带来了前所未有的性能水平.它的独特的大规模并行多任务计算.单个IPU或跨

Google Cloud Next 云技术大会开幕;英伟达发布全新 Jetson TX2 嵌入式开发组件 | AI 开发者头条

▲内容预览: ● Google Cloud Next 云技术大会开幕 ● 英伟达发布全新 Jetson TX2 嵌入式开发组件,强化 AI 智能运算 ● IBM研发大数据模型,为控制埃博拉病毒传播大显身手 ● 谷歌开放大规模音频数据集 AudioSet,助力 AI 音频算法研究    每日推荐 ● 盘点近年来引用最多的深度学习论文 █ Google Cloud Next 云技术大会开幕 Google Cloud Next 云技术大会将于当地时间3月8日上午8:30在美国加州旧金山开幕(北京时间约

英伟达发布“后排驾驶员”AI,能够学习阅读唇语

英伟达公司在今年的消费电子产品展上公布的联合驾驶员"后座司机"AI可谓一鸣惊人.事实上,大多数与会者都被其在"车"中出色的唇语理解能力所震撼. 根据CES展会上公布的内容,这款联合驾驶员AI助手能够执行四项功能:面部识别.头部追踪.视线追踪与唇语阅读.自动驾驶AI属于GPU助力DRIVE PX 2平台的组成部分,其采用多款传感器以及由英伟达处理器支持的多种神经网络以实现功能. 英伟达公司的一位发言人在采访邮件中确认称,这款唇语阅读组件基于由牛津大学.谷歌DeepMi

马斯克首度承认自研AI芯片,或与英伟达“分手“

Musk公开承认特斯拉正在自研AI芯片 昨天,特斯拉CEO Elon Musk公开承认,特斯拉正在开发专用的AI芯片.而同时,英伟达也在NIPS上发布了迄今为止最强大的"TITAN V" PC GPU.此番Musk之举,或可视为与英伟达的"分手宣言". Musk昨天在NIPS上说,"Jim正在开发专用的人工智能芯片,我们认为这将会成为世界上最好的芯片." Jim Keller何许人也?他是著名的传奇芯片工程师,曾在AMD担任首席架构师,设计出K7

芯片巨头三国杀:AI加剧芯片厂商间竞赛,英特尔、英伟达、AMD竞相发力

随着智能手机和个人电脑销售数量减少,芯片厂商正在竞相开发人工智能产品,以推动业绩增长. 英伟达.英特尔.AMD和一大批初创公司正在研发新的处理器,以开拓人工智能软硬件市场.据IDC公司调查,AI软硬件市场每年增长率达50%. 据IDC估计,全球人工智能相关软硬件支出可能从今年的120亿美元扩大到2021年的576亿美元.其中,相当一部分支出来自数据中心,到2020年预计有四分之一的支出将用于与人工智能相关的计算. 近年来,一些人工智能技术已经成为核心能力,例如帮助亚马逊的Echo智能扬声器理解口

英伟达:超高的性能表现……足以支持AI应用

英伟达公司已经为AI应用设计出两款全新Tesla处理器,分别为P4与P40.   这款16纳米FinFET GPU采用英伟达Pascal架构,且延续今年6月发布的P100命名方式.其中P4为单高.单长PCIe卡,用于向外扩展服务器:而更为强大的P40则着眼于向上扩展设备. 这一新组合主要用于推理工作,即在硬件当中内置一套经过训练的AI模型.部分对应软件以及类似摄像头视频或者麦克风音频的输入数据,并由其据此提供决策.语音到文本转换以及对象分类等功能. 如今我们的深度学习模型已经发展到新的阶段--即

英伟达 CEO 黄仁勋解读人工智能:我们正活在科幻小说当中,AI 的发展速度将超越摩尔定律

编者按:本文发表于 VentureBeat,作者 Dean Takahashi,原标题<Forget about smart glasses - here come smart contact lenses>.由雷锋网编译,未经许可,不得转载. 上周,英伟达公布了 Q3 财报,震惊了华尔街.公司 Q3 营收为 20.04 亿美元,比去年同期的 13.05 亿美元增长 54%,比上季度的 14.28 亿美元增长 40 %.关于营收,此前 12 位分析师的预期为 16.80 亿美元,但新季度达到了