Google最新研究:让机器像人一样,“拍出”完美照片

雷锋网(公众号:雷锋网) AI科技评论按:Google的最新研究告诉我们,在摄影这种强主观判断的领域,机器也能像人一样审美,生成让摄影师都点赞的照片啦。具体是如何实现的,往下看吧!

雷锋网 AI科技评论将Google Research Blog的最新发文编译如下。

机器学习(ML)在许多目标明确的领域有优秀的表现。具有明确正误答案区分的任务将有助于训练,而且能让算法实现预设的目标,比如准确地从图像中识别物体,或者合理的将语言进行翻译。然而,也有许多领域的任务是很难客观评价的,在诸如评价一张照片美丽与否这种太主观的问题上时——这与每个人的审美有关,就不太适合用机器学习来解决了。

图:贾斯珀国家公园的一张专业摄影照

为了研究机器学习是如何学习主观概念的,Google针对艺术性的创作引入了一种试验性的深度学习系统。这个系统会模仿专业摄影师来展开工作。它的工作流程如下:从谷歌街景中浏览景观图,分析出最佳的构图,然后进行各种后期处理,从而创造出一幅赏心悦目的图像。

这位虚拟摄影师通过浏览阿尔卑斯山、加拿大的班夫及贾斯珀国家公园、加州Big Sur和黄石国家公园等地的4万张全景照片,创作了许多令人印象深刻的作品,其中一些甚至达到了专业水准——专业摄影师如此评价到。

训练模型
虽然照片中的美感可以用类似AVA系统中的数据集来模拟,但是就这么直接的用AVA系统来处理照片,可能会在美感上有部分方面的缺失,比如做出的照片过饱和。再者,如果想通过监督学习适当地从多个方面来学习美感,所需的标签数据集会很难收集,所以这也不是一个好方法。

他们的方法只需要一些高质量的照片,不需要后期前后图像的对比或额外的标签。这个系统能自动将照片中的美感解析成不同方面,每一方面都能通过相反的图像操作产生的负面例子来单独学习。

通过使图像处理半正交化,可以找到快速和独立的最优化步骤,从构图、饱和度/HDR水平和明暗的张力上对图像进行美化:

图:图(a)是全景图,图(b)将图(a)进行裁切,图(c)是对图(b)进行饱和度和HDR优化处理,图(d)是应用戏剧张力蒙版之后的效果。

他们用传统的图像滤波器生成了包括饱和度、HDR细节和构图的负面例子,还引入了一种名为戏剧张力蒙版(dramatic mask)的特殊操作,它是在学习明暗张力概念的过程中一同产生的。

这些负面例子是这样生成的:应用一组图像滤波器,随机地调整高质量照片的亮度,将图片的质量变差。在训练中,他们使用生成对抗网络(GAN),在这种模式下,生成网络会创建一个蒙版来改善负面例子中的光线,判别网络则试图将光线改善后的照片与样本照片进行区分。

与vignette这样的固定形状滤波器(shape-fixed filter)不同,戏剧张力蒙版增加了内容感知亮度调节部分。GAN训练天然的竞争性极大地丰富了调节图像特性的能力,在论文中可以看到更多的训练细节。

结果

下面是这种系统基于Google街景的一些创作。如下图所示,经过训练后能够判断美感的滤波器创造出了一些让人惊叹的照片(包括文中最初出现的照片):

图:加拿大,贾斯珀国家公园

图:瑞士,茵特拉肯

图:意大利,Parco delle Orobie Bergamasche公园

图:加拿大,贾斯珀国家公园

专业评估
为了评价这个算法的效果如何,他们设计了一个类“图灵测试”实验:将这个系统创作出来的照片和其他不同质量的照片掺杂在一起,然后把它们展示给几个专业摄影师。他们要求这些摄影师为每张照片评分,分数是基于如下标准:

1分:傻瓜式拍照,照片没有考虑构图以及光线等因素。

2分:没有摄影基础的一般大众拍出来的照片,看起来还可以,但没有明显的艺术感。

3分:半专业。照片中展示出了明显的艺术感,摄影师正朝着专业摄影师迈进。

4分:专业。

在下面的图表中,曲线显示了专业摄影师为已经预估分数的图片打的分数。对于他们预估的高分图片,大约有40%收到了“半专业”或“专业”的评价。

未来的研究

街道全景图为这个项目提供了一个测试平台。有一天,这种技术甚至可以帮助我们现实世界中拍出更好看的照片。

via:Google Research Blog

雷锋网 AI科技评论编译

本文作者:思颖

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-05 17:33:02

Google最新研究:让机器像人一样,“拍出”完美照片的相关文章

最新研究显示略微丰满的人最长寿

新华网东京6月19日电 长期以来,健康专家一直警告人们肥胖的危险,但日本一项最新研究表明,过于消瘦的人面临的健康风险更大,略微丰满的人最为长寿. 据媒体19日报道,日本东北大学医学研究生院的研究人员在日本宫城县对5万名40岁到79岁的人进行12年的跟踪调查后发现,人在40岁时,轻度超重者比过瘦者的平均预期寿命要长6年到7年,肥胖者比过瘦者的平均预期寿命也要多5年左右. 研究人员说,过去人们认为瘦人寿命短的原因是他们的免疫力相对较弱,血压也容易不稳定,但此次研究表明,即使除去这些因素,瘦人的寿命仍

世界机器人大会机器人青年科学家论坛:聚焦机器人青年科学家的最新研究成果

8月25日,2017年"WRC 世界机器人大会"在持续火热进行中,除主论坛外,各大分论坛活动也在有条不紊地开展,并吸引了众多对机器人领域感兴趣的观众前来参与.其中WRC 2017机器人青年科学家论坛,于当日下午1点30在北京亦创国际会展中心C 馆二层C会议室举行.据雷锋网了解,此次机器人青年科学家论坛由中国电子学会青年科学家俱乐部承办,中国科学院深圳先进技术研究院和清华大学协办.论坛议程主要包括嘉宾演讲和圆桌讨论两个环节. 论坛主席中国科学院深圳先进技术研究院研究员夏泽洋博士首先致欢迎

OpenAI最新研究:“对抗样本”能轻易黑掉AI系统,如何抵御?

雷锋网(公众号:雷锋网)按:近日,OpenAI发表最新研究,论述了AI安全领域的一大隐忧:"对抗样本",它可以轻易地让机器学习系统产生误判,这会对AI的应用实践产生影响.在这篇由"GANs"之父Ian Goodfellow领衔撰写的文章里,OpenAI针对"对抗样本"进行了防御策略的实验,其中有两种方法效果显著,但也并不能解决根本问题.OpenAI表示设计出抵抗强大.具有适应性攻击者的防御策略,是非常重要的研究领域.本文原载于OpenAI Blo

【Hinton实验室探访】Capsule后最新研究,用软决策树更好理解DNN分类

2012年,Geoffrey Hinton改变了机器"看"世界的方式. Hinton和他的两名学生Alex Krizhevsky和Ilya Sutskever一起,发表论文<ImageNet Classification with Deep Convolutional Neural Networks>,提出了深度卷积神经网络模型AlexNet,在当年的ImageNet大规模图像识别竞赛中获得冠军,将Top-1和Top-5误差分别降到了37.5%和17.0%,比此前的技术要好

毛红亮:对网站优化的最新研究结果

站长们,你们可知道以前的老优化模式已经OUT(过时)了.关于以前的老优化模式,我做了大量网站数据测试和分析.经过了3个多月的研究测试,最终得出了令人意外的几个结果,现在我把它公布出来,希望能给各位站长和SEOVR一点参考.下面的SEO研究结果都是对百度搜索而言的,对谷歌和其他搜索无效! 第一:网站排名和权重跟外链多少没有对应关系.也就是说,你的外链再强大,也许没有一个外链少的站排名高.也就是说,外链与网站排名没有任何关系,并非外链越多网站权重高!相当多的站长看到自己网站的排名低下,就奋不顾身的去

玩无人机,机器和人差多远?

这是一场用实际数据说明,机器和人相差多远的比赛. (IROS 2017无人机竞速表演环节,荷代尔夫特理工大学选手在尝试FPV操作) 在雷锋网(公众号:雷锋网)看来,IROS 2017的无人机竞速比赛的"考题"要比IROS 2016要略简单一些,但仍然没有哪支队伍成功穿越全部13个门,最终的冠军队伍也不过穿过了9个门,成绩为3分11秒:而在正式比赛结束后的有操控表演中,一位带着VR眼镜的选手用46秒就穿越了全部13个门.而我们知道,FPV(First Person View)无人机视角要

Facebook:不仅让机器“看”人,更要让机器理解人

导读:Facebook日前发布了一种名为Moments,使用人脸识别技术的功能.该公司称,只需要不到5秒钟的时间,它的人脸识别技术就能在800万张照片中迅速地找到你的脸,目前准确性可达到98%.不过,凭借更出色的电脑视觉和人工智能技术,这家社交巨擘最终希望实现一个更大的目标--让机器理解人. Facebook近日发布了一款名叫Moments的产品.它使用Facebook的人脸识别技术,为你的朋友扫描你的照片,然后让人们与一个特定群组(比如照片中的人)创建私人相册.这样一来,在大型活动结束后,人们

第4季度开元网络与品牌研究最新研究数据发布,海尔知名度最高

日前,2013年第4季度开元网络与品牌研究最新研究数据发布.在干衣机品牌网络知名度评估中,海尔的知名度最高,综合得分98.33分,排名第一,其次是松下等外资品牌及一些互联网品牌.据了解,本次网络知名度调查是根据数以百亿计中文网页进行全面.客观.科学的分析,为品牌营销提供理论依据,通常一个品牌在网络媒体被提及或曝光的频率越高,说明该品牌的用户关注度越高.知名度也越高.通过研究品牌在综合影响力排行前列的行业网站中的曝光度.博客用户量靠前的博客网站中的提及率.人气排行前列论坛的提及率,以及知名门户新闻

google最新消息 gg ad作出调整

google最新消息 gg ad作出调整,今天看自己网的站gg ad空间那标题字变细了,没有像以前那样式粗体显示了,根据这情形,我分析了GG可能是想增加用户的收入吧,或是其它策略喽,现在字体不变粗很多人更加以为是网站内容的一部分,这样对广告主也说不是什么好事,但是对我们网站主也说不能不说是一样好事情啊.