Facebook 推机器视觉方案,能轻易读懂图片信息

完善对象分割方法(Learning to Refine Object Segments)

论文摘要

要实现对象分割,需要获得两方面的信息,一是目标层级的信息,二是更低级别即像素级别的信息。这就为前馈网络提出了挑战:卷积网络中的底层获取了大量的空间信息,而更高层则需要目标层级的信息,无法随着对象的造型及外观变化进行调整,效果不佳。本次研究中,我们为目标分隔的前馈网络提出了一种新的自上而下的改善方法。这种由顶层到底层的结构能够有效地做出高保真目标图像。该方法与跳接相比,相同点是都在网络各层级中放大了图像特征,不同点在于,我们的方法不在每层中输出独立的预测,而是先在前馈过程中输出一个粗略的图像编码,然后再在由上至下的过程中,用底层的图像特征依次向上完善该编码。这种方法更加简单、快捷和有效。在最近流行的 DeepMask 网络中做出图像指令,我们的方法将图像精确度平均提升了 10-20%。另外,在总体网络结构的最优化问题中,我们采用了 SharpMask,与原有的 DeepMask 网络相比,速度提升了50%(8 秒/图)。

作者简介

Pedro O. Pinheiro,供职于 Idiap Research Institute 和 Ecole Polytechnique Federale de Lausanne(EPFL)。

Tsung-Yi Lin 来自康奈尔大学康奈尔技术研究院。

结论和场景应用

本文针对快速对象分割任务发展了一种新的网络结构,对前馈网络进行自上而下通路的完善。文中的模型使目标图像无论是在处理速度还是在质量方面都有了大的提升。该方法可以广泛应用在各种像素标注的任务中。

via Research at Facebook

PS:本文由雷锋网(搜索“雷锋网(公众号:雷锋网)”公众号关注)独家编译,未经许可不得转载!

可在此处进行原论文下载

推荐阅读:

论文精选 | 实现城市设备智能规划?——具有可选偏好的设施选址游戏

深度 | 计算机如何从乐盲到作曲家?建 28 层神经网络,听 8000 个 MIDI 乐章

本文作者:何忞

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-11-01 23:38:22

Facebook 推机器视觉方案,能轻易读懂图片信息的相关文章

Facebook将反馈融入AI系统,视觉障碍者现在也能“读懂”照片啦

雷锋网按:Automatic Alt-Text (AAT) 的发布让盲人(或使用屏幕阅读器的用户)更好地读懂新闻推送  (News Feeds) 里的照片的内容.以访谈,可用性测试以及调查为手段的用户研究给工具的发明提供了帮助.我们将在本文简要介绍这项工作的一些亮点,雷锋网(公众号:雷锋网)独家编译,未经许可不得转载. 这项工作的主要作者.数据科学家Shaomei Wu将会出席本周在波特兰举办的CSCW 2017,届时她将在会上详细介绍该工具的功能以及所进行的研究.如果您想面对面探讨,请在会上和

网站建设方案如何让用户轻松读懂看明白

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 网站建设方案的编写是合作网站项目的必备物料,在正式签约网站建设合同之前,网站建设公司都会出一份网站建设方案给客户.从另一个角度来说,网站建设方案也是网站开发的依据.昆明狼烟也是一家网站建设公司,并且已经跻身昆明网站建设十强品牌,昆明狼烟认为网站建设方案如何让用户轻松读懂.看明白,是一个值得思考和重视的问题. 一.少用专业术语 现在大家都在提用

来自大数据的反思:需要你读懂的10个小故事(一)

[编者按]这是近一年前<2015-07-28>发表于CSDN的文章这里归集此处仅作存档. 自2011年以来大数据旋风以"迅雷不及掩耳之势"席卷中国.毋庸置疑大数据已然成为继云计算.物联网之后新一轮的技术变革热潮不仅是信息领域经济.政治.社会等诸多领域都"磨刀霍霍"向大数据准备在其中逐得一席之地. 中国工程院李国杰院士更是把大数据提升到战略的高度他表示[1]数据是与物质.能源一样重要的战略资源.从数据中发现价值的技术正是最有活力的软技术在数据技术与产业上的

大数据究竟是什么?一篇文章让你认识并读懂大数据

在写这篇文章之前,我发现身边很多IT人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很"土鳖":二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然. 我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆

独家 | 一文读懂Hadoop(二)HDFS(上)

随着全球经济的不断发展,大数据时代早已悄悄到来,而Hadoop又是大数据环境的基础,想入门大数据行业首先需要了解Hadoop的知识.2017年年初apache发行了Hadoop3.0,也意味着一直有一群人在对Hadoop不断的做优化,不仅如此,各个Hadoop的商业版本也有好多公司正在使用,这也印证了它的商业价值. 读者可以通过阅读"一文读懂Hadoop"系列文章,对Hadoop技术有个全面的了解,它涵盖了Hadoop官网的所有知识点,并且通俗易懂,英文不好的读者完全可以通过阅读此篇文

一篇对大数据深度思考的文章,让你认识并读懂大数据

在写这篇文章之前,我发现身边很多IT人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很"土鳖";二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然. 我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆

读懂系统负载(Load Avg)的含义 | Devops

有过运维Linux服务器的选手,想必对于系统平均负载(load averages)参数不会陌生吧,我们可以通过top, htop, uptime这些命令找到它们(如下图),那么我们又改如何理解它们呢,今天这篇就来一起看看应该如何读懂这个load averages参数. 系统平均负载的取值分别来自1分,5分,15分这三个时间区间,对于单核CPU而言,当平均负载为0时,表示CPU完全空闲,当平均负载为1时,表示CPU为满负荷状态,但两个极端都不应出现在我们的服务器上,前者说明系统没有被充分利用到,后

互联网女皇报告精华版:5分钟读懂互联网趋势

中介交易 SEO诊断 淘宝客 云主机 技术大厅 [摘要]移动时代已经到来,虽然移动广告增长乐观,但移动应用营收占移动端整体收入的68%,远高于广告. "互联网女皇"玛丽•米克尔(腾讯科技配图) 腾讯科技 孙实 5月29日报道 今日,"互联网女皇"玛丽•米克尔在美国Code大会上发布了<2014年互联网趋势报告>.165页的报告或许让你感到一些疲惫,腾讯科技推出报告精华版,让你几分钟读懂互联网未来趋势. 移动设备仍有增长空间 智能手机用户仅占52亿移动用户

产品设计:读懂iPad 的工业设计

By PJesus Diaz from Gizmodo sillymouse 译, Boday 校, 转载请注明 ifanr.com 译文链接. 译注: ipad上市以来各大媒体充满了各种评论.虽然很多都是溢美之词,但是仍然不能抹杀优秀文章的价值.这一篇就是如此,这是 Gizmodo 的一篇关于 iPad 工业设计的文章,评价甚高,我们翻译此文并不代表完全认同其观点. 苹果公司的最新产品 iPad 很好地诠释了 Dieter Rams 著名的"优秀设计的十大准则",这十条金科玉律是每一