谷歌用于图像识别的 TensorFlow 模型已开源

随着announcement宣布将用于图像识别的TensorFlow模型,以及对新老方法的精确度和性能进行比较评测的测试方法开源,谷歌Google在过去几年中迈上了一段全新的旅程。2014年的Inception V1,2015年的Inception V2,以及最新发布的Inception V3模型逐渐完善,分别以89.6%、91.8%,以及93.9%准确度的成绩位居ImageNet 2012图像分类测试的前五名。在使用BLEU-4指标衡量机器生成的注解的测试中,通过将一种自然语言的语句翻译成另一种语言并对准确度进行比较,基于TensorFlow的方法相比原本最先进的DistBelief模型也取得了领先两分的成绩。

在从原有实现中移植模型,并对其进行完善的过程中,最重要的问题之一在于对图像中的对象进行分类,以及对对象进行描述并将一张图像中的对象与另一张图像中的对象进行关联。为了解决这一问题,该模型在分类操作之外增加了一个微调操作,可以让模型提取用于描述对象细节的有用信息。通过将图像分类操作拆分为多个步骤,首先识别其他操作中确定的对象,并增加形容和预处理操作,并为要处理的注解提供必要的结构,使其在语句结构上更为准确,更类人。

该模型有一个范例:识别铁轨上的火车图像,随后识别火车为黄色夹杂着蓝色。最终合成的结果识别为:黄蓝相间的火车正行驶在铁轨上。虽然在本例中模型能否确定静态图片中对象是运动中的或静止的并不重要,但所输入图像的注解在训练数据中将类似图像中的对象描述为运动中的或静止的,这很重要。

该模型可将之前学习到的图像注解中的不同元素组合在一起,针对更多图像创建全新的注解,新的图像中可以包含多个已分类对象,但所有对象并未包含在同一个训练数据集中。在这个范例中,该模型自行创建出一个之前并不存在的注解。

在对原有模型的实现与新的模型进行性能评测对比发现,在通过Nvidia K20 GPU运行DistBelief以及全新的基于TensorFlow的Inception V3进行的性能对比中,TensorFlow的训练时间(0.7秒)仅为DistBelief(3.0秒)的25%。除了基于TensorFlow的Inception V3图像分类模型,谷歌还提到了即将发布的Inception-ResNet-v2模型,但并未谈到有关该模型的性能评测信息。虽然未使用训练数据集,但他们会通过人工生成的图像注解作为最基础的训练数。

文章转载自 开源中国社区 [http://www.oschina.net]

时间: 2024-09-24 08:21:00

谷歌用于图像识别的 TensorFlow 模型已开源的相关文章

TensorFlow Agents日前开源,轻松在TF中构建并行强化学习算法

用于在TensorFlow中构建并行强化学习算法的高效基础架构范例TensorFlow Agents日前开源,这个项目是由谷歌的两位研究员James Davidson.Vincent Vanhoucke,以及Danijar Hafner共同研发的.关于这个项目的开源信息他们在GitHub上进行了介绍,雷锋网 AI 科技评论将内容进行编译整理. TensorFlow Agents TensorFlow Agents为强化学习提供了优化的基础架构,它将OpenAI gym接口扩展到多个并行环境,并能

用户能在平板上快捷地创建用于3D 打印的模型

已有32年历史的知名3D 设计软件开发商Autodesk 此前曾在iPad上推出123D Design,让用户能在平板上快捷地创建用于3D 打印的模型. 本周三,该公司CEO Carl Bass 在硅谷的一个DIY 主题活动上表示,今年内,将针对专业级用户推出3D 打印机及配套软件平台Spark--这是Autodesk 首次涉足硬件领域--该产品定价在5000美元左右(最终定价仍未敲定),可用于打印小型医疗物件.珠宝等物品. Bass 指出目前市面上有很多3D 打印机生厂商纷纷推出独家软件和独家

Google 恶意软件检测系统 “Santa” 已开源

一.项目介绍 目前,Google公司正在为macOS平台开发一款恶意软件检测系统.根据Softpedia网站的最新报道,该项目目前已开源,项目代码托管在GitHub平台上.这个名为"Santa"的项目由Google公司的Macintosh研发团队负责开发的,软件当前的版本为0.9.12. 正 如Google公司描述的那样,"Santa"项目并不是一个传统意义上的反病毒引擎,它只能够将某些macOS平台的恶意进程加入黑名单或白名单之中. 除此之外,Santa的图形用户

谷歌Android团队成员奎鲁已离职,加盟雅虎

据科技博客AllThingsD报道,谷歌前Android团队成员让-巴普蒂斯特·奎鲁(Jean-Baptiste Queru)已离职加盟雅虎. 根据LinkedIn上的信息,奎鲁在雅虎移动团队供职,担任架构师和高级首席工程师.在CEO玛丽莎·梅耶尔(Marissa Mayer)上任后的一年多里,雅虎不断通过人才收购来扩张移动团队. 奎鲁于周二在Twitter上宣布他的离职消息.他之前在谷歌出任Android开源项目(AOSP)技术主管,负责管理AOSP的源代码等工作. 雅虎周二早上发布推文证实了

IFTTT 加入开源大家庭,已开源5个项目

IFTTT 刚刚开源了 5个项目,存放在 GitHub 上,这些项目可以被任何人用来集成 IFTTT 的自动化到他们的 apps 和服务上. 上周,微软和谷歌宣布 办公软件在 IFTTT 得到支持,而这次 IFTTT 开源5个项目,让我们看得这些福利扩大到更多的 apps 和服务上.这 5个开源项目是: JazzHands (Objective-C) -- 一个简单的基于关键帧的动画框架,用于 UIKit . RazzleDazzle (Swift) -- 一个简单的基于关键帧的动画框架,用于

谷歌CEO拉里·佩奇确已失声 仍继续执掌公司

谷歌公司表示,近来因病失声的首席执行官(CEO)佩奇仍在继续执掌公司,而且仍然参与所有战略决策. 谷歌周四宣布,该公司2012财年第二季度营收(扣除了26亿美元的流量获取成本以及摩托罗拉移动的营收)达83.6亿美元.而按非美国通用会计准则(Non-GAAP)计算的每股收益为10.12美元.分析师平均预期该公司销售收入为84.1亿美元,每股收益为10.04美元. 盈利超预期以及付费点击率攀升足以促使谷歌股价在盘后交易时段最高上涨3%,至610.51美元. 谷歌网站营收同比增长21%,而其合作伙伴网

谷歌捐款未到位 回应款项已全面划拨

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 谷歌今日对外发布声明,针对被某媒体指责质疑Google中国等11家企业承诺的救灾捐款未到位一事,称未到位的200万美元是专用于震后儿童项目,这笔款项已在谷歌内部全面划拨,在震后重建的儿童项目上,公司早已委派专人,专门监督,整体项目已经进入实质性实施阶段, 今日有媒体称,商务部新闻办公室公布的"外商投资企业.跨国公司和港澳台企业向灾区

谷歌大布局,虚拟现实大风已起

Ingress是什么?是谷歌最酷极客文化通行证,也是谷歌得力的潜在数据收集者.但当谷歌准备大举进军虚拟现实领域时,Ingresss也许正在为谷歌在下一个时代的故事埋下伏笔. 钛媒体注:Ingress是什么?是比办健身年卡还有效的瘦腿神器,也是让玩家齐聚一堂的超级粘合剂:是谷歌最酷极客文化通行证,也是谷歌得力的潜在数据收集者.但仅仅如此吗? 在谷歌一连串奇葩项目中,唯有它显得意图暧昧.就在刚刚结束的Facebook创始人扎克伯格的访华演讲中,他提到了一个Facebook未来的重要方向:虚拟现实.而

谷歌为什么要开放TensorFlow

◆ ◆ ◆ 导 读 我们认为艺术基本上是人类事业,但近几年我们发现,机器也可以理解创造力.机器算法可以评估唱片公司和电影公司的音乐和影片.一位音乐教授甚至创建一个程序写出了广受好评的作品.   矛盾的是,研发出能够进行艺术创作的机器算法是人类能力的又一突破.与传统的挖掘机和从事汽车制造的机器不同,进行艺术创作的算法需要去理解一些甚至人类自己都很难表达的东西.这就是谷歌Magenta项目的意图:研发能够进行艺术和音乐创作的机器学习工具.   Magenta是建立在机器学习工具库TensorFlow