微软的这项新技术证明深度学习还能更“深入”

计算机视觉已经是日常生活的一部分。借助这种技术，Facebook可以识别你上传到社交网络的照片上的人物；Google　Photo能够自动在收藏行列中找出特定的图片，以及识别出各种各样的东西……这样的应用已经在互联网中流行已久。

所有这些“识别”都源自于一种被称为深度学习的人工智能技术。但就在这种技术被大肆炒作的几年时间中，来自微软研究院的一项新实验证明这只是人工智能的开始——深度学习还可以更深度。

深层神经网络的突破：152个层级

计算机视觉革命是一场持久的斗争。2012年，这项技术迎来了关键的转折点，那时加拿大多伦多大学人工智能研究者赢得了一场叫作ImageNet的比赛。ImageNet让一群机器PK图像内容识别，对图片中的小猫、小狗和白云，看看哪台计算机的识别准确率更高。当时，由研究员Alex Krizhevsky和教授Geoff Hinton组成的多伦多大学团队在比赛中使用了深层神经网络技术，这种技术的算法可以让机器基于目前最大的图像数据库进行分类识别，而不是依靠人为制定的规则。

多伦多大学团队使用非监督的逐层贪心训练算法取得的成果，为训练深度神经网络带来了希望。从那时候开始，包括Facebook、Google、Twitter和微软在内的互联网巨头纷纷开始使用相似的科技来建造自己的计算机视觉系统。微软研究院主管Peter Lee表示：“还不能说我们的系统能够像人类眼睛一样进行观察，但我敢说，在某些特定的、狭义的任务上，计算机视觉可以媲美人类。”

粗略地说，神经网络兼用硬件和软件来模拟近似人类的大脑神经元网络。这个想法诞生于上世纪80年代，但直到2012年，Krizhevsky和Hinton基于图像处理单元、GPU运行的神经网络技术才算真正地推动了这项技术的发展。这些专门的处理器和其他高度图形化软件最初都是为了游戏中的图像渲染而设计，但事实证明，它们也适合于神经网络。Google、Facebook、Twitter、微软等公司如今都使用GPU来驱动人工智能来处理图像识别，以及包括互联网搜索、安全防御等其他任务。现在，Krizhevsky和Hinton都已经加入了Google。

如今，最新一届ImageNet的赢家正在探求计算机视觉的下一个突破点——以及人工智能更加广泛的应用。上个月，微软研究院团队摘得了ImageNet的桂冠，他们使用了一个“深层残差系统”来指导神经网络结构的设计。目前普遍使用的神经网络层级能够达到20到30层，在此次挑战赛中该团队应用的神经网络系统实现了152层。ImageNet挑战赛去年获胜的系统错误率为6.6%，而今年微软系统的错误率已经低至3.57%。

而这也表明，在未来几年里，利用大型的GPU集群和其他专属的处理器，我们不仅能够改善图像识别，而且还能解决对话识别、自然语言理解等人工智能服务。换句话说，目前深度学习所能达到的发展程度愈加接近其本应具有的潜力了。Lee表示，微软正致力于发掘更巨大的设计空间。

深度神经网络以“层”的形式分布。每一层都具有不同系列的运算——也就是算法。某一层的输出会成为下一层的输入。笼统地说，如果一个神经网络是设计用来进行图像识别的，其中某一层神经将负责寻找图片的一系列特性——边、角、形状或者纹理——而下一层神经则负责寻找另一个系列的特性。这些层级就构成了神经网络的”深度“。负责监督ImageNet大赛的北卡罗来纳大学研究员Alex Berg介绍：“一般而言，神经网络越深度，机器学习就越容易。”

所以，微软研究院团队应用的152层神经网络系统能够识别出更多的对象属性，大大提高了图像识别的准确率。“它们可以学习到更多微妙的东西。”

事实上，过去这种很深的神经网络并不可行。部分原因是，在通过每一层级的反传训练中，反传监督信号幅度会迅速衰减甚至消退，这让整个神经网络系统的训练极为困难。根据Lee的介绍，微软通过使用深度残差网络解决了这个困难——这个深度残差网络可以在不需要时跳过某些层级，而需要用到时又可以重新拾回。“跳过某些不需要的层级，有助于保持反传监督信号的幅度。”“残差学习”最重要的突破在于重构了学习的过程，并重新定向了深层神经网络中的信息流，很好地解决了此前深层神经网络层级与准确度之间的矛盾。

Berg表示，这个新的设计不同于以往的神经网络系统，相信其他大公司和研究者都会效仿。

“深层”的困难

另一个问题是，构建这样一个宏大的神经网络是非常困难的。落地于一套特定的算法——决定每一个层级应该如何运作、如何与下一个层级进行传递——可以说是一个史诗级的任务。不过，在这里微软同样有个诀窍——它设计了一个计算系统，可以帮助构建这些神经网络。

微软研究院团队成员之一孙坚解释称，研究人员可以为大规模的神经网络寻找出可行的排列，然后系统可以对一系列相似的可能性进行循环运算，直到计算出最有效的排列。“大多数情况下，在经过一定次数的尝试后，研究人员会从中总结、反馈，然后为下一轮的尝试给出新的决策。我们可以将这种方式成为人工辅助搜索。”

深度学习创业公司Skymind首席研究员Adam Gibson表示，这样的做法越来越流行，“这叫做超参数优化算法。”“人们可以加速机器集群的运算，一次同时运行10个模型，然后找出效果最优的一个。”

“归根结底是一个关于硬件的问题”

按照孙坚和Peter Lee的描述，这种方法并不是在这个问题上“蛮干”。“在有着大量的计算资源后，系统自然就可以计算出一个庞大的组织，然后在这个具有无限可能的空间内进行搜索。只是，目前世界上还具备这样充足的计算资源，因此我们主要还是依靠像孙坚这样聪明的研究员。”

但Lee强调说，多亏了新的技术以及计算机数据中心，才使得发展深度学习有了巨大的可能性。如今，微软的重要任务之一是创造出开发这些可能性的时间和计算机系统。这就是微软为何不仅努力改进GPU集群的运算能力，还开发其他诸如现场可编程门阵列（FPGA）等专用处理器的原因之一。而除此之外，微软研究员还需要开发更多试验性的硬件平台。

如Gibson所言，深度学习愈加变成为一个“硬件问题”。确实，我们仍需要高级研究员来指导神经网络的构建，但所谓寻找新的途径更多地是开发适用于更多硬件平台的新算法，而更多更好的硬件支撑可以说是一个捷径。

本文转自d1net（转载）

时间： 2024-10-23 15:03:54

微软的这项新技术证明深度学习还能更“深入”的相关文章

CCAI 2017 | 专访德国语言技术领军者 Hans Uszkoreit：深度学习还不足以解决 NLP 核心问题

会前,我们采访到了大会 Keynote 嘉宾.德国人工智能研究中心科技总监 Hans Uszkoreit 博士. Uszkoreit 博士是中德两国人工智能合作的核心人物,负责德国人工智能研究中心在中国的所有合作项目,今年 3 月,他刚被任命为在北京新成立的人工智能技术中心(AITC)总监兼首席科学家.在访谈中,Uszkoreit 博士谈到了人工智能在工业 4.0 和商业智能上的应用,以及中.美.欧在人工智能领域的差异. 对于他的老本行,Uszkoreit 博士认为,语言技术是人工智能的核心部分

朋克学术大牛上演“换头术”，原来深度学习还能这样玩！（附论文下载）｜SIGGRAPH ASIA 2016

电影及视频游戏行业的新兴及发展,无疑是计算机图像研究领域的一剂催化剂.SIGGRAPH ASIA 2016 的学术主席,伦敦学院教授 Niloy Mitra 在开幕式上表示,「计算机图像技术正在对实体产业产生影响,比如为产品视觉化及图像优化提供工具.这项技术源于视觉效果及游戏产业的计算机图像需求,并为数学.物理.艺术及计算机科学提供一座融合的桥梁.」而作为 A 类会议的 SIGGNRAPH ASIA 2016,又怎能错过这一领域的学术交流及分享?今天早上的主题分享为「geometric dee

香港科技大学杨强教授：深度学习如何才能更靠谱？

雷锋网AI科技评论按:7月22-23日,第三届中国人工智能大会(CCAI 2017)在杭州国际会议中心举行.其中来自香港科技大学的计算机与工程系主任.AAAI Fellow杨强教授发表了<深度学习的迁移模型>主题报告.本文主要阐述了杨强教授在大会中所讲的如何将迁移学习和深度学习相结合,使深度学习模型变得更加可靠,以及具体的实际应用案例. 杨强教授从深度学习模型的共性问题谈起,深度剖析如何使深度学习模型变得更加可靠,在数据变化的情况下,如何让模型持续可用.报告谈到,迁移学习有小数据.可靠性.个性

能准确“猜透”玩家心理，深度学习让游戏更智能

[编者按]随着深度学习技术的发展,当下深度学习已经不止于理解我们的语言以及辨识我们的声音,位于美国北卡罗来纳州研究人员就建立了一个深度学习系统,这个系统可以在一个开放式的视频游戏环境中以63%的准确度预测玩家的目标,联想到谷歌先前以4亿美元收购DeepMind,不难发现深度学习在视频游戏领域的竞争也在不断增强. 以下为译文: 深度学习现在炙手可热,尽管大多数时候我们知道它能识别图片中特定的对象,理解我们的语言或识别我们的声音.但是北卡罗来纳州立大学的最新研究表明,一种深度学习模型也可能让我们的游

商汤科技曹旭东：为何深度学习几乎成了计算机视觉研究的标配？| 硬创公开课

联合编辑宗仁黄鑫雷锋网(公众号:雷锋网)雷锋网雷锋网今年夏天,雷锋网将在深圳举办一场盛况空前的"全球人工智能与机器人峰会"(简称CCF-GAIR).大会现场,谷歌,DeepMind,Uber,微软等巨头的人工智能实验室负责人将莅临深圳,向我们零距离展示国外人工智能震撼人心.撬动地球的核心所在.如果你不想错过这个大会的盛世狂欢,请点击文末购买我们的早鸟票. 本次CVPR 2016上,深度学习几乎成了如今计算机视觉研究的标配,人脸识别.图像识别.视频识别.行人检测.大规模场景识别的相

真的，关于深度学习与计算机视觉，看这一篇就够了 | 硬创公开课

今年夏天,雷锋网将在深圳举办"全球人工智能与机器人创新大会"(GAIR),在本次大会上,我们将发布"人工智能与机器人Top25创新企业榜",慧眼科技是我们重点关注的公司之一.今天,我们邀请到慧眼科技研发总监李汉曦,为我们带来深度学习与计算机视觉方面的内容分享.雷锋网雷锋网(公众号:雷锋网) 嘉宾介绍:李汉曦,慧眼科技研发总监,澳大利亚国立大学博士:曾任澳大利亚国家信息通信公司(NICTA)任高级研究员:人脸识别,物体检测,物体跟踪.深度学习方面的专家,在TPAMI,

《深度学习：Java语言实现》一一1.1人工智能的变迁

1.1人工智能的变迁那么,为什么深度学习突然站到了聚光灯下?你可能会问这个问题,特别是如果你熟悉机器学习的话,因为深度学习与机器学习算法并没有那么大的差异(别担心,如果你对此了解不多,我们在本书后面会逐一介绍相关的内容).实际上,我们可以说深度学习是神经网络(这是一种机器学习算法)的改进版,神经网络试图模拟人类大脑的结构.不过,深度学习能取得的成绩要深远得多,并且它也不同于任何一种机器学习算法(包括神经网络).如果你了解深度学习经历过什么样的发展过程,就能对深度学习本身有更深入的理解.既然如此

深度学习入门，以及它在物联网和智慧城市中的角色

本文作者Ajit Jaokar是futuretext的创始人. 这篇文章主要讲述一个正在演化的论题.现在,我将主要解释深度学习的基础,以及深度学习算法如何应用于物联网及智慧城市等.尤其是,像我接下来论述的一样,我对于使用物联网数据来完善深度学习算法很感兴趣.我在物联网数据科学课程项目中阐述过这些想法,这个课程的目的是培养物联网数据科学家(与我在牛津大学和马德里理工大学的课程类似).我还会在上海同济大学城市科学国际会议.旧金山物联网大会(IoTworld event)上针对这些理论进行论述.如果你

哺乳动物大脑神经元也能做深度学习，未来10年神经科学与人工智能将迎突破

神经网络受生物神经网络启发而来,但大脑里的学习过程真如深度学习那样吗?这个问题的答案有望实现更强大的深度学习模型,也有助于进一步了解人类的智能. 12月5日,CIFAR研究员.多伦多大学的Blake A. Richards和同事在期刊eLife发表了论文<尝试用分离的树突进行深度学习>(Towards deep learning with segregated dendrites)[1].他们在论文中提出了一种算法,对大脑中可以如何进行深度学习进行了模拟.他们构建的网络表明,某些哺乳动物神经元

猜你喜欢

SEO优化打造网站优质内容的三元素

湖南SEO优化简子针对百度SE星火计划,谈谈如何做网站优质内容.尽管SE一直在打击垃圾网站.屏蔽无意义的重复内容,但目前的互联网上垃圾网站.重复内容仍大量存在.无论是我们在搜索引擎搜索长尾词,或在论坛 ...

c#获取本机电脑相关信息

建立一个类.然后读取信息.调用代码如下.HardInfoClass myclass=new HardInfoClass(); textBox1.Text=myclass.GetHardDiskID ...

用ASP.NET包装第三方组件以提供服务的尝试

asp.net 不少应用程序的作者为编程人员提供了可以在其它程序中复用的组件.我们通常会在自己的程序中引入这些第三方组件,调用其中现成的函数来实现相对复杂的功能.事实上,我们也可以通过网络发布 ...

桌面虚拟化中的应用程序整合

作为一个好的顾问,我们必须了解桌面虚拟化的架构,知道其与传统桌面的区别,如下图: 如上图,一个完整的桌面包含以下三个方面: 操作系统应用程序用户部分(包括用户数据和用户配置文件) 桌面虚拟化将这三 ...

Windows Azure Virtual Machine (17) Virtual Machine成本分析

在Windows Azure VM里,计费模式是和以下几个因素有关: 成本1: VM Type and VM Size 具体的计费模式请参考这里 http://www.windowsazure.com ...

打造自己的Windows终端服务客户端

1. 首先确保你的机器上存在mstscax.dll,如果没有这个文件,可以从http://download.microsoft.com/download/whistler/tools/1.0/wxp/ ...

Word中如何只选择单词的部分字母

问:我希望选中某个单词其中的一部分字母,可当我开始拖动单词时,Word总是自动选定整个单词和其后的空格,怎么办? 答:你可以指定是否自动先定整个单词.方法是:在工具菜单上,单击选项命令,然后单击编辑选 ...

Word文档内容的选取技巧

在 word 2007 文档的编辑过程中,选取动作是比较常用到的一个操作.但是如果我们只知道用鼠标左键来选取文档内容那是远远不够的,比如当你需要选取不连续的内容的时候就不能单纯依靠鼠标左键来完成选取动 ...

11个极度专注细节的优秀网页设计

著名的室内设计大师Charles Eames曾说过,"细节并不只关乎它们本身,它们还构成了设计."的确,每一个网页都是由无数的细节构成,而其中的内容也是同样由这些细节连接组织到 ...

win8无法使用蓝牙收发文件的解决方法

们知道两台开启蓝牙的手机之间可以相互传递接受文件,不用再用U盘或者其他文件传输方式传递接受文件了,使用非常方便,但你知道win8.1系统下的蓝牙配置后也可以和手机间相互传递文件吗,跟着小编走,看小 ...

MSAPI.DAT，WINDNSAPI.DAT是什么文件

小编通过分析发现,这些文件均是盗取聊天工具账号密码的木马,这些MSAPI.DAT,WINDNSAPI.DAT,MSSETUP.DAT能够盗取QQ,Skype,MSN等等主流的聊天工具,危害十分严重. ...

win7旗舰版系统下剪贴板出错导致无法粘贴如何解决

方案一. 在Win7系统下新建一个用户,由于Win7出现某项程序或者是功能无法执行的时候,很多时候是由于误操作导致禁止该程序在该账户登录时使用,而如果重新建立一个登陆账户,并且顺利登陆进入的话, ...

cygwin安装使用方法

本来安装个软件是个很简单的事情,不过初次接触cygwin.往往有很多人折腾了数日才搞定.主要是原因是:我们以往在windows上装个软件,通常只是在网上下载个setup.exe安装包,然后就可以在 ...

如何在Mac下像Acdsee那样管理图片

前言: win下面有AcdSee这个好用的图片软件,mac下却没有. 很多初步从pc转到mac的用户都觉得很不方便,其实mac已经为我们内置了很多acdsee软件的常用功能,只是我们一直没发现. ...

显示器待机状态蓝屏的故障

问:我有一台明基液晶显示器,以前使用VGA接口时一切正常,现在使用HDMI接口,关机后提示HDMI接口未连接,然后就蓝屏,但主机已正常关机.请问这是为什么? 答:你所说的蓝屏其实并不是通常所说的系 ...

RFM：一种广泛使用的查询模型

RFM模型:R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额.一般原始数据为 ...

verilog顶层文件出现了问题

问题描述 verilog顶层文件出现了问题 module Count (rst_n,clk,outh); input rst_n,clk; output [3:0] outh; reg [2:0] o ...

日本小哥如何使用深度学习和TensorFlow种黄瓜?

◆ ◆ ◆ 导读现在说机器学习和深度学习的应用只受限于人们的想象力并不夸张.不仅全世界的数据科学家们为之着迷,甚至在日本的农场,一位小哥为了减轻妈妈的工作负担,也开始尝试采用深度学习和Tensor ...

PHP 错误处理机制_php技巧

在日常的项目开发过程中,总是会出现一些我们意想不到的异常错误,如果我们对此没有进行相对完善的处理,那么程序看上去也很不专业,也很可能就会成为别人攻击系统的有效信息:有些错误异常会终止脚本执行,这个时候 ...

站内共用弹窗及模块扩展

网站用到弹窗已经不是什么稀奇的事情了,并且在站内很多页面都用到了大小不一及需求不同的弹窗,so今天就在这里聊一下站内弹窗共用的问题.(兼容各大主流浏览器,但无视IE6) 页面大致是这样的,常见的商品操 ...

PHP面试题集

汗~~做了一下网络上的php题目,不知不觉做到现在.....把答案贴出来如果有问题请欢迎补充和指正 1.用PHP打印出前一天的时间格式是2006-5-10 22:21:21(2分) $a = d ...

星河互联刘玮玮：Echo卖疯了，为什么擅长制造爆款的中国人又没跟上？

Amazon Echo 横空出世,一年多时间出货量达到500万台.eMarketer 的数据显示,在2017年一季度美国语音助手市场中,Amazon Echo 的市场份额达到 70.6%,远远超过了 ...

地方-报出java.lang.ClassNotFoundException

问题描述报出java.lang.ClassNotFoundException Servlet.service() for servlet [tomcat.com.MyTestServlet] in ...

PhotoShop颜色范围给美女照片抠图教程

我们介绍一种简单的photoshop抠图教程,主要是利用"颜色范围"命令将一个性感的美女抠出,换到海岸的背景,让她到海边旅行去~ 完成效果素材照片: 过程一,第一步打开靓女素材照 ...

Linksys宣布所有WRT路由开始全面支持DD-WRT

Linksys刚刚在CES展会上宣布,所有的WRT路由器都开始支持DD-WRT,这样一来Linksys也就成为在这个类型的产品中首家全面拥抱开源解决方案的企业.Linksys是全球打造网络硬件的著名企 ...

OGNL表达式struts2标签“%，#，$”

OGNL表达式struts2标签"%,#,$" 一.什么是OGNL,有什么特点? OGNL(Object-Graph Navigation Language),大概 ...

Java ssh框架开发的网站想每隔一段时间自动调用一段代码要怎么实现？

问题描述 Java ssh框架开发的网站想每隔一段时间自动调用一段代码要怎么实现? 用Java ssh框架写一个酒店管理系统,其中有一个预定客房模块,我希望过一天就查一下预定客房记录表如果某个客房这天 ...

投资分布式屋顶光伏项目需要注意的几点

我国大型地面光伏电站经过了"630",又迎来了竞争性配置时代,标杆电价的下降也一直被认为是必然的趋势.而分布式屋顶光伏电站,不受国家规模指标限制,自发自用的方式下受国家补贴因素影响 ...

现状：播控平台催生正规军出现

摘要: 高清播放机(有时又被称为电视盒)对很多玩家来说都不陌生,只是一直以来给人的印象都是一些偏山寨气息的品牌在生产和销售:但是近一两年乐视.小米等明星企业也推出了类似的高清播放机(有时又被称为电视 ...

如何在vs里面用C#语言调用新浪微博API获取用户数据

问题描述我已经成功申请到了一个新浪微博开发者APP,现在想在VS里面用C#语言通过新浪微博公开的API采集名人堂用户个人基本信息以及用户的关注关系列表等信息,现在不知道怎么做,求大神指点一下基本步骤 ...

热搜

微软的这项新技术证明 深度学习还能更“深入”

微软的这项新技术证明 深度学习还能更“深入”的相关文章

微软的这项新技术证明深度学习还能更“深入”

微软的这项新技术证明深度学习还能更“深入”的相关文章