MIT开发新型神经网络训练技术,打开AI决策黑箱

神经网络是一种模仿生物神经网络(如大脑)的结构和功能的数学模型或计算模型,它能在训练数据的过程中寻找模式以对数据进行预测和分类。近年来,神经网络的研究极大促进了人工智能的发展,科学家用它开发出不少高性能的系统应用——比如用神经网络识别数字图像中的某些对象或推断文本主题等。

虽然神经网络在受到训练之后能够很好地将数据分门别类,但是,即使是它的设计者也无从得知它们是如何思考的。它就像一个黑匣子。若是进行图像识别,也许还能通过反向运行神经网络找出它识别和决策的内在因素,正如雷锋网(公众号:雷锋网)文章《深度 | Nature:我们能打开人工智能的“黑箱”吗?》中曾提到的,Tyka 和 Google 的研究员为了深入研究黑箱问题而开发的 Deep Dream 算法,从一个图形开始,好比说一朵花或者一个沙滩,通过修改它来提高特定的顶级神经元的反应。相比之下,文本处理系统的决策过程就较为晦涩难懂了。

在由计算机语言学协会(the Association for Computational Linguistics)举办的会议中,研究人员们将会讨论自然语言处理中的一些经验。来自 MIT 计算机科学及人工智能实验室( CSAIL )的研究院会展示一种训练神经网络的新方法。论文中表示这种新方法不仅能做预测和分类,更重要的是能给出其决策背后的原因。

“在实际应用中,有时人们会特别想知道一个模型到底为什么能做出这样那样的预测,” MIT 电气工程和计算机科学研究生,同时也是该论文的第一作者,Tao Lei 说道,“医生不相信机器学习,主要也是因为它做出的决策无依据可寻。 ”

Regina Barzilay 是 Delta 电子电气工程与计算机科学教授,同时也是 Lei 的论文指导顾问,他说道,“预测错误所造成的成本损失是极高的,不仅在医疗领域,在所有领域都是如此。因此你得说清楚根据机器学习的预测做出进一步行动,背后的原因是什么 。”

“而且,这项工作涉及范围很广,” MIT 电气工程和计算机科学教授,该论文的第三作者 Tommi Jaakkola 表示道,“你可能不仅想弄清楚一个模型是如何做出正确预测的,而且还想对它应做出的加某些影响预测类型施。一个完全不懂机器学习的外行该如何与一个受过算法训练的复杂模型进行对话?如果模型能告诉你做出某项预测背后的原因是什么,人们也许就能以一种新的方式和模型进行互动。”

| 虚拟大脑

文章开头已提到过,神经网络是模仿大脑结构而制成。和人类大脑中的神经元一样,它们包含大量的处理节点,节点之间彼此连接,形成一个密集的网络,但其认知能力却相当初级。

在深度学习过程中,训练数据被送到输入节点中,网络的输入节点会对其进行修改并输送给其他节点,以此类推。储存在神经网络输出节点中的信息会和试图要学习的分类条目进行匹配, 这些类别可能是物体形象,或是文章主题。

网络在接受训练时,各个节点在传递信息时一直在对其进行修改,使得最后输出最佳结果。但整个过程结束时,编程网络的计算机科学家往往也不知道这些节点到底是怎么设置的,或者,很难把低级信息转成让人通俗易懂的系统决策过程。

在该论文中, Lei, Barzilay 和 Jaakkola 专门强调了用文本数据进行训练的神经网络。为了解释神经网络的决策过程,CSAIL 研究院把神经网络分成两个模块,第一模块从训练数据中提取文本段,并且根据其长度和相干性来对分段进行评分:分段越短,并且从连续单词串中抓取的分段越多,其分数越高。

接着,第一模块把抓取的数据传送给第二模块,由第二模块来执行预测和分类任务。两个模块同时训练,既要使第一模块的分数提高,又要增加预测和分类的准确性。

研究员们测试系统所用的其中一个数据集是某网站用户对不同啤酒的回复评论。数据集包括评论的原始文本和对应评级,从芳香度、味觉和外观三个方面来评价,每一个都采用五星评级制。

而自然语言处理员对这些数据感兴趣还有一个原因,这些数据同时被人们进行手动注释,表明了不同回复所对应的不同等级是什么。比如,一个回复可能有八到九个句子,注释就会标出和啤酒有关的部分,比如“大约半英寸厚的棕褐色泡沫”、“明显爱尔兰啤酒的味道”或者“缺乏碳酸化”等等。

验证

该数据集能很好地测试 CSAIL 研究人员的系统。比如,如果第一模块提取了三个短语,而第二模块把它们对应到相关等级中,就相当于该系统的判断基础与人类注释的判断基础相同。

试验中,系统判断在芳香度和外观和人类判断相似度分别达到 96% 和 95%,对于味道的相似度则略差,有85%。

论文中,研究人员还报道了利用自由问答所获得的数据测试该系统得到的结果,以判断是否一个给出的问题先前已被回答过。

还有些成果他们没有发表,这包括将该系统应用于数千份乳腺活检的病理报告。在该应用过程中,它学会了提取文本以为病理学家提供诊断基础。甚至还能用它来分析乳房的 X 光照片,其中第一个模块提取的是图像而不是文本。

“对于深度学习,尤其是用深度学习进行自然语言处理,人们往往会夸大其词,”美国东北大学计算机与信息科学副教授  Byron Wallace 说道,“这些模型有一个很大的缺点,它们对于人类就像是黑匣子。模型不仅要能做出准确预测,还要能告诉你背后的原因。后者很重要。”

“在会上,我们发现有人和我们做类似的研究,” Wallace 补充说道,“我不知道 Regina 也在做这个,而且我觉得她的方法更好。我们的方法是,比如,有人告诉我们一个电影评论给的评价很高,我们就假设他们会在句子中做标记,并且给出理由。我们通过这种方式训练深度学习模型,来提取这些原因。但是他们无需假设,也就是无需人类注释神经网络就能给出做决策的原因。这个方法非常好。”

 via:scienceblog

延伸阅读:

线性资本王淮:明年人工智能泡沫将达到顶点

谁会赢得美国大选?AI 押注特朗普

2016中美项目秋季交流会,来自硅谷的人工智能有哪些新创意?

本文作者:夏睿

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-07-30 14:49:18

MIT开发新型神经网络训练技术,打开AI决策黑箱的相关文章

雅虎实验室主管:将开发新型实时搜索技术

中介交易 SEO诊断 淘宝客 云主机 技术大厅 北京时间8月1日消息,据国外媒体报道,雅虎实验室主管普拉布哈卡尔·拉加瓦(Prabhakar Raghavan)周五表示,虽然雅虎将把互联网常规搜索服务外包给微软,但雅虎今后将考虑开发自家新型实时搜索技术.今后网民在雅虎网站使用搜索服务时,将由微软搜索引擎Bing(中文名称"必应")和雅虎实时搜索引擎共同返回混合结果. 微软和雅虎周三宣布,双方已达成为期10年的搜索和广告合作协议.协议规定,微软将成为雅虎搜索的技术提供商,而雅虎将独家负责

入侵人脑 DARPA 正开发神经可塑性训练项目

本文讲的是入侵人脑 DARPA 正开发神经可塑性训练项目,DARPA 计划进入外周神经系统,包括美国安全官员和间谍的大脑. 对国防而言,训练政府特工的大脑非常重要.这是一项昂贵且耗时的艰巨任务,涉及学习外语.密码学等一系列项目. DARPA 一直试图开发可以模仿人体外周神经系统的解决方案,并让大脑相信自己的学习速度很快.因此,DARPA 计划开展了"神经针对可塑性训练"(Targeted neuroplasticity Training, TNT)项目,从人类大脑的突触可塑性中找到好处

使用J2ME MMAPI开发移动多媒体应用技术

一.引言 在当前世面上存在着大量的不同媒体格式,并且还有许多新的媒体格式即将被建立.为了存储和传输这些不同的媒体格式,存在着了许多不同格式的存储设备和传输协议,例如大家常使用的媒体存储设备(如CD.VCD以及DVD),有线传输协议(如UDP.HTTP),无线传输协议(如WAP). 为了使移动装置能够访问这些不同格式的媒体数据,必需为其设计一个规范化的.强大的和可扩充的应用接口.J2ME中就提供了一套为规范的播放和录制音频或视频接口,即Mobile Media API (MMAPI). 二.MMA

Android安全开发之浅谈网页打开APP

Android安全开发之浅谈网页打开APP 作者:伊樵,呆狐,舟海@阿里聚安全 一.网页打开APP简介 Android有一个特性,可以通过点击网页内的某个链接打开APP,或者在其他APP中通过点击某个链接打开另外一个APP(AppLink),一些用户量比较大的APP,已经通过发布其AppLink SDK,开发者需要申请相应的资格,配置相关内容才能使用.这些都是通过用户自定义的URI scheme实现的,不过背后还是Android的Intent机制.Google的官方文档<Android Inte

开发人员应该关注技术热点

[编者按]预测未来本来就是一件非常疯狂的事情,而且现在企业科技的发展速度永远超越我们的想象.infoworld主编Eric Knorr为我们预测了在2015年或是未来一段时间内9大技术将大行其道.他认为开源是企业获得竞争优势的首选,作为开发人员应该关注技术热点,并围绕核心技术构建一个类似Docker.Hadoop等的生态系统. 以下为译文: 1.公有云将获得成功 今年,IaaS和PaaS的融合使得在公有云平台上更容易构建.测试和部署应用程序.随着AWS现在提供多重PaaS选项,所有主流的公有云都

微软开发新型键盘 可阅读用户手势

微软开发新型键盘:能阅读用户手势微软研发部门已开发出一种能阅读基本手势的键盘,这将有助于减小触摸屏设备和传统输入方式之间的差异.在多伦多举行的计算机人机互动大会上,微软展示了这一键盘的原型产品.这款键盘集成了64个 传感器,能检测键盘上方手指的运动.例如,从键盘的左侧或右侧扫动可以唤出Windows 8的左边栏和右边栏菜单.微软高级研究工程师斯图亚特·泰勒(Stuart Taylor)表示,这款键盘的主要目的在于,无论用户是在打字还是使用手势,都尽可能地使用户手掌靠近键盘.目前,一些手势可以使用

面向.NET开发人员的Ajax 技术平台策略(3)

ajax|策略|技术平台 基于Ajax 架构的Web应用框架 之前我提到过"似Ajax" 的架构,现在我要说的Ajax框架也就是指专门针对这种Ajax架构而提供的框架.目前,我还没有听说过特别好的这个领域的流行框架.但我知道我的身边,.NET领域,J2EE领域或PHP平台上都有这样的框架和应用,我认为,正是因为有很多这样应用,所以Ajax才会像某个模式一样,被撰有一个专门的名词.不过我感觉Ajax 渐渐变成了Ajax feature的代名词,变成了XMLHTTP的代名词,成了异步通讯,

在JSP-Servlet开发中导入事件驱动技术

js|servlet JSP-SERVLET为WEB应用程序开发者提供了一个优秀的平台.但是,现在国内大多数的基于JSP-SERVLET的开发都处在最基础的状态,代码重用率低,开发效率低,无法适应大型.复杂的WEB开发要求. 首先,要实现事件驱动,必须在JSP-SERVLET开发中采用MVC技术. M=Model(模型)V=View(视图)C=Control(控制) 视图(V)定义了用户界面.模型(M)定义了抽象类和逻辑.控制(C)则负责根据视图发生的事件调用模型的逻辑完成业务处理. 一般 Mo

电脑中打开AI提示Adobe Illustrator已停止工作的解决方法

  AI即Adobe Illustrator,是一款矢量绘图工具,广泛应用于印刷出版.专业插画.多媒体图像处理和网页制作等.但是有用户反映在电脑中打开AI时,弹出提示:"Adobe Illustrator已停止工作".如果遇到以上问题,可以考虑通过本文中的方法进行解决. 1.右击桌面上的AI快捷方式,打开属性; 2.点击切换到兼容性选项卡; 3.勾选"以兼容模式运行这个程序",并选择兼容的操作系统,点击确定; 4.接着就可以双击快捷方式成功打开AI工具了. 以上介绍