Eugene 通过图灵测试,究竟代表什么意义?

昨天外媒传出,终于有一个计算机程序首次成功通过了">图灵测试。这是一次属于计算机的胜利,一次颇具争议的胜利。依然有很多人站出来说,这并不算什么稀奇的事,毕竟通过比例只有 30%,而 Eugene 只取得了 3 个百分点高值。

那么究竟 Eugene 通过了图灵测试代表了什么?对计算机,乃至对于人类意义有多大?来和我们一探究竟吧!

什么程序?

俄罗斯人 Vladimir Veselov 在俄罗斯的圣彼得堡开发的人工智能软件「Eugene」,通过了原版图灵测试。该软件模仿一个十三岁的小男孩,在回答图灵测试的测试者提出的问题时被认为其 33% 的答案是由人类给出的,而图灵测试的规则是如果这个比例超过 30% 即算通过。

这是「计算机之父」阿兰·图灵(Alan Turing)在 1950 年提出图灵测试理念之后首次有计算机控制的程序通过了该测试。经过了 64 年!里程碑式的事件!

那什么是图灵测试?

好问题。看来非常多的人对于图灵测试所具有的重大意义还是不太了解,或产生了根本性的混淆。

图灵测试的目的是用来测试它的测试对象——机器,是否达到了人工智能或人类感知的水平。当然,测试对象并不是《终结者》当中的天网那样的超级计算机系统。用最简单的话来描述的话,图灵测试的意义在评判一台机器是否能够成功的模仿人类。

跟 Siri 聊过天吗?如果你用过 WP 手机,你也一定觉得 Cortana 的智能水平已经非常不错了。图灵测试的通过标准线——30% 的问题答案被认为是人类回答——在很多人看来非常低。而事实上,能够通过图灵测试的人工智能系统,要比《全民公敌》(I,Robot)当中的机器人还要聪明和智能。

好吧,那为什么这次 Eugene 的胜利引起了这么大争议?

图灵测试本身并不是一个严格的针对计算机的测试,因为题目是由人提供,由人提问,由人判断答案的「类人性」的。聊天机器人有时候模仿人模仿的太像,以至于图灵测试的某些上了年纪的测试员也会相信他们的「鬼话」……

当然,这并不是说聊天机器人都能够轻易蒙混过关。图灵测试的测试员通常来自世界计算机科学界的顶尖科研人员。不过本次测试的审核委员会中,还有包括了著名科幻喜剧《红矮星号》的演员 Robert Llewellyn 和 英国上院议员,自民党人士 Lord Sharkey。后面这两位尽管都是在文学、科技界声名显赫的「话题」人士,但对于人工智能方面的了解却并不能算「够资格」。

Eugene 通过图灵测试的方式也非常非常之取巧——既不是牛津大学的教授,也不是普通人,而是使用了一名十来岁男孩作为模仿对象——人类正常对话沟通的底限年龄。而且,还是一名讲俄语的男孩(英语是第二语言)。

也就是说,Eugene 本次通过图灵测试,前提条件太多,大大降低了通过的难度,提高了可能性。是为很多人所不齿的一次胜利……

说了这么多,我们到底该不该关心这件事啊?

是这样的:即便如上所言,Eugene 也的确是通过了严格且科学的整个图灵测试的流程。Eugene 并不是第一个试图用投机取巧的方法来通过测试的聊天机器人,但的确是第一个真的通过了测试的。尽管 Eugene 面对的本次审核委员会并不能称得上是学术和研究经验最深厚的一拨人,但大部分的聊天机器人也不是用来专门跟计算机专家对话的呀!

因此,Eugene 通过图灵测试,的确是人工智能方面的一次重大突破。你应该为之感到……不管是激动还是恐惧,但至少不是怀疑。

如果你非要怀疑,那就怀疑图灵测试本身吧:这是一个主观、门槛够低,但仍然是人工智能业界的第一标准的一套测试工具。质疑 Eugene 为什么胜利就像是质疑足球赛的球门为什么那样宽一样……不是机器人的问题,而是游戏规则的问题。

那么现在该咋办?

别太担心,像终结者那样的智能机器人不会明天就出现在你家的门口,准备谋杀你。但 Eugene 通过图灵测试的事实,预示了我们距离能够被计算机模拟出的人工智能蒙混过关的日子越来越近了——即便他们装成了一个母语是俄语的 13 岁小男孩。

思想有多远,聊天机器人就能走多远。未来会出现能陪聊的机器人、能卖东西的机器人、能做爱的机器人,或者能陪聊还能做爱还能卖东西的机器人……

更重要的是,或许我们终于可以宣布把图灵测试放在过去,开始面对新的人工智能世界——天网和终结者了。

(责任编辑:mengyishan)

时间: 2024-09-20 16:49:31

Eugene 通过图灵测试,究竟代表什么意义?的相关文章

[里程碑]Eugene通过图灵测试背后的人工智能意义

昨天外媒传出,终于有一个计算机程序首次成功通过了图灵测试.这是一次属于计算机的胜利,一次颇具争议的胜利.依然有很多人站出来说,这并不算什么稀奇的事,毕竟通过比例只有 30%,而 Eugene 只取得了 3 个百分点高值. 那么究竟 Eugene通过了图灵测试代表了什么?对计算机,乃至对于人类意义有多大?来和我们一探究竟吧! 什么程序? 俄罗斯人 Vladimir Veselov 在俄罗斯的圣彼得堡开发的人工智能软件「Eugene」,通过了原版图灵测试.该软件模仿一个十三岁的小男孩,在回答图灵测试

性能测试-请问firebug的网络面板中的红色竖线究竟代表onload事件还是load事件的触发?

问题描述 请问firebug的网络面板中的红色竖线究竟代表onload事件还是load事件的触发? 大家好!我在<软件性能测试过程详解与案例剖析>一书中看到,firebug的红色线条表示onload事件被触发.但是,为什么截图中标示的是load事件呢?而右下角的时间又给出了onload的时间. 我想请问一下,红色竖线代表的究竟是onload事件还是load事件的触发?onload事件和load事件有什么区别和联系呢?谢谢! 解决方案 onload=+641ms+325ms,所以它是load完成

性能-请问Perfmon的纵轴究竟代表什么意思?

问题描述 请问Perfmon的纵轴究竟代表什么意思? 大家好!我想问一下Windows自带的性能计数器Perfmon的纵轴究竟代表什么意思?对于不同的计数器,有不同的含义和单位,有的代表时间,有的代表字节数,它们的单位显然是不同的.但是,不论是什么计数器,在性能监视器里都显示在一张图里,对应的纵坐标都是0~100,那么,这个0~100究竟代表什么含义,它的单位是什么呢?谢谢! 解决方案 代表百分比 解决方案二: 这个真没研究过,你看看官方网站吧

由女性手机谈起 玩人群细分究竟有没有意义

19世纪中叶的美国建筑师刘易斯·沙利文,被认为是建筑上的"现代主义之父".他最著名的就是"形式追随功能"这句格言--建筑的首要目标在于它的功能,而非它的外形.一间房子要是连让人舒适安居的基本条件都做不到,就算它装潢得再漂亮又有什么用?同理,目前市场上女性手机等特殊机型众多,究竟有没有存在的意义? 之所以特殊机型层出不穷,一方面是手机厂商在残酷的竞争环境下不断在细分领域发力,另一方面则是因为现在消费者更注重自己的个性需求.但从市场反应效果看,由人群细分蜕变而来的各种手

OPPO Find7 5000万像素究竟有没有意义?

近日尚未http://www.aliyun.com/zixun/aggregation/18782.html">正式发布的Find7五千万像素样张流出事件可谓是闹得沸沸扬扬.原因是当年诺基亚费了老鼻子劲闭门苦修N年,才搞出808那个逆天的 4100万像素.OPPO怎么就冷不丁的出了个5000万像素?一时间各种真假质疑以及是否插值还是多张合成等猜测声四起.今天小编并不打算猜测OPPO 究竟用了什么黑科技,而是来谈谈这5000万像素对我们是否真的有意义. 我还是先来看一下网上流传的照片.从目前

rs.open sql,conn,A,B的后两个A,B各代表的意义

sql 使用ASP制作动态页面时,绑定数据库后,总要打开记录集:rs.open sql,conn,A,B(A与B表示各数字值),那这A与B到底表示什么意思呢? A: ADOPENFORWARDONLY(=0) 只读,且当前数据记录只能向下移动 ADOPENSTATIC(=3) 只读,当前数据记录可自由移动 ADOPENKEYSET(=1) 可读写,当前数据记录可自由移动 ADOPENDYNAMIC(=2) 可读写,当前数据记录可自由移动,可看到新增记录 B: ADLOCKREADONLY(=1)

cn地域域名不同后缀代表的意义是什么?

  .ac.cn 科学院系统 .ah.cn 安徽省 .bj.cn 北京市 .com.cn 商业系统 .cq.cn 重庆市 .fj.cn 福建省 .gd.cn 广东省 .gov.cn 政府部门 .gs.cn 甘肃省 .gx.cn 广西自治区 .gz.cn 贵州省 .ha.cn 河南省 .hb.cn 湖北省 .he.cn 河北省 .hi.cn 海南省 .hk.cn 香港 .hl.cn 黑龙江省 .hn.cn 湖南省 .jl.cn 吉林省 .js.cn 江苏省 .jx.cn 江西省 .ln.cn 辽宁

百度蜘蛛IP段抓取所代表的意义

原创不等于高质量,良多站长都还 211.html">觉得,蜘蛛喜欢静态页面. &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 虽然蜘蛛没有歧视动态页面,可是高手都知道,优化一个站的时刻必然要用静态页面.除非你的后台硬,有高质量的外链与推广.网站的静态化,网站在设计链接路径的时候, 最好就是采用静态的,对比于动态,seo搜索引擎加倍喜欢静态的链接.因为静态的网页访谒速度对照快,搜索蜘蛛轻易抓取网页的

Scalaz(11)- Monad:你存在的意义

 前面提到了scalaz是个函数式编程(FP)工具库.它提供了许多新的数据类型.拓展的标准类型及完整的一套typeclass来支持scala语言的函数式编程模式.我们知道:对于任何类型,我们只需要实现这个类型的typeclass实例就可以在对这个类型施用所对应typeclass提供的所有组件函数了(combinator).突然之间我们的焦点好像都放在了如何获取typeclass实例上了,从而忽略了考虑为什么要使用这些typeclass及使用什么样的typeclass这些问题了.所以可能有人会问我