量化分析机器与人类智慧

未来的智慧世界应该是机器与人类的分工,低端重复性的智能由机器承担,高端的创造性的智能由人类来承担。过分的宣扬机器智慧超越人类智慧,都会带来盲目乐观到不理智甚至沮丧的结果。

1.关于机器与人类智慧未来的分歧

2011年2月18日,超级电脑“沃森”打败了人类,站在了与人类智力竞赛的最高领奖台上。著名的未来学家库兹韦尔相信,由于信息技术正朝着“超人类智能”的奇点迈进。当这个信息奇点在2045年到来的时候,人工智能将超越人类智慧。

但也有不少科学家认为机器智慧超越人类智慧还只是一个科学幻想,包括麻省理工的计算机学教授罗勃•米勒(Rob Miller),Facebook人工智能实验室主任、深度学习专家Yann LeCun,都认为机器算法在一些领域的确超越了人类的能力范围。 但在一些领域,例如对社会和文化的认知领域,包括不断发明各种新词汇、传播小猫的视频并点赞,或一起参与构的其他文化现象。这些是机器算法很难企及的领域。

1950年,图灵发表题为《机器能思考吗?》的论文,第一次提出“机器思维”的概念。提出假想:一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(Turing Testing)。

图灵测试经常用来检验机器是否具备人的智能,但图灵测试受人为因素干扰太多,严重依赖裁判者和被测试者的主观判断,而且只判断机器是否具备了人的智能,但机器与人类智慧的差距和变化速度并不能得到定量的分析。因此往往有人宣称其程序通过图灵测试,例如2014年6月英国雷丁大学客座教授凯文•沃维克宣称一款名为“尤金•古特曼(Eugene Goostman)”的计算机软件通过了测试,但很快就被人揭发他们的测试有很大漏洞并由欺诈嫌疑。

那么有没有一种方法,能够定量检测机器智力的发展水平和速度,并与人类智力进行对比,观察可能潜在的风险并进行防范。2013年以来我们在机器与互联智商方向进行了探索,初步成果已经发表在2014年6月6日举办的ITQM会议上,下面我们将简要介绍如何定量分析机器与人类智慧的未来之争。

2.机器与人类智商通用测试方法(M&H; IQ)

在心理科学中,智力(intelligence)是最难理解的概念之一。 目前有关智力的定义累积起来不下百种, 但一个基本共识是,智力是人们认识客观事物并运用知识解决实际问题的能力。

对人类智力的测量即智商测试由比奈西蒙最早提出,1905年比奈西蒙发表了《诊断异常儿童智力的新方法》, 即比纳西蒙智力量表 ,标志着智力测验的正式出现。 1916年,美国斯坦福大学教授推孟(L.M. Ter man)将比纳西蒙量表介绍到美国并予以修订,修订之后的量表称为斯坦福比纳量表,它成为目前世界上广泛流传的标准测验之一。

因为目前机器智力发展还很不完善,不能完全套用对人的智商测试。几乎没有任何机器系统能够完成人类智商测量的操作能力测试,因此我们需要吸收以上智商测试量表的优点,设计新的智力评价体系和建立测试题库。使之能同时对机器系统和不同年龄阶段的人类进行测试。这样得出的结果将可以定量的看出机器智慧与人类智慧的差距,通过定时测试,也可以发现机器智慧与人类智慧差距的变化情况。

基于“智力是人们认识客观事物并运用知识解决实际问题的能力”这一基本认知,可以从知识的获取能力(观察能力),知识掌握能力,知识创新能力,知识的反馈能力(表达能力)等四大方面建立新的机器与人类通用智商评价体系,从这四个方面建立15个分测试,并采用德尔菲法对其赋予权重。

机器与人类通用智力量表(M&H; IQ)

1 知识获取能力 识别文字的能力,识别声音的能力,识别图片的能力

2 知识掌握能力 常识(天文,地理,历史,物理,,,,),翻译,计算,

3 知识创新能力 排列,联想,创作,猜测,挑选,发现(规律)

4 知识的反馈能力 用文字表达的能力,用声音表达的能力,用图片表达的能力

具有机器智慧的程序有很多种类,其中搜索引擎具有很强的代表性,作为目前互联网最重要的应用之一,搜索引擎代表有Google,Baidu,Bing等,这些搜索引擎目前在通过各种方式不断提高搜索引擎的智能水平。

例如 1.从只能识别文字增加到能够识别声音和图片;2引入“语义理解”技术,试图理解用户的搜索意图;3,通过深度学习,让搜索引擎可以自动识别图像中是什么物体。因此选择对搜素引擎进行智商测试并与人类进行对比将具有典型的意义。

3.世界搜索引擎排名与机器智慧的弱点

根据机器与人类通用智力量表,可以建立机器与人类通用智商测试题库(因为篇幅问题,本文不进行详细介绍),2014年5月我们利用这个测试题库对全世界50个搜索引擎和3个不同年龄阶段的人类群体进行测试得到结果如下:

排名 属地 名称 通用智商

1 人类 18岁 97

2 人类 12岁 84.5

3 人类 6岁 55.5

4 美国 google 26.5

5 中国 Baidu 23.5

6 中国 so 23.5

7 中国 Sogou 22

8 埃及 yell 20.5

9 俄罗斯 Yandex 19

10 俄罗斯 ramber 18

11 西班牙 His 18

12 捷克 seznam 18

13 葡萄牙 clix 16.5

14 韩国 nate 15.75

15 阿联酋 Arabo 15.75

16 中国 panguso 15

17 韩国 naver 15

18 俄罗斯 webalta 13.5

19 美国 yahoo 13.5

20 美国 bing 13.5

21 香港 timway 12.75

22 日本 goo 12.75

23 日本 excite 12.75

24 中国 Zhongsou 12

25 英国 ask 12

26 法国 voila 12

27 法国 ycos 12

28 葡萄牙 sapo 12

29 德国 lycos 12

30 印度 khoj 10.5

31 俄罗斯 Km 10.5

32 德国 suche 10.5

33 美国 Dogpile 9

34 德国 Acoon 7.5

35 马来西亚 Sajasearch 6

36 印度 indiabook 6

37 塞浦路斯 1stcyprus 6

38 希腊 Gogreece 6

39 荷兰 slider 6

40 挪威 Sunsteam 6

41 英国 Excite UK 6

42 英国 splut 6

43 俄罗斯 Rol 6

44 西班牙 ciao 6

45 德国 fireball 6

46 德国 bellnet 6

47 德国 slider 6

48 德国 wlw 6

49 埃及 netegypt 6

50 所罗门群岛 eMaxia 6

51 澳大利亚 Anzswers 6

52 澳大利亚 Pictu 6

53 新西兰 SerachNZ 6

通过测试我们发现搜索引擎在知识的掌握能力上远远超过人类,但在知识的创新能力上全部得分为0. 由于知识创新能力在通用智商测试(M&H; IQ)的权重更高,因此世界范围的搜索引擎的总体智商大大低于人类智慧,最高的Google的智商值也不到人类6岁儿童的一半。

从上述研究还可以看出智能或智力是由不同的因素组成,例如天文,地理,历史等常识,数学计算,语言翻译。这些方面机器或互联网已经远远超过普通人类的能力,甚至强大到令人恐怖的地步,这也是库兹韦尔的观点能够震慑住很多人的主要原因。

但我们往往忽略,除此之外,智力还包括猜测预测,排列组合,规律发现,创新创造,伪装欺骗等更高等级的智慧因素,而在这些方面,机器和互联网表现的基本为0,更不用说与婴儿比较。

从科技的发展看,低端的智能,机器的能力突飞猛进,高端的智能,机器的能力举步维艰,数十年来毫无进展,未来的智慧世界应该是机器与人类的分工,低端重复性的智能由机器承担,高端的创造性的智能由人类来承担。过分的宣扬机器智慧超越人类智慧,正如Facebook人工智能实验室主任Yann LeCun所说“人工智能的每一个新浪潮,都会带来这么一段从盲目乐观到不理智最后到沮丧的阶段。未来学家生来就愿意做出盲目的预测,尤其是他们特别渴望这个预测成真的时候,可能是为了实现个人抱负。”

最后需要指出,目前建立的机器与人类通用智商测试量表(M&H;)还有很大的改进空间,但希望这是一个起点,能够解决图灵测试的不足和缺陷,为定量分析机器智慧能否超越人类智慧打下初步的基础。

原文发布时间为:2014-06-17

时间: 2024-09-11 09:23:18

量化分析机器与人类智慧的相关文章

破解图灵测试之困,量化分析机器与人类智慧

1.关于机器与人类智慧未来的分歧 2011年2月18日,超级电脑"沃森"打败了人类,站在了与人类智力竞赛的最高领奖台上.著名的未来学家库兹韦尔相信,由于信息技术正朝着"超人类智能"的奇点迈进.当这个信息奇点在2045年到来的时候,人工智能将超越人类智慧. 但也有不少科学家认为机器智慧超越人类智慧还只是一个科学幻想,包括麻省理工的计算机学教授罗勃?米勒(Rob Miller),Facebook人工智能实验室主任.深度学习专家Yann LeCun,都认为机器算法在一些领

如何让机器拥有人类的智慧?| 论文访谈间 #09

在神经机器翻译(Neural Machine Translation, NMT)中,由于机器不具有人类的智慧,因此常常会犯一些低级的错误.例如,在中-英翻译中,原中文句子含有 10 个词,而机器却有时翻译出一个含有 50 个词的句子或者是只含有 2 个词的句子. 不管内容如何,在人类看来这样的翻译很显然是不对的.那么如何能让机器拥有人类的智慧,从而避免这种低级的错误呢?近日,我们有幸采访到了清华大学的张嘉成,介绍他发表在 ACL2017 上的工作 - Prior Knowledge Integr

从直觉主义到量化分析 企业管理让大数据做主

还记得去年8·15电商竞争价格大战吗?如果你是某电商CEO,你还会采用这样的竞争战略吗?变化是永恒的主题,企业管理不能一成不变.在大数据时代,电商采用价格战是下策,能够掌控基于大数据战略的企业管理将有助于你超越现有的CEO. 成本领先战略.差异化战略.集中化战略是企业在市场竞争中可选取的三大战略.在信息大爆炸时代,第四种竞争战略大数据战略成为原三大竞争战略的支撑. 大数据变革企业决策 传统的企业管理流程是出现问题.逻辑分析.找出因果关系.提出解决方案,使问题企业成为优秀企业,这是逆向思维模式.大

从“直觉主义”到量化分析 企业管理让大数据做主

还记得去年8•15电商竞争价格大战吗?如果你是某电商CEO,你还会采用这样的竞争战略吗?变化是永恒的主题,企业管理不能一成不变.在大数据时代,电商采用价格战是下策,能够掌控基于大数据战略的企业管理将有助于你超越现有的CEO. 成本领先战略.差异化战略.集中化战略是企业在市场竞争中可选取的三大战略.在信息大爆炸时代,第四种竞争战略--大数据战略成为原三大竞争战略的支撑. 大数据变革企业决策 传统的企业管理流程是出现问题.逻辑分析.找出因果关系.提出解决方案,使问题企业成为优秀企业,这是逆向思维模式

人工智能综述:让机器像人类一样思考

长久以来,我们一直认为智能不只是人类所独有的,可以像人类一样进行推理和学习的机器是完全可能被制造出来的,然而事情却不像想的那样简单. 模拟人工智能 在百科全书上,人工智能的定义是"研究可以智能工作的机器的科学和工程".不过一个令人纠结的问题是:到底什么是智能?很多情况下,那些"不智能"的机器比我们聪明多了,比如普通的计算机程序可以将成千上万个数字的乘积,可以记录下银行的大量款项,这已经超出了普通人的能力.可是,他们只是能正确地完成大量计算而已,还称不上真正的&quo

潮湿计算机:拥有人类智慧的超级大脑

预算达260万美元的"潮湿计算机"工程将于下月启动,该系统与人脑的相似度胜过了现有任何一种智能产品 谭薇 迄今为止最雄心勃勃的人工智能工程"潮湿计算机"(wet computer)将于下月正式启动,它有望在真正意义上实现对神经细胞和信号处理的化学模拟. 许多所谓的"新一代超级计算机",都试图模仿脑细胞的沟通功能或是创建数字版的神经网络."潮湿计算机"的目标却是突破现有计算机的极限,其功能包括在细胞间传递化学信号.控制小分子机器

当谈论量化分析预测未来时,我们在谈什么

量化分析投资公司在使用数学及计算机来预测价格趋势以及其它经济指标的同时,正越来越注重通过现实世界的数据–"大数据"来找到各种"信号",而这"大数据"的信息源范围则较为广泛,不仅会来自于社会媒体,甚至会来自于天气预报.然而根据华尔街日报报道,面对的最大的挑战在于实时的找到相关性并进行交易. 本文将告诉大家如何通过量化分析来预测未来. 第一步:最好的与最聪明的 总部在SoHo且价值240亿美金的定量对冲基金Two Sigma 投资公司在招聘员工时,希

享受更多中文信息之外的人类智慧“草根翻译”还不够

北京时间凌晨两三点,是JuliaD在网上最活跃最忙碌的时候,此刻,和中国相差13个时区的美国正好是午后.如果仅仅看JuliaD在译言网空间里的信 息:148篇译作,英国卫报.美国大选.金融危机三个专栏的译者,<老外看啥>.<每日小抄>两个版的版主,你无法想象,坐在电脑前的是一位年轻的家庭主 妇. "我现在是陪老公在美国读书,没有上班.大部分时间在家当'宅女'."平常除了做一些家务,其他时间,JuliaD都在电脑前将国外一些 资讯翻译后放到网上共享.<每日小

吴恩达:大数据终将帮助机器拥有自主智慧

福布斯网站对加盟百度人工智能实验室的吴恩达进行了专访.文章指出,招纳吴恩达,体现了百度希望通过研发世界一流技术,将自身打造为世界前列的创新型公司的愿景.在以下访谈中,吴恩达透露了他将如何帮助百度实现这一愿景. 以下为文章主要内容: 今年5月百度在硅谷创立了人工智能实验室,并将吴恩达纳入麾下,任命为百度首席科学家.作为斯坦福大学计算机科学教授,吴恩达曾是Google Brain项目的负责人,并联合创建了在线教育初创企业Coursera.让百度成为国际化企业的发展规划中,吴恩达不失为核心人物. 问: