美国西北大学新系统在智力测试中超越75%民众，人类的推理能力也不及AI了？

你听过瑞文氏标准推理测试（Raven’s Progressive Matrices）么？上面这张图就是一道标准的瑞文氏测试题目，是不是很眼熟？在公务员考试、一般的智力测试中我们经常看到它。

那么问题来了，你知道图中这道题的答案么？如果不知道，也用不着沮丧，因为有75%的美国人大概也不知道。但坏消息是：计算机可能知道。

近日，美国西北大学的科研团队研发了一个全新的计算模型，在瑞文氏标准推理测试中达到或超越了75%美国普通大众的表现。被媒体誉为人工智能史上的又一里程碑。

要知道，根据2016年的数据显示，一般18岁成年人的平均智商为97，6岁儿童的平均智商为55.5，相比之下谷歌人工智能系统的智商则为47.3，微软小冰是24.5。人工智能的智商还不及6岁儿童的平均水平。

团队负责人，来自西北大学McCormick工程学院的Ken

Forbus教授对此表示：“模型在智力测试中的表现优于75%的美国大众，这意味着人工智能的逻辑推理能力已经高于人类的平均水平，起码在测试题中如此。另外，由于对人来说很难的题目对模型来说通常也很难，这表示该模型已经可以表现出一些人类认知系统中特有的重要属性。”

Ken Forbus教授

实力这么强，这个模型到底是如何工作的呢？

据悉，该模型建立在一个名为CogSketch的“草图”（sketch）理解系统之上，该系统同样是Ken

Forbus团队的研究成果。这里“草图”是指人们在思考问题或表达观点时自然而然在纸上画下来的说明性图样，特别是面对有关空间理解和地理学的相关问题时，尤其必要。CogSketch系统可以基于草图进行空间建模和逻辑推理，再配合此次最新研发的计算模型，因而能够在瑞文氏标准推理测试中脱颖而出。

Ken

Forbus教授认为类比推理是解决视觉问题的核心，团队正是在这一核心思想的指导下研发了最新的计算模型。所谓类比推理即结构映射的过程，是在不同对象之间通过逐个匹配，寻找它们在结构上的相似点，从而通过图式归纳（即关系结构表征）把源问题中元素之间的关系要素提取出来，用于靶问题的解决。也就是说，先要形成基于源问题的图式归纳，再基于源问题和靶问题之间的结构映射将图式归纳应用到靶问题的解决。在新的计算模型中，团队成员利用了结构映射理论来对比不同的图像，通过标记两张图像中发现的相同结构，识别出其中的相同点和不同点。值得一提的是，结构映射是由心理学家Dedre
Gentner于1983年提出的一个理论，他也是西北大学的教授。

针对西北大学的这项研究，雷锋网随机采访了两位相关专业的在读研究生，他们表达了自己的看法。

钟超杰是来自北京林业大学的硕士在读生，曾参与车载摄像头的行人检测项目。他认为，虽然模型的智力测试成绩超过了75%的人类，但这并不能说明计算机的智力真的就超过了人类。因为除了推理之外，智力的含义应该更复杂，比如还包括学习能力、数学计算能力等。而且他觉得如果模型建的好，经过一定数据量的训练，计算机处理这类问题的能力一般是可以超过人类的，但超出这类问题的范畴应该就不行了。

周志敏是来自浙江大学的研二在读生，了解机器学习领域的各种算法，包括svm、神经网络等。他认为这是人工智能针对特定任务的又一项成功应用，跟人类的类比、推理能力并不一样。西北大学的模型之所以表现出超过75%普通民众的推理能力，是因为它经过了大量的类似数据的训练，如果让它做图形之外的工作应该就不行了。

当前，人工智能系统对图像和语音的识别能力已经相当出色，但对于语义和图像含义的理解、推理能力仍有待提高。西北大学的团队表示，在许多场景中除了对源数据进行识别之外，对其含义的推理和解释也至关重要，这也是他们研发全新的计算模型并对其展开瑞文氏标准推理测试的原因。他们希望这项研究成果可以为计算机视觉领域今后的发展提供一些技术参考。

本文作者：恒亮

本文转自雷锋网禁止二次转载，原文链接

雷锋网

时间： 2024-10-03 07:54:56

美国西北大学新系统在智力测试中超越75%民众，人类的推理能力也不及AI了？

美国西北大学新系统在智力测试中超越75%民众，人类的推理能力也不及AI了？的相关文章

分布式监控系统Ganglia，测试中的监控技术

敢为自己来正名一次吗 IQ智力测试体验

探秘 Google 酝酿中名叫 Fuchsia 的神秘新系统

M#部分新特性融进C# 7.0中，微软新系统Midori变成Wavefront

熊猫猪新系统测试之二:Mac OS X 10.10 优胜美地

中国人工智能学会通讯——智力测试与智能测评的对比思考

苹果紧急发布新系统iOS 11.0.1 修复多种BUG

敏捷开发和测试中重现缺陷和验证缺陷的解决方案（1）

渗透测试中的冷却启动攻击和其他取证技术