人工智能(AI)这个术语的诞生可追溯到20世纪50年代,此后它曾出现过短暂繁荣。然而在过去5年间,计算能力的大幅进步触发了AI革命,谷歌(微博)母公司Alphabet、亚马逊、苹果、Facebook以及微软等科技巨头争先进入这个领域。现在几乎人人都在谈论AI,可它到底为何物?为何它现在被炒得如此之热?
在我们的生活中,AI几乎已经无处不在,从苹果的iPhone键盘到Zillow的房价评估程序。还有许多东西被营销人员称为AI,尽管实际上它们并非真正的AI。或许,当Alphabet旗下AI子公司DeepMind开发出的智能程序AlphaGo不久前击败人类顶尖围棋冠军后,AI热潮达到了顶峰。
人类在智能方面依然比电脑强得多,因为人类可比机器更好地完成许多任务,虽然有AI支持的计算机程序(比如AlphaGo)也能在少数任务中战胜人类。但AI有可能在大多数任务中变得比人类更聪明,这甚至可对人类就业、创造力甚至生存造成影响。
AI到底是什么?
现在几乎所有人都在谈论AI,你可能认为它是个新鲜事物,但其技术基础早已存在。在许多基本概念出现前,AI这个术语可追溯到1956年。当时美国达特默斯大学数学教授约翰·麦卡锡(John McCarthy)提出一个夏季研究项目,并称“学习的每个方面或智力的其他特征原则上都可被精确描述出来,并被机器所模仿”,AI的概念由此诞生。
在随后几年中,麻省理工学院和斯坦福大学相继成立AI实验室。这些研究主要关于计算机国际象棋、机器人以及自然语言交流等。人们对这个领域的兴趣随着时间流逝而波动。在20世纪70年代到80年代,由于公众兴趣减退,外部资金枯竭,AI陷入“寒冬”。20世纪80年代中期,那些看似前程似锦的初创企业和风险资本突然消失,就像约翰·马尔科夫在《爱之优雅的机器》(Machines of Loving Grace)中描述的那样。
你可能还听说许多与AI有关的其他专业术语,比如机器学习和深度学习等。其中,机器学习是指教授机器如何去做特定的事情,比如识别数字,这需要用大量数据训练它,然后指导它对新的数据进行预测。现在,有关机器学习取得的巨大成就是,随着数据积累得越来越多,开发可随着时间推移变得越来越聪明的软件变得越来越容易。
深度学习是机器学习的一种类型,要求更少的人工协助。通常这种方法涉及到人工神经网络,这是一种松散的数学系统,主要是通过模仿人类大脑中神经元的协同工作方式研发出来的。神经学家沃伦·麦卡洛克(Warren McCulloch)与数学家沃尔特·皮茨(Walter Pitts)于1943年首次提出类似系统。多年来,研究人员不断提出各种先进的技术概念,包括添加多层网络。每增加新的连续层,更高水平的功能就可被用于原始数据中,以便做出更好的预测。这些网络层可在数据中找出特征,但使用层数越多消耗的计算能力就越多。
为何AI突然变热?
多年来,硬件已经变得越来越强大,包括英伟达在内的芯片制造商也在不断改进他们的产品,以便更好地适应AI计算的需求。在许多领域,更大的数据集已经可被更广泛地训练模型。
2012年,谷歌的AI项目曾引发广泛关注,当时它用1000万张来自YouTube的图片训练由1.6万个CPU构成的神经网络,并教授其识别图片中的猫。但是当年晚些时候,图片识别领域再次取得突破,当时在2个GPU上训练的8层神经网络胜过所有竞争对手,基于内容对图片进行了精确分类。几个月后,谷歌收购了神经网络初创公司DNNresearch,后者诞生于多伦多大学计算机科学系。
自从那以来,AI活动不断加速,世界领先的科技公司争相进入这个领域。与此同时,世界上市值最高的多家科技公司也在不断发布自己最新的研究成果,这也增加了AI的魅力。
谁处于领先地位?
谷歌及其母公司已经完成了多项AI收购,其中最引人关注的就是2014年斥资5亿美元收购DeepMind。当DeepMind的AI智能项目AlphaGo为Alphabet吸引到足够注意力后,DeepMind的AI软件也显露出真正的商业价值,即帮助降低谷歌数据中心冷却成本40%左右。与此同时,谷歌也利用AI加强其核心搜索引擎、Gmail、Google Street View、Google Photos、Google Translate、YouTube以及其他应用。
近年来,许多有关深度学习的开源框架相继出现,但谷歌的TensorFlow被认为是其中最受欢迎的。谷歌已经开发出张量处理单元(TPU)以加速神经网络的训练和预测,其功能超过当前市场上所有可用硅芯片。此外,Alphabet旗下子公司Waymo也处于无人驾驶汽车研究的前沿地位。
Alphabet研究科学家们经常公开发表有关他们最新研究成果的学术论文,这在竞争激烈、高度重视保密的行业是非常罕见的。事实上,AI对谷歌来说非常重要,其首席执行官桑达尔·皮查伊(Sundar Pichai)甚至称谷歌为“AI优先”公司。
长期以来,亚马逊也始终利用AI在电子商务领域帮助推荐产品,并部署机器人在物流中心帮助移动物品。但在过去几年中,亚马逊已经通过出售智能扬声器Amazon Echo获得收入,人们可通过这款扬声器与亚马逊虚拟助理Alexa对话。虽然Alexa的语音识别能力还不完美,但其可快速回应用户输入,同时也被越来越快地应用到第三方服务和设备中。基于公众对Alexa的迷恋,亚马逊还设立了便利店,利用AI识别顾客从货架上拿下的产品。
苹果始终在考虑使用AI识别笔迹、延长电池续航时间,甚至在被选中的PDF文件中找到文本。但是苹果在iPhone和其他苹果硬件上使用的虚拟助理Siri现在正使用深度学习,该公司近来宣布在扬声器HomePod中植入Siri。苹果正尝试在其Photos应用中改善图片识别功能,并在iOS的QuickType键盘上预测表情符号。
最近,苹果推出了运行机器学习负载(包括苹果设备上的神经网络)的软件库Core ML。苹果据称还在开发AI芯片,可以应用到移动设备上。从总体上看,苹果试图通过强调隐私区分其AI努力。该公司没有发布太多有关AI的研究,尽管其最近招募到著名AI研究人员拉斯.萨拉胡特迪诺夫(Russ Salakhutdinov)担任其AI研究主管。苹果还通过收购Perceptio等初创企业网络相关方面的人才。
Facebook于2013年建立了自己的AI研究团队,并招募到雅恩·乐昆 (Yann LeCun) 担任AI实验室负责人,后者以擅长卷积神经网络技术闻名。这个团队经常发表研究论文,并推出了Caffe2和PyTorch开源AI框架。它甚至拥有专用的服务器硬件,以优化深度学习。
但Facebook也在利用AI为News Feed中贴文进行更好地排名、将用户贴文翻译成不同语言、甚至生成有关用户图片的文字描述。最近,Facebook宣称将会尝试利用AI遏制与恐怖主义相关内容。去年,Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)曾在其10年路线图中提及AI、VR、AR等,并称将在视觉、语言、识别以及规划等领域进行探索。
微软已经招募AI研究人员多年,且AI研究的优先权不断升级。微软已经将其AI引入Cortana、Word、PowerPoint、Skype以及SQL Server中。今年早些时候,微软推出了视频编辑应用Story Mix,可利用AI为视频中的特定绑定对象增加贴纸等。微软还推出语音识别、计算机视觉、情感检测以及视频理解等服务,开发者可在自己的应用中使用它们。微软推出了Cognitive Toolkit开源AI框架。
未来何去何从?
首先,越来越多的人类劳动将被自动化取代。以专车应用Uber和Lyft为例,随着拥有AI支持的无人驾驶汽车出现,司机发现他们将变得无事可做。除了专业工作之外,机器翻译系统将让人类翻译变得多余。当ATM可以创建新账户并提供贷款后,银行将不再需要招募人类雇员。需要采写新闻的记者也将越来越少。基于这些技术发展的思考,促使人们开始讨论推出新的替代经济模式,比如扎克伯格最近提及的“普遍基本收入”。
除此之外,或许只需数十年,在大多数领域,拥有超人能力的AI系统(或称为人工通用智能,简称AGI)就将涌现。鉴于你询问的对象不同,人们对这种AI的态度也各不相同。在某些极端情况下,AGI系统甚至可能导致人类灭亡。可是如果事情向好的方向发展,或许AGI将会强化人类,比如帮助我们延长寿命。这两种假设场景促使如今的AI引发密切关注,它们也是过去诸多科幻小说的灵感源泉。
但是现在,人们通常看到的都是所谓的“狭义AI”,即应用于少数领域的AI,而且它也并非总是按照其设定的方式工作。比如Alexa、Cortana、Google Assistant或Siri,它们总是存在误解口语的情况。然而,世界上许多大型公司都在以前所未有的力度投资于AI,而且这种趋势还没有减弱的迹象。