作者:The New Yorker 来源:虎嗅 2017-12-04 11:31
纽约客:变态连环杀手正在被算法迅速围剿
算法定义世界,算法改变世界。我们正生活在一个被大数据与算法改变的世界里。算法带来更精准的消费产品推介,更高效的金融风控,甚至,算法可以帮助识别电影里演绎的变态连环杀手,通过数据分析来判断案情中的各种概率。当然,距离预防案件发生还有很远的距离,数据不够丰富、罪犯大范围流窜等难题依然待解。
本文转载自公众号“机器之能”,来源于 The New Yorker杂志,作者 Alec Wilkinson,编译为张震、高静宜。
一
Thomas Hargrove 是一名档案保管员,特别的地方在于,他保管的是谋杀案件的档案。
在过去 7 年里,他一直在收集市政府记录在案的杀人犯。至今,他已经掌握了自 1976 年以来 751,785 件谋杀案的资料。这个统计数据量十分惊人,甚至比 FBI 统计的案件还多了近 27000 例。这是因为,有一些州本该向司法部备案杀人犯的信息,有时也存在报告不准确或者信息不完整的问题。Hargrove 会对这些州提起诉讼,从而获得该州杀人犯的档案记录。
通常来说,谋杀案都是因出轨、群殴、抢劫或打斗而起,Hargrove 自己编写了计算机程序,用于搜寻奇异的谋杀案件。每年,大约有 5000 人犯了谋杀罪但仍逍遥法外,很多人还不止涉及一起案件。Hargrove 试图用代码找到这些人,而这个程序被他称为「连环杀手追踪器」。
2010 年的时候,Hargrove 就开发出了这样一款程序,它可以运行一些简单的算法。当时的 Hargrove 还是 Scripps Howard 新闻公司的一名记者,不过现在这个公司已经倒闭了。当时的算法以杀人犯追责项目(Murder Accountability Project)为基础。那是一个公益项目,由包括 Hargrove 在内的 9 名成员组成,这些人有以前做过侦探的,有谋杀案学者还有一个狂热的精神病专家。Hargrove 负责为他们提供大数据的支持,不过现在他已经退休了。
数据整合之后,算法可以按照方式、地点、时间以及性别将杀人犯进行分类。这个程序也可以观察到一个城市未解决谋杀案的比率,因为一个悬而未决的连环谋杀案会把一个警察局搞得鸡犬不宁。统计显示,如果一个城镇出现了一个连环杀人犯,这个城镇在外人眼中就会比较混乱。
2010 年 8 月,Hargrove 发现,在印第安纳州莱克县盖瑞镇的杀人犯存在一些相似之处。在 1980-2008 年间,当地有 15 名女性被勒死,而且大部分尸体都处在空无一人的房子里。Hargrove 就给盖瑞镇的警察局写了封信,信中描述了相关案件以及杀人犯的活动范围。「这类案例能够反应出该区域连环杀人犯的行动吗?」他问道。
警察局的回复十分生硬。一个助理人员回复称,盖瑞镇没有未决的连环杀人案件。(如果有连环杀人犯在逃,司法部建议警察局应让市民知悉,但一些地方却对此讳莫如深。)对此,Hargrove 极为愤怒。「我连续写了几个月的信。」他说,「我给警察局长和市长都寄了挂号信。」最终,他收到了一名验尸官副手的回信。这名验尸官很久以前就开始怀疑盖瑞镇存在连环杀人犯。她曾试图和警察谈论此事,但被警察拒绝。在看到 Hargrove 提供的案例后,她又补充了三例受害人的情况。
四年过后,与盖瑞镇相邻的哈蒙德镇的警察接到了报案——Motel 6 发生了骚乱,警察到达现场后在浴室发现了一具女尸。这名女性名叫 Afrikka Hardy,19 岁。「他们逮捕了一位名叫 Darren Vann 的人,他涉及多起此类案件。他说自己『终于被抓了』。」Hargrove 这样描述道。「几天内,他带着警察前往废弃的建筑物,发现了六具女性尸体,而且都是被人勒死,手法和在算法中获得的一模一样。」在上世纪 90 年代,Vann 杀了第一名女性。2009 年,他因强奸罪入狱,杀人案件暂时停止。他在 2013 年出狱,按照 Hargrove 的说法,「他杀心又起。」
二
事实上,研究人员对连环杀人犯的研究就如同研究自然历史标本一样。雷德福连环杀手数据库登记了世界各地近 5000 起案件,大部分是发生在美国,是目前最为全面的记录之一。25 年前,弗吉尼亚州雷德福大学荣休教授 Michael Aamodt 开始收集资料,bian 并着手建立这个数据库。
从这个数据库得知,美国的连环杀人犯中,男性人数是女性的十倍。Ray Copeland 被捕时 75 岁,是数据库中最老的连环杀人犯。他在上个世纪末于密苏里的农场中杀害了至少 5 名流浪人员。最年轻的是 Robert Dale Segee,他在缅因州的波特兰长大。1938 年,也就是他 8 岁的时候,曾用石块杀死了一个女孩。Segee 的父亲经常责罚他,把他的手指放在蜡烛火苗上,而后,Segee 变成了一名纵火犯。放火之后,Segee 有时会隐约看到一个长着獠牙和爪子,头上冒着火光的红脸男性。1944 年 6 月,14 岁的 Segee 在 Ringling Brothers 马戏团找到一份工作。第二个月,马戏团的帐篷就着了火,导致 168 人死亡。1950 年,Segee 因另外一起纵火被捕,他承认自己点燃了帐篷。但几年后,他又拒不认罪,并称放火的时候他完全失去了理智。
数据库统计显示,大多数连环杀人犯都不是特别的开朗,智商平均在 94.5 左右。这些人可以分为几种,有一些人认为自己有义务消灭他们认为不道德或不友好的人,比如吸毒的人、移民以及放荡的女人,这些人被称为「传教士」。「黑寡妇」杀男人,一般是为了继承财产或者获得保险索赔;「蓝胡子」杀女人,要么为财,要么为权。谋杀病人的护士被称为「死亡天使」。「钓鱼者」一般是指偶然遇到被害者的杀人犯,「捕手」则会长期观察被害者。
FBI 认为,每年因连环杀人犯出现的谋杀案件不超过 1%,而 Hargrove 认为这个比率实际上会更高。美国大约有 2000 名在逃的连环杀人犯。「我为什么会知道呢?」他说,「几年前,我结识了一些 FBI 的人,他们也一直在关注究竟有多少 DNA 比对成功但仍在逃的杀人犯。」结果大约有 1500 名杀人犯,这个数字比记录在案的人数多了 2%。「而这些还只是他们能够获取 DNA 的案例,」Hargrove 说,「通常情况下,杀人犯是不会留下 DNA 的,能获取 DNA 信息绝对算是幸运的案例。2% 只是最低的数字而已。」
三
Hargrove 今年 61 岁,他个子很高,身材清瘦,留着白色的胡子,给人留下一种生性多疑的感觉。他和妻子、孩子住在弗吉尼亚州的亚历山大港。他每天要走 8 英里的路程,有时是走到弗农山庄,有时是围着波拖马可河走,边走边听着有声书籍,通常听得都是奇幻故事。
他出生在曼哈顿,在他还小的时候,父母搬去了威彻斯特郡的约克镇。「四岁之前,我一直都住在环河路上。」他说。「我记得有一天,我向妈妈展示我在游乐场用雪糕棒做的弹簧刀,其他的我只记得我住在约克镇。」
Hargrove 的父亲写过一本有关机械计算器的使用手册。Hargrove 在密苏里大学学习期间,他主修计算新闻学和舆情研究。在这里,他学会了一些实践手段,例如用于进行民意调查的随机数字拨号理论,并且受到 Philip Meyer 著作《Precision Journalism》的影响。这本书鼓励新闻工作者学习社会科学的调查方法。
1977 年,他毕业后获得了在《伯明翰邮报》工作的机会,开始进行民意调查,或是做一些其他报社发文所需的东西。事情的转机发生在,报社开始需要罪案方面的报道,于是他便投身于此。1978 年,Hargrove 目击了第一起谋杀案件,那时一家便利店的老板被抢劫犯枪杀。还有一次,警察枪杀了一名 16 岁的非裔美国女孩,当时社会爆发了一阵骚乱,他对此进行了报道。刚到对峙现场,他就被一个站在水塔上的醉汉用来复枪射击,子弹打到了他脚边的沙砾上。他也报道过 John Lewis Evans 被执行死刑的新闻,他是自 20 世纪 60 到 70 年代最高法废除死刑后,阿拉巴马州第一个被执行死刑的犯人。「在阿拉巴马州,当局采用电椅处死犯人,这种电椅因为绘有鲜亮的黄色,被称为「黄妈妈」(Yellow Mama),」Hargrove 说道,「上一次执行死刑还是在很久以前,人们已不知道应该如何操作这种器械了。第一次操作的时候,电流过大,直接导致电线管道着火。现场哭作一团,我也因此失眠了好几天。」
1990 年,Hargrove 搬到了华盛顿特区,为新闻机构 Scripps Howard 工作。「我最初的目的是想利用数字让世人震惊。」他研究社保机构的死亡人口档案(Death Master File)。「一天时间就可以搞定了。」Hargrove 解释道,他发现档案中有一些人几年以后又被移除了,因为他们被错误的宣布了死亡。从采访中得知,这些人经常突然间就被冻结了账户,无法申领引用卡,贷款,而且因为无法提供背景信息,也找不到工作。在对比邮政编码和政府资助贫民儿童的联邦补贴发放地之后,他发现三分之二的补贴实际上流向了郊区的学校。「他所有的工作都是通过非常聪明的逻辑和编程实现的,」Isaac Wolf 说道。Wolf 以前是一名记者,办公桌和 Hargrove 的挨着。「他有各种新奇的想法,创新的方法,还会脚踏实地的去收集和分析数据。」
2004 年,Hargrove 被委托调查一下卖淫相关的事情。为了了解哪些城市出台法律禁止这一行为,哪些城市没有出台相关的法律,他申请要一份 FBI 每年编撰的统一犯罪报告(Uniform Crime Report)。然后他收到了一张 CD,包含 2002 年以来的大部分报道。随 CD 一块寄来的还有一份 FBI 编写的 2002 年补充谋杀报告,包括所有向 FBI 报告的谋杀犯,受害人的年龄、人种、性别、种族,以及杀害的方式和当时的场景。Hargrove 看到这些东西时,他想到的第一件事就是「是否有可能教会计算机识别连环杀人犯。」Hargrove 表示,六年来,他给 Scripps Howard 每一位编辑都讲过,他想使用计算机找到连环杀人犯,而所有的回答,无一例外都是,「你在开玩笑吧?」
2007 年,根据疾病防控中心有关婴儿死亡率统计的数据,虽然加利福尼亚婴儿的人数比弗罗里达州多了很多,但是弗罗里达州的婴儿因突然窒息而死亡的数量却比加利福尼亚高了很多。为了弄清楚原因,Hargrove 对婴儿瘁死综合症(Sudden Infant Death Syndrome)进行了调查。在接下的一年,Hargrove 采访了验尸官和病理学家。「很多人第一句话就是,『说实话,我并不知道该怎么说,但婴儿猝死综合征的患者并没有出现像这样的情况』。」他说道。Hargrove 因此推断,婴儿猝死综合征并不是诊断的问题,也不是一个神秘的疾病,而是父母将孩子放在婴儿车中才导致婴儿窒息而死。问题在于弗罗里达州将这种死亡归因于突发性的窒息,而加利福尼亚将其视为婴儿猝死综合征。这件事经他报道后,疾控中心推出了一个婴儿突发死亡案例登记,对每起死亡进行评估。新泽西州的参议员 Frank Lautenberg 与 Hargrove 进行了会面,然后提出了猝死数据改善和意识法案(Sudden Death Data Enhancement and Awareness Act),这一法案由美国前总统奥巴马于 2014 年签署。婴儿猝死综合征事件后,Hargrove 在「新闻行业的名声大噪」。Hargrove 告诉老板,他仍然想要尝试训练计算机识别连环杀人犯,而这次老板说,「我给你一年的时间。」
四
Hargrove 开始申请获取 1980 到 2008 年间的谋杀案例报告,这份报告覆盖了超过 50 万名杀人犯。在一开始,他就知道「计算机并不是万能的」。他说:「我可以根据数据看到受害者的信息。」然后,他着手编写算法,希望输入一个定罪的杀人犯,就可以输出受害者的信息。他选择把 Gary Ridgway 作为测试案例。Gary Ridgway 是 Green River 地区的一名杀人犯,他从 80 年代初开始犯案,在西雅图谋杀了至少 48 名女性,然后把尸首丢在河岸边。Hargrove 看了一下 Ridgway 的照片,这个人看起来有气无力,一脸很丧的样子。「连环受害人是什么样的呢?」他写道。
编写算法是一件很繁重的工作。「他写了一些代码,但似乎需要遍历所有的档案记录,」Isaac Wolf 说道。,我们没有昂贵的计算机设备,因此代码需要运行好几天。不过他一直在进行改善工作。」
2001 年,Ridgway 因 DNA 比对成功被捕,当时他在 肯沃斯的卡车厂干着油漆工的工作。他已经工作了 32 年,正打算辞职不干了。他告诉警察,勒死女性才是他真正的职业。「我是通过窒息让人死亡,我很擅长干这种事。」他说。Ridgway 的第三任妻子在知道丈夫的行为后大为震惊。二人在聚会上相识,已经结婚有 17 年了。她说,他对她一直就如同新婚夫妻一样甜蜜。Ridgway 本想杀了他前两任妻子,但担心会被抓到。他杀害的人大多是妓女。如果他曾为他杀的人花过钱,那么他就会觉得,虽然他杀了这个人,但他毕竟用钱补偿过这个人了。
Hargove 每天都要总结上一次失败的原因。他将谋杀分为不同的类型,因为他曾被告知,连环杀人犯经常会勒死或者用钝器杀死受害人,因为他们希望看到受害人更多的反抗。他挑选女性受害者着手测试,原因在于 FBI 报告称被连环杀人犯杀死的人中,70% 是女性。每次测试都要花费一整天的时间,他也不知道到底哪种方法才是有效的。有时候,唯一看起来比较有希望的变化结果却是「无法解决」。「在失败了 100 次后,算法总算稍微有了点起色。」Hargrove 说道,他的右手大拇指和食指紧紧贴在贴在了一起,「我开始把术语分的更加具体,按不同的要素进行分类,如女性、工具、年龄和地点。」
采用了这种方法后,算法会将谋杀案件分成大约一万个不同的小组。波士顿、女性、15-19 岁、手枪,这些可能分成一组;而新奥尔良、女性、20-50、勒死可能又是另外一组。尽管「无法解决」的问题仍然存在,有时仍缺乏有效性,不过,Hargrove 仍让计算机将谋杀案结案率极低的地区结果呈现了出来。西雅图在这方面排第三,警察无法得知部分女性受害者的死因,因为尸体在野外待的时间太久,验尸官无法判断出受害者的死因。Hargrove 知道,是计算机最终发现了被 Ridgway 谋杀的人。
五
通过查看受害人和杀手之间的地理关系,Hargrove 偶然想到了称为「地理侧写」的原则。这一原则由 Kim Rossmo 提出,他以前是一名警察,现在是德克萨斯州立大学司法学院的一名教授。1991 年,Rossmo 在日本的一列火车上偶然提出了一个等式,就是根据犯罪活动的发生地和尸首被发现的地点,推测连环杀人犯的居住地。纽约的一名侦探接受采访时表示,「连环杀人犯习惯在同一个地方杀人。他们在一个大致的区域寻找下手的对象。」而一般来说,下手的区域离住所都会很远,以便掩盖自己的居住地,但也不会去到一个完全陌生的地方。犯罪分子去的地方越远,作案的可能性就越小,这种现象被犯罪学家成为「距离衰减」。
Rossmo 曾利用地理侧写追踪过恐怖分子。他仔细研究了恐怖分子居住的地点,他们储藏武器的地点,以及打电话的地点,从而发现犯罪活动爆发的地区。他也与动物学家合作,观察大白鲨的狩猎模式。最近,Rossmo 通过研究街头艺术家 Banksy 将早期作品遗留的地方,找到了证据可以支持英国《邮报》在 2008 年的一个推断。该报纸称,Banksy 是一个来自英格兰布里斯托的中年男性,名字叫 Robin Gunningham。
「在谋杀案调查中,当你从一片片谜团中走出来后,摆在你眼前就都是信息了,」Rossmo 这样说道。「在任何一起连环杀人案中,警察都会有数千甚至数万的怀疑对象。」在 Green River 案件中,警察有 8000 个怀疑对象人。「那么从哪里开始呢?我们知道有很多找到罪犯的途径。通过分析杀人案发生的地点,尸体被发现的地点,就可以创造一个大概的分布。」在《地理侧写》这本书中,Rossmo 提到,研究证明右撇子罪犯在逃跑的时候喜欢左转,不过会把证据向右边扔。很多的罪犯藏在建筑物里面时,则倾向于呆在外墙附近。
此前也有过使用计算机寻找杀人犯的案例。Eric Witzig 是一名退休侦探,也是 FBI 前情报分析员,从事 FBI「暴力犯罪逮捕计划」(Violent Criminal Apprehension Program),这是一个由名叫 Pierce Brooks 的洛杉矶凶杀案侦探发起的项目。Witzig 讲述,在 50 年代,Brooks 经历过一起有关「孤独灵魂杀手」Harvey Glatman 的案子。Glatman 是一名收音机、电视修理工,也是一名业余的摄影师。他邀请年轻的女性做模特,告诉她们说照片将用到侦探杂志上。然后,他将受害者用绷带绑起来进行拍摄,但拍摄完后却并不将绷带拿掉。「女性受害者不仅被绑了起来,而且身上被绑的痕迹深刻且清晰,这说明施暴者用了很大的力气。」Witzig 说道。
Brooks 开始研究一些采用同样杀人手法的谋杀犯。他将所有的谋杀记录写在 3×5 英寸的卡片上。20 世纪 50 年代后期,在对计算机产生兴趣后,他要求洛杉矶的警局为他买一台计算机,但却被告知计算机的价格太高。1983 年,FBI 提供给他一份在 Quantico 的工作并为他配备了一台计算机,然后他便向国会提出了利用计算机数据库追踪谋杀的想法。这个项目作为调查的补充存在,但侦探不用负责这件事。「首要问题就是暴力犯罪逮捕计划的报告形式。」Witzig 介绍道,Brooks 想要记录谋杀案的每一个要素,结果出现了超过 150 个问题。「当然,也出现了使用者的抵触。」Witzig 说,「没有人想要从事大量的文书工作。」他补充道,该项目拥有「世界上最聪明的执法思想专家,但我们的行动只存在于想法上,因为他们失败了。」
六
杀人犯追责项目本身也具有局限性。算法是依靠地点作为关键词进行搜索,但那些流荡范围较大的杀人犯却根本无法查出来。此外,还存在漏报的情况,Hargrove 将之称为弗林特(Flint)效应:一些城市,如密歇根的弗林特,在处理谋杀案上存在渎职,久拖不决,让人误以为遭遇了连环杀人案件。
一些精通统计学的人也可以在杀人犯追责项目的网站上找到这个算法并运行它。举个例子,如果有人想知道在我们居住的地方有多少案件未破,他们可以使用网站上的「搜索案件」功能。新奥尔良的 Deborah Smith 就经常会使用杀人犯追责项目的搜索功能,她也是业余侦探在线交流论坛 Websleuths 的版主。「我存有全国被谋杀和失踪女性的名单,对存在联系的谋杀犯我会进行重点标注。」她说道,「我有几乎所有州的名单。如果我发现了一个杀人犯,比如 Israel Keys,这个杀人犯 15 年前居住在西雅图,我就会寻找西雅图的杀人犯以及阿拉斯加的一部分杀人犯,因为他也有可能会住在那里。查看一下是否存在警察遗漏的情况。」她补充道,「杀人犯追责项目极为有用,没有任何其它的东西能与之相提并论。」
杀人犯追责项目的成员还没有决定如何处理该算法的结果。但对 Hargrove 来说,已经发现了一些道德问题和一些实际的困难。「我们需要弄清楚我们参与的规则,」他说道,「在哪种情形下,我们可以报警?」几个月以前,Hargrove 告知克里夫兰警方,有一个连环杀人犯涉及 60 起谋杀案,受害者全部都是女性,或者从手法来看,可能有三个连环杀人犯。这其中,有 12 名女性被证实从事卖淫活动,她们的尸体在两个不同的地区被发现。Hargrove 无法与克利夫兰警方进行任何的沟通交流,因为杀人犯追责项目的规则要求,这种信息应受到严格保密。鉴于 Hargrove 的分析,警察表示「他们成立了一个小型的调查组负责调查几个未决的谋杀案」。警局特别侦查小组的负责人 James McPike 告诉克利夫兰报刊《Plain-Dealer》,「我们会与该小组协作,帮助我们弄清楚可以做哪些事情。」
Hargrove 对该调查很满意,但他也担心事情会走偏。「要是逮错了人,会被起诉吗?」他问道,「2010 年,当我还是记者的时候,我联系过好几个警察局,因为我想看看算法是否有效。现在我知道了它确实有效,这是毫无疑问的。在某些情况下,我们可以说,这些受害者有很大可能性是被同一个杀人犯杀死的。 2010 年,我背后有一家很大的媒体公司,有律师,媒体保险做支持。而现在,我所从事的是一项公益事业,银行存款只有 14000 美元,9 个成员,没有保险。」
杀人犯追责项目为公众带来的最大好处之一就是让人们意识到美国还有多少杀人犯仍然在逃。1965 年,杀人犯被捕的概率超过 92%,2016 年,该数字不到 60%,为历史最低。洛杉矶的比率最高,达到了 72%,底特律最差,只有 14%。Enzo Yaksic 是杀人犯追责项目的成员之一,也是美国东北大学非典型谋杀研究中心的主任,他表示,该项目「展示了逍遥法外的杀人犯显然是有的。」
Michael Arntfield 是另外一位杀人犯追责项目的成员,也是西安大略大学的教授。他负责大学的一个悬案协会,这个协会关注算法的发现。40 年间,亚特兰大出现了 100 个女性杀人犯,大部分受害者都是非裔美国人,而且都是被勒死的。Arntfield 从亚特兰大警方获取了 44 名女性的名字,然后对这些受害者又进行了深入的了解(研究受害人的背景以期发现她们是如何见到杀人犯的,这一原则被成为被害者研究)。Arntfield 和同事将受害人分为两组,其中很多人可能都曾做过妓女。Arntfield 从报纸上获悉,有两个已认罪的犯人杀人手法极为相似,二人均已入狱。亚特兰大重案组同时也负责谋杀案的负责人 Adam Lee 表示,警局尚未将这些谋杀犯与一个特殊的杀人犯联系在一起,但他认为杀人犯追责项目是一个有用的工具,「非常感兴趣,希望能和 Arntfield 坐下来聊聊。」
Hargrove 接受采访时表示,他希望侦探可以自己使用这种算法将案件进行联系,利用杀人犯追责项目解决谋杀案。此外,他正在考虑再开发一个网站用来追查纵火犯,他已经开始收集火灾的数据了,不过具体何时上线还不确定。「连环纵火和连环杀人存在一定的联系。」他说,很多罪犯是从放火开始走上犯罪这条道路的。」
「我们的初衷是收集尽可能多的犯罪记录。」Hargrove 停顿了一下,「但是没想到这些记录的作用这么强大,竟然可以结合算法找到连环谋杀犯。」