大数据招聘,我就这样被算法选中

杰德·多明格斯今年26岁,从未上过大学,被镀金公司的算法判定为编程高手,而后被这家新创公司招聘为程序员。

去年夏天,26岁的杰德·多明格斯(Jade Domingues)收到一封突如其来的邮件,旧金山一家初创公司请他去面试程序员。多明格斯那个时候住在加利福利亚州帕萨迪纳市一间租来的屋子里,靠信用卡赊账度日,他正在自学编程。多明格斯在高中表现中等,也没想过要上大学。但是,在云端的某处有那么一个人,他认为多明格斯有可能是个天才,再不济也是块未经打磨的原石。

“招人时使用的传统指标可能有错,大大的错了,”镀金公司的首席科学家薇薇安·明这样评论。

镀金公司的创始人卢卡·邦马萨和希尔罗德·德赛希望让发现优秀程序员的过程实现自动化。

那个人就是卢卡·邦马萨(Luca Bonmassar),他通过一种技术发现了多明格斯,这一技术将对企业如何招聘,以及优秀的人才是否在此过程中被遗漏提出重要的问题。新的理念让人把目光从传统的人才指标上移开来一点,比如招募者一般都很关心的麻省理工大学的学位、谷歌公司供职的经历、同事或友人的推荐等等,同时投入更多注意力在一些简单的概念上面:这个人的表现如何?这个人能够做什么?能不能量化分析它?

这项技术是镀金公司(Gild)的产品,这是一家成立不到两年的初创企业,邦马萨是联合创始人之一。类似镀金公司这样的一小批新公司正奔着这样一个目标努力,那就是让发现有才华的程序员——有着巨大的市场需求量的一个群体——实现自动化。他们的工作属于大数据的范畴,大数据就是利用计算机来收集和分析各种各样的信息,执行许许多多的任务,不管是推荐图书、在网站上投放有针对性的广告,还是预测治疗效果或股票价格。

让算法帮你,发现那些未被人发现的人才

近来,越来越多的学者和企业家将大数据应用在人力资源管理和人才搜寻的过程中,创建了一个叫做劳动力科学的新领域。镀金公司在做的,便是看看这些技术是否也可以用来预测一个程序员在工作中的表现。镀金公司在互联网上搜刮线索:他或她写的代码得到其他程序员的好评吗?这些代码是否被重用?这个程序员如何交流想法?他或她在社交网站上如何与人相处?

镀金公司的方法在很大程度上还仅仅处于初始的阶段,成效如何还有待检验。目前,关于使用大数据来进行招聘的想法有存在很多建设性的争议,同样存在的还有兴奋,尤其是在那些很难找到优秀人才的产业。

镀金公司预期今年的收益大约有200万到300万美元,并且公司已经筹得了1000万美元左右的融资,其中包括LinkedIn的早期投资人、风险资本家马克?卡凡(Mark Kvamme)的一大笔钱。测试或使用镀金公司的技术进行招募的不乏大牌客户,包括Facebook、亚马逊、沃尔玛、谷歌和Twitter。

企业用镀金公司的技术来发掘新的候选人,同时也评估他们已经在考虑雇佣的人选。镀金公司自己也使用这项技术——他们急需能干的编程人员,可开出的薪资又抵不过大一些的技术公司,所以才找到了杰德。算法判定杰德的编程分数是整个南加州最高的,是几乎无人能敌的100分。

杰德是谁?他能帮助镀金公司吗?他的故事又告诉了我们关于现今招聘制度和任人唯贤的什么?

能力决定一切吗?

硅谷的人大多认同一些特定的想法,比如发展、效率和速度是好的。技术能够解决大部分的事情。变化是难免的;动荡没什么好害怕。或许硅谷人最最相信的一条,就是能力决定一切。

但是,薇薇安?明(Vivienne Ming)却说她认为硅谷并不像人们想的那样任人唯贤。薇薇安?明从2012年年底开始担任镀金公司的首席科学家,她认为有才华的人被忽视、错判或漏选是常有的事。她这样想部分是由于她自己就有过这样的经历。

明博士生下来是男性,名叫埃文?坎贝尔?史密斯(Evan Campbell Smith)。他是一个好学生,还是一名出色的运动员,保持着高中田径三级跳远和撑杆跳远的校级记录。但他总觉得与自己的身体有着某种脱离。高中毕业后,埃文经历了一次身份危机的全面爆发。他的大学以失败告终,在工作之间换来换去,想过自杀,跌到了所谓的人生最低谷。不过,他并没有卡在那里,而是再一次弹了起来。在27岁那一年,他回到学校,获得了加州大学圣地亚哥分校的认知神经科学的本科学位,此后又先后获得了卡耐基梅隆大学的心理学和计算神经科学的博士学位。

在斯坦福大学读博士后期间,他开始进行性别转变,并在2008年彻底成为薇薇安?明博士。

作为一个女人,明博士开始注意到人们对待她的不同。有些是看起来无伤大雅的小事,像是男性为她开门。也有让她烦心的事情,比如学生来问她数学题的次数比她还是男性时要少了,男性同事和工作上的联系人请她参加社交活动(比如一场棒球赛)的次数也变少了。

偏见往往以人们意识不到的形式体现出来。明博士援引了一项耶鲁大学研究人员取得的发现,研究型大学的教师成员在描述应聘经理职位的女性求职者时,认为其能力相比具有同样资格的男性要逊色得多。美国国家经济研究局公布的另一项研究发现,简历上名字“听起来像黑人”的求职者收到雇主回电的几率要比简历上有一个“听起来像白人”的名字的求职者难上很多。

基本上每个人都同意,性别、长相或者名字的读音不应该影响聘用决定。但明博士把任人唯贤的概念更进一步。她提出,那些用来筛选人才的公认标准,比如在哪里上的大学、之前在哪里工作过,同样也会遗漏人才,并最终成为雇主的损失。

“招人时使用的传统指标可能有错,大大的错了,”她说。

对于她所说的“这么多被浪费掉的人才”,明博士的应对方法是,制造机器来尽可能地消除人为偏见。这并不是说传统意义上的那些资格应该被忽略,而是加上她认为更复杂的措施予以均衡。总体而言,镀金公司的算法分析一个人时要处理三百来个主要变量:常逛的网站;描述各种技术时使用的语言类型,积极还是消极;在LinkedIn上的技能自述;参与过哪些项目,都干了多久;还有——没错——在哪里上的学、学的什么专业,这所学校当年在《美国新闻与世界报道》上排名是多少。

在数据中找淘金

镀金公司并不是唯一在信息中淘金的公司。另一家旧金山的初创公司“人才回收站”(TalentBin),也在互联网上搜索有才华的程序员,根据该公司的网站介绍,TalentBin在程序员聚集的网站网络人才,收集“数据废气”,为雇主创建潜在的招聘名单。另外一家竞争对手是“绝妙招聘”(RemarkableHire),这家公司评估个人能力的方式是看他或她在网上的成果被人评分如何。

还有ENTELO,这家公司试图找出有可能在找工作的人,甚至在这些人自己开始找工作之前就把他们找出来。据其网站介绍,ENETLO使用超过70个变量来找出职业变化的迹象,比如一个人在社交网站上展示自己的方式。该网站写道:“我们处理数据,节省你的精力。”

英国数据分析公司Altimeter Group的负责数据和分析产业的分析师苏珊?艾特琳(Susan Etlinger)表示,这样在招聘时应用大数据“绝对值得一试”。不过她对算法是否改进了雇主已经在做的事情,比如收集简历或推荐信、使用传统上与成功相关的指标等等提出了疑问。

“缺乏实际结果,”她说:“说概率就等于现实还不能说服我。”

大数据公司QUID的共同创始人和首席技术官肖恩?古尔利(Sean Gourley)表示,筛查数据可以为招聘提供信息,但前提是使用时要了解数据不能揭露的信息。“大数据有大数据的偏见,”他说。“你衡量你能测量的”,同时“你低估了测量不了的东西,像是直觉和感召力”。

古尔利补充说:“当你把人从复杂决策里面排除掉以后,你可以把算法优化成神,但代价又是什么呢?”

明博士没有说要消除人的判断,但她确实认为招聘该由计算机做主,就像一个自动人才吸收和筛检器一样。镀金公司已经积累了一个有700万程序员资料的数据库,并根据所谓的镀金公司得分对他们进行了排名,该公司表示,镀金公司得分是一种衡量一个人可以做什么的方法。最终的目标,明博士希望能拓宽算法,使其可以用于搜索和评估各种类型的劳动力,比如网站设计师、金融分析师,甚至零售店的销售人员。

“我们自己内部也挖到了一座金矿,”明博士说:“我们发现了在洛杉矶这个捣鼓电脑的孩子。”

她说的是杰德。

一个被算法发现的人

多明格斯在洛杉矶长大,在五个孩子中排行第三。妈妈是家庭主妇,爸爸是电信设备的安装工,是一个注重教育的蓝领。

杰德的成长轨迹却很叛逆。高中读了一半,之前一直是全优生的小多明格斯开始思考,上学到底是为了达标还是为了真正的学习。“价值主张(value proposition)上学是为了找个好工作,”他对我说。“但冷静想,你上学难道不该是为了学习吗?”杰德的成绩大幅下降,他给我说他从阿罕布拉高中毕业时平均分还不到3.0。

他不但不想上大学,还想证明他不上大学也一样能超级成功。他阅读了大量的创业书籍,开了一家在T恤印刷定制图案的公司,先是在家里干,后来搬到了一间租来的将近100平米的仓库里。他认为他还需要一个网站,于是自学起了编程。

“我当时拼命用我自己的优点证明自己,”他说。他承认自己可能做得有点儿太过了。“为了证明人们错了而去做事情是不太成熟的表现。”

他的胳膊上有一个纹身,是花体写的“相信”(Believe)。现在他觉得这有些可笑,不过仍旧认为自己能做到他想做的事情。在说到计算机语言的时候,他说:“代码最棒的一点在于,很大程度上是靠能力驱动的。不看你学过什么,只看你学到了什么。”

当镀金公司开始招人时,它假定旧金山和硅谷地区的人才都已经被挑拣干净了。于是,公司让其算法跑了一遍南加州的信息,得出了一系列的程序员。排在头一个就是多明格斯,他GitHub网站上有一个非常坚实的声誉,GitHub 网站是软件开发人员聚集的地方,他们在这里共享代码、交流思想,建立名望。镀金公司就在GitHub以及BitBucket、Google Code等其他少数几个网站上梳理信息,寻找干这行的聪明人。

多明格斯的成绩斐然。他为一个Jekyll-Bootstrap写的代码,建网站时会用到的一个功能,得到了1267位其他网站开发人员的重用,给人留下了很深刻的印象。他的语言和习惯显示出对产品研发的热情和对多种编程工具的酷爱,比如Rails和JavaScript,这都是镀金公司有用的。他的博客和Twitter上的发言表明他固执己见,正是镀金公司希望其初创成员所具备的一点。

镀金公司的招聘人员给他发出了电子邮件,让他来旧金山面试。公司的两位创始人见到了一个富有魅力、充满自信的年轻人——举止从容、善于表达、有想法、笑容很亲切,比其他来面试的应聘者多些棱角,镀金公司的另一位联合创始人兼首席执行官希尔罗伊?德赛(Sheeroy Desai)说。

多明格斯穿了一件亮绿色的帽衫去面试。他问了一些尖锐的问题,比如公司在这些工程师不知情的情况下给他们打分,是否担心这会被视为侵犯隐私?(镀金公司不这么认为,多明格斯也不相信。镀金公司称,它使用的都是公开的信息。)

他们也问了他一些很针对但也很温和的问题,比如能否在有组织的环境中工作。他说他能。公司当即就签下了多明格斯,而他得到了一份年薪在11.5万美元左右的工作。

“他是一个典型的脑袋灵光、积极性很高的人,但不管出于什么样的原因,在高中时没调动起来,没看见大学的价值,”德赛说。

德赛先生倒是上了大学,读的是麻省理工大学,极受用人单位推崇的院校之一。德赛说,他是在那里学会了如何应对压力,与才华横溢的人共事,时不时的自叹不如。虽然在学校里学的东西都很重要,但他说,“这并不是事情的全部”。虽然拥有计算机科学的学位,但他很肯定地说:“我是个很烂的开发人员。”

大数据招聘,有多靠谱?

人力资源管理方面的专家、加州大学洛杉矶分校的教授大卫?列文(David Lewin)说,问一个人能做到什么是一个重要的问题,而问他能不能和其他人一起完成也同样重要。列文博士说,预测一个人在一个组织中有何表现,最可靠的方法便是让已经在那里工作的人进行推荐。现任员工了解公司文化,而且推荐不好他们自己的名声和工作环境也会受牵连。耶鲁大学管理学院最近利用大数据进行的一项研究细化了现有认识,员工推荐是招到好员工一个好方法,但这种方法往往在推荐人本身工作效率很高的情况下效果显著。

在列文博士看来,他很怀疑算法能彻底取代一名可靠雇员的恰当推荐。

镀金公司的客户里有一家叫Square的公司的业务是做移动支付系统。像其他许多高科技企业一样,Square也在大肆招人,该公司的人力资源总监布莱恩?鲍尔(Bryan Power)在硅谷打拼多年,根据他的说法,现在对于优秀人才的竞争跟dot.com热潮那会儿一样激烈。

“斯坦福出来的或在谷歌工作过是一个极好的指标”,鲍尔说。“他们有名是有道理的。”但这些种子人选有的选项很多,他们不一定选择Square。“我们需要在更大的池子里撒网,”他说:“而这就是镀金公司在做的事情。”

镀金公司的技术为Square找出了一些候选人,但目前还没有签下来的。鲍尔先生说镀金公司的算法给出的是一个泛化的编程分数,与Square要来填补职位空缺的要求不是那么具体。“镀金公司对谁有能力有它的看法,但事情并不是那么简单,”他说,同时表示Square正在和镀金公司洽谈优化模型。

尽管目前来说用处有限,但鲍尔表示,镀金公司在做事情是一个大事件的开始。如今,年轻的工程师更多地在网上发布他们的工作成果,参与开放源码工作,提供更多可用来挖掘原石的数据。“这全都是为了发掘未被发现的人才,”他说。

德赛说,多明格斯在镀金公司工作了8个月,已经证明了他是一个有才华的程序员。但他也表示,多明格斯“有时候要竭力才能在一个结构化的环境中工作”。当他坐在电脑前,同事都尽量不去打扰他。

在会议上,多明格斯会踊跃发言。他比以前更快活,他说,“只要我能在搭建系统的过程中有发言权”,要不然就又成了一个他只能遵从的系统。他还小小地抱怨了公司的扩张,在过去6个月中镀金公司已经从10个人扩大到40人,添加了管理层和官样文章。

“事实是,我的性格就是要按照自己的方式做事,最终我难免要自己开公司,”多明格斯说。不过,他又立即补充说:“我很感激和敬重公司给我的机会,我很清楚他们因为我的能力雇佣了我。对此我将永远心怀感激。”

明博士说,多明格斯这个年轻人是一个伟大的发现,同时也是一个未知数。当然,他只是一个例子,既不能用于支持也不能拿来反驳这种新的方法。

“他总是带着那种独行狼的作风,”明博士说。“初期还好,但后来可能会变得很难说。”

算法在测量它可以测量的东西上面表现出色。它算准了多明格斯与电脑打交道的能力。还不确定的,是从长远看,他将如何使用他的天赋与人一起工作。

编译自:《纽约时报》,How Big Data Is Playing Recruiter for Specialized Workers

文章图片:nytimes.com

(责任编辑:蒙遗善)

时间: 2024-09-20 10:26:35

大数据招聘,我就这样被算法选中的相关文章

大数据-新闻推荐系统中的推荐算法

问题描述 新闻推荐系统中的推荐算法 如何有一个算法是从大数据的新闻列表中通过内容找到自己想要的新闻呢?基于Hadoop的可以.求大神们给一些思路.不要关系型数据库的. 解决方案 [推荐系统算法]推荐引擎算法学习导论 解决方案二: google 协同过滤算法google 新闻推荐 解决方案三: 协同过滤算法http://www.cnblogs.com/zhangchaoyang/articles/2664366.html 解决方案四: 一般做新闻推荐有三种推荐策略:第一是热门推荐,可以设置一个时间

大数据时代到来 百度大规模机器学习算法受追捧

"我在机器学习领域已经超过10年了,今天主要跟大家分享一下,百度是通过什么技术来容纳百亿数据特征,并且让学习效率提升千倍.让模型分钟更新.将模型训练算法速度提升十倍的." 3月15日,百度联盟大数据机器学习技术负责人夏粉在第48期百度技术沙龙现场上说. 机器学习是人工智能研究领域中一个重要的方向,在现今大数据背景下,面向大数据量的机器学习,通常需要做分布式的算法,来容纳上亿特征和数据.本期的百度技术沙龙,夏粉为大家分享了大规模机器学习和数据挖掘方面的话题和研发成果. 百度联盟大数据机器

数据说 | 大数据企业的汇总信息

名称 涉及领域 核心业务 投资机构 投资机构 投资机构 投资机构 金额(人民币) 轮次 美林数据 算法/分析/模型/可视化 数据分析,数据集成与管控,数据应用开发 未披露       新三板   惠辰资讯 算法/分析/模型/可视化 数据洞察,大数据技术,数字化时代的市场决策支持 未披露       新三板   有米 数据获取/存储/云处理等 产品推广和品牌营销 未披露       新三板 上市 寻英网 其他应用 大数据招聘平台,实现人才与企业职位的精准匹配 未披露       未披露   大贤科

大数据跨界,从这里开始

首先,如题,这篇依然是写给那些从其他领域跨界到大数据领域的朋友的,当然,初入大数据领域,或者对大数据领域有所兴趣的朋友,也可一观. 想起要写这个话题,已经很久了,直到最近私密群建立起来,才发现这个话题应该是更急切需要被讨论一下的. 虽然我对于大数据培训市场一直不算太感冒,但是,如果说对于那些想要跨界进入大数据领域的朋友来说,不可否认,全面的培训是最快的方式,最少比自学来的快.更系统. 但我一直对于大部分培训课程体系的设计不敢苟同,这是重点. 这两年来,鉴于种种原因,也帮不少初入门或者说初入大数据

佛山中心城区的大数据猜想

在电影<黑客帝国>里,基努·里维斯扮演的男主角尼奥生活在虚拟世界,里面遇到的人都是由人工智能合成的,为了抗击人工智能,尼奥走上了黑客之路. 虽然电影设置的场景距离现实生活很遥远,但在虚拟世界里建构起一个电子身份证,在不久将来会成为我们每个人最重要的标识. "我们计划用4000个标签近1900个事项对每个市民进行最精确的描述和标识,未来将形成21.47亿条数据沉淀."在周一举行的推介会现场,禅城区信息办主任郑小广介绍了禅城区正在构建的自然人数据库,将对政务服务和城市治理带来根

大数据,并非一蹴而就

前言 大数据,并非一蹴而就. 大数据的时代,已悄然而至,殊不知,我们已被数据的海洋环绕.环顾左右,有人争相控之,有人只缘身在此山中,云深不知处,当然,也有溺者. 当第一次接触大数据的时候,并不感冒,感觉只是一个普通的概念而已.尽多时之力,试从各个方面接触,无大获. 以当时资料显示:大数据是一种规模大到在获取.存储.管理.分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模.快速的数据流转.多样的数据类型和价值密度低四大特征. 抽象,抽象的很,来自一个大数据小白的真实感受.

联通的大数据反欺诈,依赖互联网公司靠谱吗?

最近联通公司风头狠劲,又是大小王,又是反欺诈跟腾讯的合作,在一个高峰论坛中,腾讯小马哥对于利用运营商的数据反欺诈细节侃侃而谈,说得很精彩,而一旁的联通却对于反欺诈中自身的价值无只言片语,为什么? 笔者看了,不是滋味. 运营商网络管道化,已经被提的很多了,这是有历史原因的,但被基于厚望的仅剩的运营商大数据资产,还没出世,还没努力过呢,就面临着被管道化的危险,就有点可悲了. 数据就好比原油,掌握自主的开采权是核心,否则,就是卖基础资源,有什么附加值?谈何大数据生态链,更别提掌控权了. 何谓公平的合作

指引大数据未来方向的九大真理

文章讲的是指引大数据未来方向的九大真理,笔者总会时不时沉浸在对大数据原则的思索当中,这里讨论的并不是Hadoop与关系数据库或者Mahout与Weka的对抗,而是更具根源性的智慧--将数据作为"新时代货币"的思维方式.不过也许将数据描述成"新时代的石油"更加贴近,或者,我们还需要一种新的比喻更全面地诠释数据的价值与内涵. 比喻本身既非事实也难以证明,但它们确实能够创造出指引我们找到真理的话题.比喻让复杂的概念变得更易理解,正如本文中所引用的经典语录--它们有助于解释

指引大数据未来发展方向的九大真理

  笔者总会时不时沉浸在对大数据原则的思索当中,这里讨论的并不是Hadoop与关系数据库或者Mahout与Weka的对抗,而是更具根源性的智慧--将数据作为"新时代货币"的思维方式.不过也许将数据描述成"新时代的石油"更加贴近,或者,我们还需要一种新的比喻更全面地诠释数据的价值与内涵. 比喻本身既非事实也难以证明,但它们确实能够创造出指引我们找到真理的话题.比喻让复杂的概念变得更易理解,正如本文中所引用的经典语录--它们有助于解释大数据的各项基本原则.本文将列举八条