中学生利用LinkedIn数据选择心中的大学

“领英”(LinkedIn)公认是成年人的社交网站,它召集了全世界的2亿5900万人,在网站上公布自己的简历。它从来没有打算成为青少年的后花园。为人父母者或许喜欢在上面张贴自己数十年的工作经历,但是还在念中学的保姆和汉堡店厨师却并不喜欢用它来记录自己做过的临时工。

数据科学家上场之后,情况变了。其实在2011年,领英就已经开始考虑如何与18岁以下的用户交流了。这些青少年或许对领英的20拍字节的职业信息宝库无甚贡献,但他们却有可能成为最热情的数据消费者。具体地说,领英可以为他们开一扇门,让他们了解各家高校的毕业生都去了哪里工作――这就等于是给了这些青年人一块分析仪表盘,让他们能据此赌一把未来。

以美国的著名高校卡内基梅隆大学和普渡大学为例:对这两所高校,领英都收集了60000多名毕业生的职业生涯数据。数据量之庞大,足以在其中看出清晰的规律。输入“MIT”,你很快就会看到这所高校的毕业生一般会在谷歌、IBM和甲骨文公司找到工作。输入“普渡”,你会发现礼莱、康明斯和波音是毕业生的首选。

加州库比蒂诺的大学咨询师普维·穆迪(Purvi Modi)指出,这类信息对于中学的高年级生和低年级学生都是一座金矿,因为大多数中学生对将来的职业都只有模糊的想法。运用领英的这个工具,对太阳能、编剧、或者医疗器械感兴趣的学生,就可以挑选那些毕业生最容易进入相关领域的大学报考了。穆迪每年都要给大约300名学生提供咨询,他表示,现在有40%左右的学生都在浏览领英数据库的这个叫做“大学页面”(University Pages)的部分、希望能从中获得一些想法。考虑到领英在2013年8月才开始向大众提供数据梳理服务,这个比例实在是够惊人的了。

领英的盈利靠的是它庞大的会员人数,盈利的途径有两条。第一,招工者每年支付8500美元,就能得到更多求职者的信息。第二,会员可以购买各种高级服务,从而更加容易地浏览网站。在投资者看来,领英或许会在全球招聘市场上获得近乎垄断的地位。到今年1月,领英的市值已经达到了245亿美元(年收益增长率是惊人的728倍)。这说明社交网络已经在开始利用其庞大数据库的价值了。

这样高的估值也对领英的68位数据科学家形成了压力,迫使他们开发新的工具、从海量的比特中抽取价值。目前他们已经设计了一套算法,指导招工者“找到你想雇的人”,另有一些工具则向心思不定的员工提供“你可能喜欢的工作”。“大学页面”也是这个模式的一个例子,它可谓是低调版本的“你或许想上的大学”。

在领英负责这个项目的首席数据科学家格洛利亚·刘(Gloria Lau)表示,为报考大学者开发适合的工具并非易事,其棘手的程度出人意料。他们现在还无法一下子列出优秀大学的清单,因为青少年(连同他们的父母)通常一开始对自己的志向没有什么明确的想法。

刘发现,年轻人需要花费些时间自己探索。起初,这些学生只对一些宽泛的领域感兴趣,比如工程类,在试用了各种筛选程序之后,他们就会发现以前并不知道的一些具体领域、以及相关的公司了。他们有的或许会对特斯拉或洛克希德马丁提供的机械工程师职位发生兴趣,还有的会了解到当地的大学就能帮助他们在哈里伯顿找到石油工程师的工作。

这个“自助挑选数据”的方法速度较慢,得到的结果也比领英给求职者的即刻推荐更难预测。然而对领英来说,这并不完全是坏事。因为报考大学者会在网站上流连,也因此可能看见更多的广告、并且更好地利用网站。另外,让用户在摸索中发现自己的需求,也就能避免网站对某些学校特别关照、对另一些又做负面评价了。

眼下,领英还没有因为大学页面的功能向学生或是大学收取费用,不过免费的服务同样有助于达成商业目标。领英的数据主管吉姆·拜尔(Jim Baer)指出,最明显的回报就是新的会员资料。领英的会员人数正以每年38%的速度递增,其中增长最快的部分正是在校学生和刚刚踏上社会的毕业生。

原文发布时间为:2014-07-29

时间: 2024-09-20 05:20:53

中学生利用LinkedIn数据选择心中的大学的相关文章

美国联邦机构利用大数据的五个例子

在采用大数据策略方面,虽然私营部门发挥了模范带头作用,但公共部门也做出了不少成绩.本文列举了美国联邦机构和地方政府机构制定和运用大数据策略的几个例子,涵盖欺诈检测.金融市场分析.健康研究.政府监督.教育.犯罪学.环保和能源勘探等领域. 引言 本文是一组系列博客的第四篇文章.这组文章探讨的是政府在实施大数据策略时所面临的若干问题.第一篇文章解释了数据的"大"为什么应该按照复杂性而不仅仅是体量来定义.第二篇和第三篇文章讲述了大数据策略为公共机构摆出的四个挑战. 以下是美国联邦机构和非联邦机

日本利用大数据预测流感 结果精确

日本 NHK 网站报道,日本国内有一个网站,你只要打开这个网站用自己的 Twitter 账号登录,就可以在短时间内通过数万条 Twitter 找出可能感冒的人,并通过过去的感冒情况和今日的感冒情况进行分析(以及统计目前发烧以及嗓子痛的患者数量),另外该程序还会结合气温和湿度的变化来预测将来感冒的流行情况,并制作一个"易感冒日历".目前,此17853.html">类服务正在日本陆续展开.据了解,运营该服务器的是一家医药品制造 SS 制药公司 (エスエス製薬),公司方面表示

如何利用大数据做遗传病智能化诊断?| 硬创公开课

据OMIM数据库(人类孟德尔病数据库)数据,单基因遗传病的病种数量约有7000种,其中约4000多种致病基因和发病机制比较明确.单基因遗传病单个发病率低,但单基因病种类极多,所以总体发病率高,且具有先天性.致死致残性的特点. 就诊断而言,单基因遗传病涉及多个学科,临床症状复杂,且由于基因的突变具有多样性,每种突变都可能导致不一样的临床症状,而突变的临床意义也相当复杂,故诊断较为困难.而且,许多遗传病都及其罕见,属于罕见病,对于一名医生来说,诊断经验不足,根据症状极易误诊. 所以对于临床医生而言,

北京青苔数据助力山东财经大学构建大数据商务分析实验室,全面提升高校大数据实训和科研能力

北京青苔数据科技有限公司通过使用阿里云大数据实验室和青苔大数据实验室产品协助山东财经大学管理科学和工程学院建立了--大数据商务分析实验室.通过这个实验室,山东财经大学管理科学和工程学院能够利用大数据.人工智能和云计算等技术以及行业案例,实现对本科和研究生学生的实训教学,帮助老师和研究生学生进行各种大数据科研创新. 客户档案 山东财经大学是财政部.教育部.山东省共建高校,坐落于名泉喷涌的国家历史文化名城--济南,是一所办学历史悠久.办学规模较大.办学特色鲜明,以经济学和管理学科为主,兼有文学.法学

如何利用大数据进行价值兑现才是正经事

如果有一天你可以预测未来,你要做的第一件事情是什么?买彩票?第二件.第三件事情呢? 先卖个关子,我们后面再说这件事情. 大数据是个产业,广义上指的是在这个信息过载时代围绕着海量信息产生.传播.收集.处理.创造价值的整个产品链条:狭义上一般指大数据存储与处理.数据挖掘的相关产业.目前市场上利用大数据最多的一般在于分析和预测. 根据本人10年来在这个行业的从业经验,大数据与前两年的云计算.再往前的网格计算.并行计算都是相同产业链上几个环节,它是作为概念被媒体和从业者炒作起来的.但不可否认的是,我们的

小心找工作时被挖坑,有人利用 LinkedIn 发送钓鱼链接

本文讲的是小心找工作时被挖坑,有人利用 LinkedIn 发送钓鱼链接, 对于找工作的人来说,有几个网站是必关注的,比如LinkedIn.所以当他们发现自己的账号里有新消息时,总会迫不及待地点开关注一下.而这一点,恰好被网络钓鱼的犯罪分子所里用.近日,研究人员发现黑客利用 被黑的 LinkedIn 账户的私信和 InMail 功能发送钓鱼链接. 黑客利用了LinkedIn 账户中联系人彼此都非常信任的特点,因为这些联系人不是同学就是同事或者是彼此有某种关联的人.黑客发送的欺诈性信息包括对共享文档

透视数据中心中的25G、50G和100G技术

企业和云级网络的数据中心中各种"G"比比皆是,是时候搞清楚他们的性能了. 云计算的兴起和数据中心的扩展推动着最新的以太网速度升级,而基于云技术的大数据也已然增加了运营商的工作负载.为满足这一需求,数据中心通过增加与现有基础设施并行的带宽能力实现扩展.预期中25G和100G以太网部署的快速增长就是这一趋势的明证. 为了能够处理不断增大的数据负载,业界最大规模的远距离云企业已纷纷与他们核心网络的数据中心运营商一起,共同转向使用 100G以太网架构.不过大多数运营商认为,对服务器连接来说,1

如何利用大数据做金融风控?| 硬创公开课

随着金融科技.科技金融等概念的热起,以及互联网金融.无金融服务群体的刚性需求下,大数据风控技术也获得越来越广泛地重视和应用.但是,如何利用大数据.机器学习等前沿技术做金融风控?如何通过海量数据与欺诈风险进行博弈?本次硬创公开课我们邀请了同盾科技首席风险官董骝焕博士为我们解答. 董骝焕是南开大学概率统计博士,他博士毕业后加入中科院,2007年加入IBM/ ILOG从事决策模型在各种业务问题中的应用.2010年至2013年先后在FICO和SAS支持金融反欺诈事业.2015年5月15日,董骝焕加入同盾

LinkedIn数据中心的100G技术改革

LinkedIn的持续发展使得我们必须在未来的3-5年间将我们的数据中心发展到一个宏大的规模.Altair项目是我们创建大规模可扩容数据中心的途径.新的LinkedIn数据中心正在Oregon建设中,内部称作LOR1,这将是我们构建的第一个大容量数据中心架构,这将引领我们将服务器的级别从万级走向十万级.这个数据中心的新型网络架构可以支持根据需要扩充服务器数量,而且利用10/25/50/100的技术阶梯来支持使用不同网络连接的混合多层的服务. 在这篇博客中,我们将阐述我们是如何利用100G技术构建