随着就业压力与日俱增,“技能鸿沟”(Skill Gap)已成为困扰各方的重要因素。一方面,求职者希望有针对性地准备相应专业技能,以便从激烈竞争中脱颖而出。另一方面,招聘方也希望把握热门技能的流行趋势,为人力资源部门提供指导。
虽然已有机构发布了热门技能的分析报告,但这些报告多半基于简单统计,既未能区分不同关注类型下技能的评判标准,又未考虑技能之间的潜在层次关联。因此,更为准确、全面的技能热度分析成为应时之需。
然而,这个问题有着不小的挑战:
1. 在求职时,不同的人对工作的偏好常常是不同的,有人偏爱挑战自我,这些人更可能选择工作强度高的大型公司;有人则追求生活和工作的平衡,他们更可能倾向于家乡小公司里悠哉的工作。
同时,不同类型的公司和职位对技能的需求也是千差万别的,因此需要实现不同招聘关注类型影响下的技能热度分析。
2. 技能需求从来不是独立存在的,而是存在很强的潜在关联性。例如「node.js」和「Javascript」常常一同出现,却绝少和「machine learning」出现在同一个工作需求中。
此外,技能也存在层次关系,例如「node.js」和「Javascript」就都属于「前端技术」这一类别。因此,需要将技能间的关系引入技能热度分析中。
为了应对上述挑战,来自中国科学技术大学的徐童博士,来自百度人才智库的祝恒书博 士、朱琛、李磐,以及美国罗格斯-新泽西州立大学熊辉教授的论文“Measuring the Popularity of Job Skills in Recruitment Market: A Multi-Criteria Approach”(已被 AAAI2018 接收)首次从多准则的角度对技能热度进行了分析,并提出一个新颖的招聘数据分析模型,并且在真实应用场景中取得创新性的成果。
具体而言,首先基于技能在招聘需求中的共现度,构建了用于表示技能间关联性的网络(Skill-Net),接着将每个技能构成的自我网络(ego-network)当作文档,相邻技能节点作为单词进行建模。
在此基础之上,通过借鉴主题模型(topic modeling)的思想,作者们提出了技能流行度主题模型 SPTM(Skill Popularity Topic Model),来建模技能间的共现关系。
△ 图1:技能关联网络(Skill-Net)
△ 图2:基于“Skill-Net”生成文档
此外,为建模技能和不同招聘关注类型(例如工资水平、公司规模)之间的关系,作者们将每个关注类型和一个主题相关联,并认为每个文档只可能包含特定关注类型的主题。
同时为了将技能类别信息引入模型,他们用变量表示每个技能所属的类别,藉此 SPTM 得以建模每个技能和其他技能类别间的相关关系。
最后,通过给定不同关注类型组合的观察变量, SPTM 模型可以通过贝叶斯条件概率对相关技能进行排序。
△ 图3:技能热度分析框架图
对话作者
关于本文的创新,作者是这样认为的:
在技术层面,SPTM 技术框架具有以下两点新颖性。首先,基于真实简历文档建立技能之间的网络,并结合技能类目信息,对于技能进行了层次化关联描述。
其次,在概率图模型的统一框架下,实现技能关联与关注类型进行联合建模,从而改传统面向单一条件的简单排序任务为面向任何前置规则组合的生成概率表达,提升了技能热度分析的精度和灵活性。
与此同时,SPTM 技术框架也具有一定的应用价值,它填补了求职者与招聘方之间的“技 能鸿沟”,提供了不同关注类型下的技能热度分析,在为求职者提供规律性就业指导的同时,相关实验也证实了其应用于智能招聘领域的可行性。
关于本文的实际应用,作者认为基于 SPTM 所提供的热门技能排序功能,主要可以为招聘市场参与各方提供两方面的作用。
对于求职者而言,将提供有针对性的就业指导。例如,论文对求职者最为关心的公司规模与工资两个因素下的热门技能进行了案例分析,结果发现大型企业更看重“数据”的价值, 而高收入往往要求独创性的工作。
对于招聘方而言,将提供简历筛选乃至结果预测的辅助。例如,作者们基于某著名互联网公司所收到的十余万份真实简历及其筛选结果进行了相关性分析,结果显示基于 SPTM 对 简历中技能的评分,与最终的录取结果呈现高度的相关性,证实了 SPTM 框架在简历筛选中的作用,这对于缺乏专业知识的人力资源部门而言尤其具有辅助价值。
原文发布时间为:2017-12-20
本文作者:何伟栋