基于文本分析、标签匹配的招聘引擎——内聘网

摘要: 白领招聘是个高度碎片化、非标准的市场。站在求职者一端,面对海量的招聘信息无从做出选择,只能去无脑海投,这造成了整个市场上垃圾信息的充斥。在招聘企业一端,同样需要面

白领招聘是个高度碎片化、非标准的市场。站在求职者一端,面对海量的招聘信息无从做出选择,只能去无脑海投,这造成了整个市场上垃圾信息的充斥。在招聘企业一端,同样需要面对海量的求职简历,要在成千上万份简历中筛出最合适的人选宛如大海捞针。这里的情况是,越是知名的企业,无效简历越会向你集中,导致大企业HR的简历筛选成本过高、筛选过程简单粗暴。而不那么知名的企业,往往无法搜集到充足简历,需要你打广告找猎头,付出额外的成本。

注意力分配的不均、供求信息的碎片化,这是白领招聘市场匹配效率低下的根源,而专注互联网人才招聘的内聘网,则试图用文本分析+标签匹配的方法让这一状况得到扭转:

针对求职者一端,内聘网会搜集他的简历和职业诉求(行业、薪资、职位等),通过对简历做文本分析,提取出求职者的标签。

针对企业一端,则会搜集企业的用人诉求、职位信息、行业属性、产品信息和媒体报道,同样是用文本统计、分析的方式,提取出关于该企业的标签。这里由于企业数据的复杂性,内聘采用了机器初筛、人工调优的办法来校正和迭代算法。目前已经提取出来的6000个标签中,约有三分之二是人工生成。

当原本高度非结构化的求职者信息和企业信息都变得相对结构化,招聘引擎就可以在二者之间建立更精准的联系。内聘网会在标签之间构建关联,形成一幅职场标签图谱。求职者和企业可以在图谱上找到自己的位置,两者的位置越接近,则说明他们潜在匹配的概率越高。

内聘网典型的使用体验是:求职者只需提交简历和职位诉求,系统将自动生成一份职位推荐列表,列表会以标签的形式告诉你这家企业的特点(比如工资高、美女多),也会告诉你你们之间的匹配分数,以此作为用户定向投简历的依据。而HR们则只要简单发布职位,系统将依匹配度排序,告诉你哪些简历可能需要你的重点关注。由于不同类型的企业招聘同一职位的需求不尽相同,所以职位匹配的基础应该是“标签组合”。比如一家做to B软件的公司(“to B”+“软件”),和一家做to C软件的公司(“to C”+“软件”),当两者同时发布一个“产品经理”的职位时,得到的结果应该是个性化的。

内聘网创始人肖恒是北大计算机硕士,毕业后旅日工作,曾在京瓷和松下电器任项目经理。肖恒曾创办一家面向日企的人才派遣和软件外包公司,据说一度业绩不错。在随后经历了若干次职场调整后,12年4月二次创业做了内聘网。我们现在看到的内聘网上线于今年3月份(此前尝试过做微信招聘),次月即拿到某机构的数百万人民币天使。

十一期间,内聘网进行了一次大改。肖恒介绍,目前使用内聘网的企业用户有6000多家,改版后的日UV已达1万左右,个人用户则已超过10万。下一步他们将试图向职场社交延伸。

关于用大数据做职位匹配,其实还有一些有意思的玩法,比如:

1、可以绑定求职者的社交账号,通过社交数据为求职者打上更丰富的标签,同时评估他背后的人脉价值。人脉优质的候选人显然应该得到更多的关注,同时在为其匹配职位上,或许BD、市场类的工作排名应该更靠前。这点是以前依靠一纸简历无法实现的,做职场社交的脉脉,在这个方向已经做了较好的表率。

2、企业可以主动触达潜在候选人,激活对方的跳槽意愿,变被动的等人上门为主动的上门招人。

3、让企业将现有员工的背景资料上传,在引擎里跑上一圈,构建出企业现有员工的素质模型。再结合该企业的历史表现,分析该模型的有效性,以及改进方向,从而更精准地评判是否应该吸纳某类型的新人进入——这或许算是一种“量化HR”?

时间: 2024-07-29 13:37:26

基于文本分析、标签匹配的招聘引擎——内聘网的相关文章

内聘网:用文本分析+标签匹配的方法提高招聘市场匹配效率

摘要: 白领招聘是个高度碎片化.非标准的市场.站在求职者一端,面对海量的招聘信息无从做出选择,只能去无脑海投,这造成了整个市场上垃圾信息的充斥.在招聘企业一端,同样需要面 白领招聘是个高度碎片化.非标准的市场.站在求职者一端,面对海量的招聘信息无从做出选择,只能去无脑海投,这造成了整个市场上垃圾信息的充斥.在招聘企业一端,同样需要面对海量的求职简历,要在成千上万份简历中筛出最合适的人选宛如大海捞针.这里的情况是,越是知名的企业,无效简历越会向你集中,导致大企业HR的简历筛选成本过高.筛选过程简单

基于文本的搜索_php基础

为了增强我的网站上的功能,本人根据本人的网站的实际,开发了一个基于文本的搜索,现在使用在本人的网站上.为了 和广大网友相互学习交流,本人现在其源码公布,其源码如下: <?php             $dispstr=array();             $dispstr[1]="disp_os.php?article_id=";             $dispstr[2]="disp_webma.php?article_id=";         

【Spark Summit East 2017】基于Spark ML和GraphFrames的大规模文本分析管道

本讲义出自Alexey Svyatkovskiy在Spark Summit East 2017上的演讲,主要介绍了基于Spark ML和GraphFrames的大规模文本分析管道的实现,并介绍了用于的描绘直方图.计算描述性统计的跨平台的Scala数据聚合基元--Histogrammar package,并分享了非结构化数据处理.高效访问的数据存储格式以及大规模图处理等问题.

LinkedIn文本分析平台:主题挖掘的四大技术步骤

LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节.LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题.用户的热点话题和痛点,能够做出改善产品.提高用户体验等重要的商业决定.下面是整理后的技术要点. 文本分析平台及主题挖掘 文本数据挖掘是,计算机通过高级数据挖掘和自然语言处理,对非结构化的文字进行机器学习.文本数据挖掘包含但不局限以下几点:主题挖掘.文本分类.文本聚类.语义库的搭建.LinkedIn的Voices文本分析平台架构如下图,本文将侧

LinkedIn 文本分析平台:主题挖掘的四大技术步骤

LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节.LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题.用户的热点话题和痛点,能够做出改善产品.提高用户体验等重要的商业决定.下面是整理后的技术要点. 文本分析平台及主题挖掘 文本数据挖掘是,计算机通过高级数据挖掘和自然语言处理,对非结构化的文字进行机器学习.文本数据挖掘包含但不局限以下几点:主题挖掘.文本分类.文本聚类.语义库的搭建.LinkedIn的Voices文本分析平台架构如下图,本文将侧

机器学习和文本分析

以下通讯来自微软研究院的一位杰出科学家Ashok Chandra博士和微软研究院的程序经理Dhyanesh Narayanan. 当我(指Ashok)70年代还是斯坦福大学人工智能实验室的学生时,我十分乐观的认为人类级别的机器智能指日可待.并且,与此同时计算机因使用机器学习(ML)的技术正变得日益强大.正因为如此,几乎所有微软的新产品都不同程度的使用了机器学习技术来分析语音.数据和文本.在这篇通讯中,我们主要侧重于文本. 当计算机更好地理解了自然语言,新的领域不断被开创,例如:用户应用的人机界面

Linux基础命令介绍八:文本分析awk

awk是一种模式扫描和处理语言,在对数据进行分析处理时,是十分强大的工具. awk [options] 'pattern {action}' file...  awk的工作过程是这样的:按行读取输入(标准输入或文件),对于符合模式pattern的行,执行action.当pattern省略时表示匹配任何字符串;当action省略时表示执行'{print}';它们不可以同时省略. 每一行输入,对awk来说都是一条记录(record),awk使用$0来引用当前记录: [root@centos7 ~]#

借助SAP HANA实现文本分析和文本挖掘

文章讲的是借助SAP HANA实现文本分析和文本挖掘,2014年4月10日-12日,第五届中国数据库技术大会(DTCC 2014)在北京五洲皇冠国际酒店拉开序幕.在为期三天的会议中,大会将围绕大数据应用.数据架构.数据管理.传统数据库软件等技术领域展开深入探讨,并将邀请一批国内顶尖的技术专家来进行分享.本届大会将在保留数据库软件应用实践这一传统主题的基础上,向大数据.数据结构.数据治理与分析.商业智能等领域进行拓展,以满足于广大从业人士和行业用户的迫切需要. ▲点击进入第五届中国数据库技术大会(

ASP.NET批量操作基于原生html标签的无序列表的三种方法_实用技巧

在网页开发中,经常要用到无序列表.事实上在符合W3C标准的div+css布局中,无序列表被大量使用,ASP.NET虽然内置了BulletedList控件,用于创建和操作无序列表,但感觉不太好用.本篇介绍服务器端ASP.NET批量操作基于原生html标签的无序列表的三种方法. 方法一,将li元素做成html控件,加上id,用FindControl方法. aspx代码: <form id="form1" runat="server"> <ul>