基于文本分析、标签匹配的招聘引擎——内聘网

摘要：白领招聘是个高度碎片化、非标准的市场。站在求职者一端，面对海量的招聘信息无从做出选择，只能去无脑海投，这造成了整个市场上垃圾信息的充斥。在招聘企业一端，同样需要面

白领招聘是个高度碎片化、非标准的市场。站在求职者一端，面对海量的招聘信息无从做出选择，只能去无脑海投，这造成了整个市场上垃圾信息的充斥。在招聘企业一端，同样需要面对海量的求职简历，要在成千上万份简历中筛出最合适的人选宛如大海捞针。这里的情况是，越是知名的企业，无效简历越会向你集中，导致大企业HR的简历筛选成本过高、筛选过程简单粗暴。而不那么知名的企业，往往无法搜集到充足简历，需要你打广告找猎头，付出额外的成本。

注意力分配的不均、供求信息的碎片化，这是白领招聘市场匹配效率低下的根源，而专注互联网人才招聘的内聘网，则试图用文本分析+标签匹配的方法让这一状况得到扭转：

针对求职者一端，内聘网会搜集他的简历和职业诉求（行业、薪资、职位等），通过对简历做文本分析，提取出求职者的标签。

针对企业一端，则会搜集企业的用人诉求、职位信息、行业属性、产品信息和媒体报道，同样是用文本统计、分析的方式，提取出关于该企业的标签。这里由于企业数据的复杂性，内聘采用了机器初筛、人工调优的办法来校正和迭代算法。目前已经提取出来的6000个标签中，约有三分之二是人工生成。

当原本高度非结构化的求职者信息和企业信息都变得相对结构化，招聘引擎就可以在二者之间建立更精准的联系。内聘网会在标签之间构建关联，形成一幅职场标签图谱。求职者和企业可以在图谱上找到自己的位置，两者的位置越接近，则说明他们潜在匹配的概率越高。

内聘网典型的使用体验是：求职者只需提交简历和职位诉求，系统将自动生成一份职位推荐列表，列表会以标签的形式告诉你这家企业的特点（比如工资高、美女多），也会告诉你你们之间的匹配分数，以此作为用户定向投简历的依据。而HR们则只要简单发布职位，系统将依匹配度排序，告诉你哪些简历可能需要你的重点关注。由于不同类型的企业招聘同一职位的需求不尽相同，所以职位匹配的基础应该是“标签组合”。比如一家做to B软件的公司（“to B”+“软件”），和一家做to C软件的公司（“to C”+“软件”），当两者同时发布一个“产品经理”的职位时，得到的结果应该是个性化的。

内聘网创始人肖恒是北大计算机硕士，毕业后旅日工作，曾在京瓷和松下电器任项目经理。肖恒曾创办一家面向日企的人才派遣和软件外包公司，据说一度业绩不错。在随后经历了若干次职场调整后，12年4月二次创业做了内聘网。我们现在看到的内聘网上线于今年3月份（此前尝试过做微信招聘），次月即拿到某机构的数百万人民币天使。

十一期间，内聘网进行了一次大改。肖恒介绍，目前使用内聘网的企业用户有6000多家，改版后的日UV已达1万左右，个人用户则已超过10万。下一步他们将试图向职场社交延伸。

关于用大数据做职位匹配，其实还有一些有意思的玩法，比如：

1、可以绑定求职者的社交账号，通过社交数据为求职者打上更丰富的标签，同时评估他背后的人脉价值。人脉优质的候选人显然应该得到更多的关注，同时在为其匹配职位上，或许BD、市场类的工作排名应该更靠前。这点是以前依靠一纸简历无法实现的，做职场社交的脉脉，在这个方向已经做了较好的表率。

2、企业可以主动触达潜在候选人，激活对方的跳槽意愿，变被动的等人上门为主动的上门招人。

3、让企业将现有员工的背景资料上传，在引擎里跑上一圈，构建出企业现有员工的素质模型。再结合该企业的历史表现，分析该模型的有效性，以及改进方向，从而更精准地评判是否应该吸纳某类型的新人进入——这或许算是一种“量化HR”？

时间： 2024-07-29 13:37:26

基于文本分析、标签匹配的招聘引擎——内聘网的相关文章

内聘网：用文本分析+标签匹配的方法提高招聘市场匹配效率

摘要: 白领招聘是个高度碎片化.非标准的市场.站在求职者一端,面对海量的招聘信息无从做出选择,只能去无脑海投,这造成了整个市场上垃圾信息的充斥.在招聘企业一端,同样需要面白领招聘是个高度碎片化.非标准的市场.站在求职者一端,面对海量的招聘信息无从做出选择,只能去无脑海投,这造成了整个市场上垃圾信息的充斥.在招聘企业一端,同样需要面对海量的求职简历,要在成千上万份简历中筛出最合适的人选宛如大海捞针.这里的情况是,越是知名的企业,无效简历越会向你集中,导致大企业HR的简历筛选成本过高.筛选过程简单

基于文本的搜索_php基础

为了增强我的网站上的功能,本人根据本人的网站的实际,开发了一个基于文本的搜索,现在使用在本人的网站上.为了和广大网友相互学习交流,本人现在其源码公布,其源码如下: <?php $dispstr=array(); $dispstr[1]="disp_os.php?article_id="; $dispstr[2]="disp_webma.php?article_id=";

【Spark Summit East 2017】基于Spark ML和GraphFrames的大规模文本分析管道

本讲义出自Alexey Svyatkovskiy在Spark Summit East 2017上的演讲,主要介绍了基于Spark ML和GraphFrames的大规模文本分析管道的实现,并介绍了用于的描绘直方图.计算描述性统计的跨平台的Scala数据聚合基元--Histogrammar package,并分享了非结构化数据处理.高效访问的数据存储格式以及大规模图处理等问题.

LinkedIn文本分析平台：主题挖掘的四大技术步骤

LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节.LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题.用户的热点话题和痛点,能够做出改善产品.提高用户体验等重要的商业决定.下面是整理后的技术要点. 文本分析平台及主题挖掘文本数据挖掘是,计算机通过高级数据挖掘和自然语言处理,对非结构化的文字进行机器学习.文本数据挖掘包含但不局限以下几点:主题挖掘.文本分类.文本聚类.语义库的搭建.LinkedIn的Voices文本分析平台架构如下图,本文将侧

LinkedIn 文本分析平台：主题挖掘的四大技术步骤

机器学习和文本分析

以下通讯来自微软研究院的一位杰出科学家Ashok Chandra博士和微软研究院的程序经理Dhyanesh Narayanan. 当我(指Ashok)70年代还是斯坦福大学人工智能实验室的学生时,我十分乐观的认为人类级别的机器智能指日可待.并且,与此同时计算机因使用机器学习(ML)的技术正变得日益强大.正因为如此,几乎所有微软的新产品都不同程度的使用了机器学习技术来分析语音.数据和文本.在这篇通讯中,我们主要侧重于文本. 当计算机更好地理解了自然语言,新的领域不断被开创,例如:用户应用的人机界面

Linux基础命令介绍八：文本分析awk

awk是一种模式扫描和处理语言,在对数据进行分析处理时,是十分强大的工具. awk [options] 'pattern {action}' file... awk的工作过程是这样的:按行读取输入(标准输入或文件),对于符合模式pattern的行,执行action.当pattern省略时表示匹配任何字符串;当action省略时表示执行'{print}';它们不可以同时省略. 每一行输入,对awk来说都是一条记录(record),awk使用$0来引用当前记录: [root@centos7 ~]#

借助SAP HANA实现文本分析和文本挖掘

文章讲的是借助SAP HANA实现文本分析和文本挖掘,2014年4月10日-12日,第五届中国数据库技术大会(DTCC 2014)在北京五洲皇冠国际酒店拉开序幕.在为期三天的会议中,大会将围绕大数据应用.数据架构.数据管理.传统数据库软件等技术领域展开深入探讨,并将邀请一批国内顶尖的技术专家来进行分享.本届大会将在保留数据库软件应用实践这一传统主题的基础上,向大数据.数据结构.数据治理与分析.商业智能等领域进行拓展,以满足于广大从业人士和行业用户的迫切需要. ▲点击进入第五届中国数据库技术大会(

ASP.NET批量操作基于原生html标签的无序列表的三种方法_实用技巧

在网页开发中,经常要用到无序列表.事实上在符合W3C标准的div+css布局中,无序列表被大量使用,ASP.NET虽然内置了BulletedList控件,用于创建和操作无序列表,但感觉不太好用.本篇介绍服务器端ASP.NET批量操作基于原生html标签的无序列表的三种方法. 方法一,将li元素做成html控件,加上id,用FindControl方法. aspx代码: <form id="form1" runat="server"> <ul>

背景图片|透明 PNG图片在网页设计中扮演着一个很重要的角色,利用PNG图片的特点可以制作出实用,绚丽的效果,可是对于PNG图片的支持却不是很理想, Firefox和Opera对PNG支持的比较好,特 ...

关于手机设计的一些故事

文章描述:近两年来随着iPhone一路走火,智能手机的概念也深入人心.在这样一片大好形势下,去年我便也赶潮流的更新了自己的移动设备.也许是为了与众不同吧,我选择了非主流,投资在了Nokia N900这 ...

手把手教你学Dreamweaver MX 2004(视频教程)

dreamweaver|教程|视频教程 2004年,FIF多媒体制作组推出了 photoshop 视频教程,这是网络中首次推出如此完整系统的的视频教程.作品一经推出,即备受欢迎,好评如潮.据FIF官方 ...

C#写的支持SMTP验证的发送邮件组件(1)

smtp|发送邮件这是我学C#后写的第一个比较拿得出手的东西,肯定有很多错误之处,还望各位高手指正. 写它的原因就是.net自带的SmtpMail不支持SMTP认证(说句题外话,我真很奇怪, 从AS ...

ASP.NET中的HTMLControl和WebControl

asp.net|web 与以前的ASP版本相比,ASP.NET有了很大的改进.这些改进之中,主要的一点就是新引入的服务端控件.现在我们就来一起研究ASP.NET中的HTMLControl和WebCon ...

用C#读取Windows注册表中的多重字串和二进制字串

注册表中有多种数据存放的格式,有几种常见不能直接读出的格式.下面列出了2个方法,分别是读取WindowsXP注册表中的REG_MULTI_SZ( 多重字串)和REG_BINARY(二进制值)的方法. ...

Flash转换王使用手册

试用环境: 软件信息: 立即下载注册购买作者网站软件界面: 程序主界面 <Flash转换王>是国内首个可以将Flash的SWF动画高清晰.高效率.最快速度地转换为VCD/SVCD/D ...

有道云笔记协作群创建的方法

1.在桌面打开我们已经安装好的有道云笔记,并登陆帐户进入. 2.在进入到云笔记的主界面后,我们点击云协作功能选项. 3.在进入云协作选项管理窗口后,我们找到并点击下方的"创建/加入'按钮 ...

sql语句：怎么根据一个字段在一段时间内把另一个字段累加？

问题描述 sql语句:怎么根据一个字段在一段时间内把另一个字段累加? 表内有如下数据: 字段名: XX AA SS 2015-1-1 A1 1 2015-1-2 A1 2 2015-1-3 A1 3 ...

Spring Boot特性

1. SpringApplication SpringApplication 类是启动 Spring Boot 应用的入口类,你可以创建一个包含 main() 方法的类,来运行 SpringAppli ...

Oracle 12.1 RAC安装新主机，识别老存储和恢复数据库例子

具体步骤如下(因为先在12.1中测试,然后才在112.测试,因此这里的测试记录了发现的一些问题和处理方法,而11.2中模拟主机损坏,直接使用了这里的经验,因此没有任何报错信息): 1,安装12.1.0 ...

编程语言-库文件是用机器码组成的文件吗？

问题描述库文件是用机器码组成的文件吗? RT.库文件是用机器码组成的文件吗?凑够30个字,到了吗?到了吗?到了吗?到了吗?到了吗?到了吗? 解决方案一个库文件的大部分是的,因为库中也有导出符号,资 ...

js-flipsnap中，左右滑动会附加一个上拉动作，如何取消这个上拉动作

问题描述 flipsnap中,左右滑动会附加一个上拉动作,如何取消这个上拉动作如题,如何在滑动的时候没有上拉动作,会很不好看的,有知道的么解决方案 http://download.csdn.net ...

算法-请教一下如何求解三维模型重心

问题描述请教一下如何求解三维模型重心请教各位大神,不规则三维模型的重心如何求解?算法是如何实现的? 解决方案听说的,你可以试试. 1 用region命令将要求形心的图形(必须是封闭的),转为面域 ...

xml-从 XML 中获取 GetAttribute

问题描述从 XML 中获取 GetAttribute 我想用下面的代码使用 getAttribute java函数.在 xml 中代码: <city id="1" name ...

固态硬盘要长命绝招：千万别点磁盘碎片！

现如今,固态硬盘行业因闪存颗粒的原料供应问题,陷入了涨价风波,甚至在第三方市场研究机构Gartner发布的最新报告中显示,固态硬盘行业的涨价风波将会一直持续到今年年末. 正所谓,开源节流,在当下固态 ...

向年轻人靠拢 WPS换新标

向年轻人靠拢 WPS换新标金山办公软件WPS日前启动了全新的品牌规划行动,首当其冲的是换标工作.日前金山办公软件每天都发布一个候选LOGO,最终的LOGO在5月30日正式公布.谈到这次换标的初衷,金 ...

异类Pinterest:坚持网页为先的大型互联网公司

Pinterest联合创始人埃文·夏普导语:美国科技博客网站AllThingsD撰稿人利兹·加妮斯(Liz Gannes)今天撰文指出,在互联网公司纷纷向移动端转型的今天,图片社交网站Pinteres ...

【译】ASP.NET MVC 5 教程 - 6：通过控制器访问模型的数据

原文:[译]ASP.NET MVC 5 教程 - 6:通过控制器访问模型的数据在本节中,你将新建一个MoviesController 类,并编写获取电影数据的代码,使用视图模板将数据展示在浏览器中. ...

Java里面有没有类似于VB那样的图形化编程软件

问题描述请问JAVA里面有没有像VB那样用鼠标一拖动一个Button或者一个label就出来了的软件?急求一个基于JAVA的图形界面编写软件解决方案解决方案二:MyEclipse装个插件就可以了 ...

苹果商店-怎么把网页加壳成苹果APP

问题描述怎么把网页加壳成苹果APP 想把一个网站弄成苹果app加上推送功能上传到苹果商店,求教要怎么弄,小白步骤越细越好急急急解决方案 http://baike.baidu.com/lin ...

Facebook：不仅让机器“看”人，更要让机器理解人

导读:Facebook日前发布了一种名为Moments,使用人脸识别技术的功能.该公司称,只需要不到5秒钟的时间,它的人脸识别技术就能在800万张照片中迅速地找到你的脸,目前准确性可达到98%.不过, ...

【Hadoop Summit Tokyo 2016】Apache Storm中的资源感知调度

本讲义出自Jerry Peng在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Apache Storm的相关知识内容.目前遇到的挑战和问题并且对于资源感知调度器进行了详细介绍.

用友王文京：创新企业服务构筑企业生态链

近日,由用友网络科技股份有限公司(以下简称"用友")举办的2017用友伙伴大会在北京召开,大会以"赢在企业互联网"为主题,包括阿里巴巴.华为.滴滴等在内的战略伙 ...

《条例（初稿）》加大禁烟处罚力度

昨天,省人大常委会科教文卫委员会,在省十一届人大常委会第二十八次会议上就加快江苏爱国卫生立法作了报告.据介绍,省人大常委会已将<江苏省爱国卫生条例>补充立法调研列入今年的工作计划,江苏省爱 ...

FusionCharts 多系列折线图如何设置曲线条数？急！！！在线等！！！

问题描述 FusionCharts多系列折线图-MSLine.swf--如何设置曲线条数?比如一个MsLine图有10条曲线数据,我默认显示2条,其他需要点击下面标签才显示.想要的效果如下图:当点击时 ...

ios-IOS SWIFT 判断字符串是否含有字母

问题描述 IOS SWIFT 判断字符串是否含有字母 iOS 如和判断字符串中是否含有字母,用swift写.网上给的没弄出来,希望小伙伴们能给个好的例子解决方案判断是否包含字母 let strin ...

找不到工作

问题描述找不到工作怎么办找不到工作怎么办找不到工作怎么办? 解决方案解决方案二:我也找不到工作啊,求安慰解决方案三:找什么工作!自己当老板!解决方案四:多少工资要求?你如何评判价值?解决方案五:引 ...

烽火18台系列之十四：应急处置“网站一键关停”

前不久,"永恒之蓝"病毒肆虐整个互联网,各网络安全管理员们纷纷忙于打补丁.拔网线.做封堵,那种"想哭"的感觉还记忆犹新,那幅手忙脚乱的画面还历历在目.网络安全工 ...

tomcat中Servlet的工作机制

在研究Servlet在tomcat中的工作机制前必须先看看Servlet规范的一些重要的相关规定,规范提供了一个Servlet接口,接口中包含的重要方法是init.service.destroy等方法 ...

热搜