大数据告诉你要不要当公务员?

大清早,学姐就推开我寝室的门,说道:“我妈又打电话催我要准备国考了。”

没错,这就是最近学姐和我之间的主要话题。什么考公务员考到哪里啦,公务员工资高不高啦,工作是不是很轻松啦。其实我觉得这些都不是什么重要因素。收入?轻松?还要考虑这些事?难道当一名光荣的公务员的主要原因不应当是希望自己能够鞠躬尽瘁死而后已地致力于为人民服务的伟大事业吗?

当然,这些话我并未出口,大清早的我实在不想再被学姐打了。但为了结束这个絮絮叨叨的话题,我还是决定帮助她研究这么一个小问题:

学姐啊,公务员收入什么的我实在搞不清楚,但我们不妨来看看:当一名光荣的公务员,到底有多辛苦呢?

假如只是四处打听一下的话,会发现关于公务员的消息往往都是两极分化的。城市公共部门工作的小伙伴们总是有的忙碌有的闲。毫无疑问,个体的遭遇总是剧情离奇且难以预料的。但是总体情况如何呢?

就全国而言太过复杂,还是以魔都为例吧。我们登录上海市人民政府的官方网站,可以看到魔都政府已经非常贴心地把各级各类的城市公共部门信息都公布在了网站上,另加基层一线的上海所有镇级人民政府,我们把这些部门(共计704个)整理下来,按照类型和级别把它们放在地图上,可以看到下图:

那么,我们可以简单地将在这700多个公共部门工作的人,视为上海的主要公务员群体。那么,他们总体工作状态怎样呢?

事实上,我们没有办法去查看每个部门的打卡机,通过精确的出勤信息做出精准的分析。但非常恰巧的是,我的电脑正好放着一组来自某互联网公司(见注1)的关于上海的移动设备源大样本数据(约300万个源吧)。太好了,让我们用这组数据作为一个抽样,来挖掘一下魔都公共部门的工作状况吧。

第一步,我们需要定义这些公共部门在法定时间内的工作状态

假设,这些公共部门的公务员们会认真地且相对固定地于8:00至18:00期间在办公室上班,那么,我们则需要找到每个办公地点里在以上时段内高频度出现的移动设备源即可。而这些移动源的集聚状况在某种意义上代表了该部门的法定时间工作状况((根据地址频度显著性、分时段地址差异性等各项指标,从300万个样本中共筛出来质量较高的约2万个样本是落在704栋办公楼的空间范围内的)。我们将移动源按位置汇总到各个单位,画出图来后大概长这样。

从上图中我们可以看到,工作人员规模最大的公共部门均分布在内环线以内,其中浦东新区和徐汇区的若干公共部门在工作人员总数量上遥遥领先,甚至超过了人民广场。而这些只是白天法定时段内的工作状况。

第二步,我们需要定义这些公共部门在法定时间之外的工作状态

假如某单位工作异常繁重,而领导的爱好则是快下班时过来说,“小团啊,这个文件你写一下我明天早上要。”为了满足领导的爱好,可怜的公务员下了班之后往往不能直接回家,经常还得在18:00到22:00这个期间仍然继续鞠躬尽瘁地在办公室里加班。

基于以上假设,为了描绘出公共部门在法定时间之外的工作状态(其实就是加班状况),我们需要从以上数据中再一次筛选出以上时段内(18:00至22:00)仍然在工作地点高频出现的移动源。筛选完这些数据(差不多剩下8000个样本),将其汇总到部门后,画出图来大概长这样:

可以看到,加班总人数的分布和工作总人数分布基本相符。浦东与徐汇仍然领先,而人民广场附近也逐渐追赶上来。具体观察的话,在法定工作时间之外高频度移动源聚集量最大的部门是(冠军来了):

浦东新区地方税务局

看,我们纳税纳得连收税的都得加班加点了。

但是,我们需要注意到的是,加班人员总量(法定时间之外的)并不能完全反应该部门的忙碌程度,也许这个部门本来就人多呢。因此,相对真实地反应该部门的加班状况,我们还需要第三步。

好的,第三步来了,我们来计算不同公共部门的加班人员占比

很简单,我们将第一步和第二步的分别筛选出的两组数据相除,就可以得到每个部门的加班人员占比,汇总到各部门可以画出下图:

可以看到,市中心高高的红色柱子消失了,它们在郊区零零星星地长了出来。

的确,虽然郊区公共部门的加班工作人员总量与市中心不可比拟,但是其加班人员的比例还是相当高的,而市中心某些地区甚至出现了塌陷。这是怎么回事呢?

这时候,学姐打断我的分析和思考,问道:“会不会是这些郊区的工作人员下了班之后赖在办公室不走喝茶聊天打牌呢?反正我们老家的公务员很多都是这样的,都是五点下班但赖到七八点才回家或者去外面吃饭。”

的确,以我们所能掌握的数据是无法完全排除这个可能的。但是,魔都与一般小城市的差别在于上下班回家的通勤时间天壤之别,以魔都平均通勤时间来计算的话,假如赖到七八点才走,那晚饭就很难指望,估计回到家洗洗弄弄就只能吃宵夜了。
因此,本着关怀的精神,让我们再增加一个步骤。

第四步,验证一下看看,这些加班的公务员们,他们都住得离家远吗?

假设,在领导第二天要看文件的强烈需求下,公务员们虽然很努力地加班,但是不至于总是干通宵啊,一个礼拜也得有个三五天回家睡觉吧,当然睡觉时间可能不会很长,差不多也就是24:00至6:00期间吧。

基于这个假设,我们需要找到步骤二中筛选出的那些移动源在以上时段(24:00至6:00)内高频出现的地点,并将之视为该工作人员的居住点。然后将这些点与工作部门所在地进行连线,便可以画出一张加班人员通勤图:

上图中的红点,标示相应的公共部门所在地;而绿线,则表示加班的公务员回家的通勤方向与通勤距离。

可以看到,分布在远郊的红点们,其中很多的通勤连线都紧紧地联系着市中心,有些甚至是长途跋涉,比如金山、临港等地区。可以这么理解:对于某些在郊区工作的公务员来说,假如一不小心在办公室赖了以后,那他们这天其实也不太用考虑回家这件事了。

学姐忍不住问道:“郊区的公务员真的都住的那么远吗?还是这只是个别现象? ”

我们可以将以上结论做一个分区的统计,请看下图:

从通勤角度来看,的确,大部分市区的加班公务员通勤距离差异不大,保持在8公里左右。但是郊区加班公务员的通勤则差异极大。比如,嘉定、松江、青浦和奉贤,在这四个传统区县里,加班公务员的通勤距离非常短,仅有5公里,估计很多都是本地解决。但对于金山和崇明而言,则达到了12公里以上。

但从加班指数(加班人员占比)上看,每个区也均有不同。可以看到,公务员加班指数排名最高的三个区分别为静安、崇明、和杨浦。加班比例达到了35%(崇明又加班路又远到底是有多惨)。而相对比较轻松的则是金山、嘉定和普陀,其加班比例略低,但也有20%以上。

我愉快地做完了这个分析,试图结束这个话题。但学姐又发话了,“考公务员的话,貌似不是按片考的吧,是按部门吧。”

啊,好像真的是这样(我真的应该认真去看一下公务员考试指南了)。那么好的,让我们按照公共部门的类型整理一下分析结果吧(只包括了按照官网分类标准能够准确分类的,无法准确分类的被我无情地剔除了,对的我就是这么任性),请看下图:

可以看到,加班指数最高的公共部门分别是城市规划部门、其次是人民政府和公安系统。依次排序下来,则是税务、财政、发改。

以上六类虽然通勤距离各有差异,但是加班指数均达到了30%。而相对较为舒适的公共部门看起来是交通系统啊,加班指数最低(约25%),而通勤距离也最短(3公里)。

我若有所思地自言自语道:看来我要劝告那些学城市规划的弟弟妹妹们,赶紧转行学城市交通了才对啊。

这时,学姐第三次发话了,“我觉得你这么分析还是不科学啊。难道区规划局和市规划局、区政府和市政府的加班、国税局和地税局的工作模式一样吗?同一个部门内部可是差异极大的啊。”

学姐真是难缠啊。好吧,让我再次将这些公共部门按照等级分类,分级到市、区、镇三级(魔都基本上没有国家级部门,有少数几个被我无情地剔除掉了,对的我就是这么任性)。请看下图:

额。这个规律也有点过于明显了吧。

我赶紧指着屏幕说道,“喂,学姐你看。市级部门的公务员平均加班比率最低,不到30%,通勤距离也比较短;而镇级加班率最高,通勤更是达到了9.5公里。。。哎,学姐你看啊。”

学姐没有搭腔,我转过头来,发现她已经把手机贴到了耳边,并对我做了一个嘘的手势,我赶紧闭上了嘴。隐隐听到她手机听筒里嘟了两声之后传来接通的声音,然后她赶忙急匆匆地问道:

“喂,妈,你在市里面有人吗?”

本文作者:佚名

来源:51CTO

时间: 2024-08-04 02:16:33

大数据告诉你要不要当公务员?的相关文章

生儿子幸福还是生女儿幸福?让大数据告诉你!

儿子是"建设银行",所以生了儿子的爸妈会马上开始省吃俭用攒钱买房,而女儿是"招商银行",生女儿的爸妈可能就会计划买辆新车.那么到底生女儿好还是生儿子好,爸妈们一直是各说各有理,并没有统一的答案. 最近一项名为<新经济时期的子女性别和父母幸福感>的课题研究,其内容包括个体幸福感指标.子女的数量.性别和年龄以及教育.收入.健康等.研究在采集了国内72个地级市4309个家庭的样本之后,得出"生儿子的父母,在儿子长到17岁至30岁期间,幸福感明显比生女

未来房价涨or跌?大数据告诉你

文章讲的是未来房价涨or跌,大数据告诉你,提到大数据,许多人的第一反应就是"虚无缥缈"."关我什么事"."搞不懂的存在",且好像产品只要冠上大数据的名号就十分高大上.其实,大数据并不是那么遥不可及,它无形的遍布于人们生活中的各个角落,只是很多时候我们都忽略了它.近日在ITPUB技术论坛的一个讨论帖中,网友们列举了很多大数据"接地气"的应用,预测房价.指导交通.商业决策等等,并对大数据的未来发展方向发表了各自的观点,整个讨论帖好

消失的马航 大数据告诉你航空安全现状

http://www.aliyun.com/zixun/aggregation/38399.html">马来西亚航空公司编号MH370客机飞行途中失联的事件发生至今已超过24小时.马航9日早上9点在吉隆坡举行最新发布会,马航表示目前仍未找到任何残骸证据.观察者网将继续追踪报道最新消息. 3月9日09时,马来西亚飞机失踪最新消息:马来西亚航空公司编号MH370客机飞行途中失联的事件发生至今已超过24小时.马航9日早上9点在吉隆坡举行最新发布会,马航表示目前仍未找到任何残骸证据.观察者网将继续

大数据告诉你梅西如何制霸足坛!

转载|数据客 微信|idacker 大数据在体育方面的应用很多,比如算法可以告诉你,如果百米之王博尔特和奥运会10000米金牌得主莫法拉如果比赛,492米将是他们的"公平距离",详情请点击<算法告诉你,"跑男的能力有多强">: 回复"体育"查看大数据文摘关于数据与体育的文章 北京时间今天凌晨上演的欧冠决赛,巴萨以3比1击败尤文,赢得历史上第5座欧冠奖杯.虽然比赛中梅西没有取得进球,不过梅西的发挥依然获得<每日邮报>赛后为球

让大数据告诉你,网红“小龙虾”究竟有多火

近日小龙虾彻底火了,成了现在赤手可热的网红,茶余饭后的谈资.它的味道让人欲罢不能,回味无穷,人们为了能品尝到正宗的小龙虾不惜早早地在夜宵摊前起了长队,再多的等待对于这些慕名而来,想品尝小龙虾的顾客来说都是值得的.而那些专门制作小龙虾的店铺的老板们看到有这么多顾客,想必也是高兴得合不拢嘴了,赚得盆满钵满. 不过话说回来,小龙虾这种司空见惯的夜宵为何一下子就火起来了呢?现在"网红"小龙虾究竟有多火爆呢?作为程序员的我们,本着程序员认真,严谨,细心的态度,应该理性分析,用大数据方式来生动形象

今年会不会感冒?大数据告诉你!

"叮叮"手机响了,你拿起来一看,屏幕上红色的打字闪烁着"该地区已经有35人患有流感,请谨慎前往,做好必要防护措施!"如此智能的预测可能不再是梦.想知道今年冬天会不会感冒,什么时候得感冒吗?TwitterHealth可以告诉你! TwitterHealth是纽约罗彻斯特大学发起的一个研究项目,可以通过分析用户的Twitterhttp://www.aliyun.com/zixun/aggregation/7686.html">微博内容来预测用户会不会感冒

消失的马航 大数据告诉你真实的航空安全现状

马航失联事件,牵动着每个人的心,全世界都变成了接机人,而最新消息,@央视新闻:[扩散:客机失联54小时最新消息]①我国将派由外交部.公安部等组成的联合工作组赴马;②首批中国乘客家属将乘坐马航赴吉隆坡;③我海军再派一导弹驱逐舰.一两栖船坞登陆舰赶赴救援;④我国"南海救115"预计今天18时抵达疑似失事海域;⑤国际刑警组织称发现"更多可疑护照".祈祷 3月9日09时,马来西亚飞机失踪最新消息:马来西亚航空公司编号MH370客机飞行途中失联的事件发生至今已超过24小时.马

备战双十一,大数据告诉你哪家快递公司最强?

距离购物狂欢节--双十一,倒计时还有4天,到时国内各大快递公司的快递小哥又有的忙了.随着网购的普及和电商平台的快速发展,中国快递行业呈现数据升级.服务升级和能力升级三大特点,已经连续5年增幅超过50%,已成为中国增速最高的行业之一.据国家统计局统计,2015年,全国快递服务企业业务量累计完成206.7亿件,同2014年的139.6亿件增长了67.1亿件,增长率为48%. 2011-2015年中国快递业务量规模统计表 数据来源:国家邮政局.中商产业研究院 2015年,全国快递服务企业业务收入累计完

密码又泄露?!大数据告诉你什么样的密码最牢靠

编者按:乌云漏洞报告平台昨日宣布网易邮箱数据泄露,目前网易与乌云的撕逼大战虽然还没有一个确切的结果,但已让亿万邮箱用户惊出一身冷汗,也顺带反思自己的邮箱密码是否够牢靠.大数据文摘为想要"加固"重要密码的读者献上一篇旧文,到底什么样的密码才真正牢靠? FreeBuf黑客与极客授权转载 www.FreeBuf.com 对于密码,我们已经知道了不少.比如,多数密码短小.简单.且容易破解.但我们对一个人选择某个密码的心理原因却所知甚少.在本文中,我们分析了包括企业CEO.科学家在内的1000万