转眼小王都快变成老王,可他依然没有女朋友。有一天,小王的阿姨的闺蜜的堂姐给他介绍了一个姑娘小花。小王打算伪装成大款和小花约会。
不料小花见到的小王的第一面,手机定制的数据分析服务就发来提醒——
尊敬的用户您好,当前和您会面的王大傻资产约在5000元左右。
小花留下装X的小王在风中凌乱……
读者放心,还好上述只是雷锋网编辑在胡诌。但是9月13日,在T112016暨TalkigData智能数据峰会上,MIT新媒体实验室china iitiative负责人潘巍告诉大家,从手机数据可以判断其社交网络,从而看出穷人和富人的区别。
也就是说,你有没有钱,你的手机比你媳妇都知道。
一场“薅羊毛”引发的实验
这个让人浑身战栗的实验由潘巍所在的团队在2010年展开。当时,在WestGate有一个MIT博士生及家属的宿舍楼,因为研究生招生面向全社会,所以各个阶层的同学都有。比如,一个土豪放下产业来读研和一个节衣缩食的穷学生可能在一个宿舍。
虽然,在2010年,大家的隐私保护意识都不薄弱,谁也不愿意贡献自己的贴身数据做实验,但是研究人员用送给120个人每人一部最新款的三星手机(请打广告费)为条件,要求实验者在一年半的时间内每天都要保持手机开通。所以,说什么好呢?这是一场从“薅羊毛”开始的实验……
社交网络上的你未必是真实的你,如果你给大家发布一个问卷,调查你最好的朋友是谁,这样的研究也未必准确。但是通过安卓手机的传感采集系统,通过蓝牙,面对面搜集两个见面的人的信息,这两个人是真实见过面的,这些信息更可靠。手机还可以采集到你的通讯信息,装了什么样的APP,即使是一个简单的手机,也可以析你真实的情况。
手机让我们对于社交网络有全新的认识。潘巍说。
通讯记录揭示你是穷人还是富人
潘巍及其研究团队对这些手机的通讯记录进行了分析,得出一个关键指标——手机通话记录多样性及均化多样性。
所谓多样性,是指你跟一个人通话,还是多个人通话。而均化多样性,是指通话时长均匀分布人数。
例如,通话90分钟,这90分钟的通话是和三个人进行,其中和甲、乙、丙的通话时间分别为5分钟、80分钟、5分钟。同样的90分钟,和甲、乙、丙的通话时长分别为30分钟。两种情况,通过一个公式计算,后者被判断定为社交网络更广泛,更可能是富人和成功的人。
编辑懵X了,以两个比较常见的案例举例,一个富人与一个美女陷入热恋,经常煲电话粥,这样他的均化多样性其实更偏向穷人,另外,假如一个富人又命途多舛,生病住院很久,就是打打电话跟好朋友解闷,那怎么算?
潘巍向雷锋网解释道:”所以这些数据需要采集一定时间段,甚至较长的时间段,比如一年半,这样更客观。“
另外,雷锋网编辑再次和潘巍确认,这项模型和结论所需的数据仅从手机通讯数据就可得出。但是,潘巍也强调,利用这些实验人群的信用卡数据分析消费行为后也得到了同样的结果。
居然能用于分析城市经济发展
可能通讯记录揭示你是穷人还是富人,会让人些许陷入先有鸡还是先有蛋的争论中。但是让人惊讶的是,从电话公司的通讯记录分析取得了一项神奇发现——联系人的多样性和这个城市的经济指标有很强的相关性,而且多样性和城市人口密度没有关系。
如图所示,X轴是通话多样性,Y轴是城市发展水平。
仅仅通过测量用户的通话记录,还可以预测用户的债务偿还能力、信用指数和找到工作的可能性。
插播一下,雷锋网(公众号:雷锋网)编辑再次脑洞大开,那是不是意味着,每天打电话推销的房产中介是不是最可能成为有钱人,找到工作的可能性也最大呢?
多样性会增加知识流,而城市又会帮助你超线性增加社交多样性。潘巍团队的理论模型如下:
他再次给出了一项佐证:
我们的论文发表一年后,研究员利用来自葡萄牙几个重要城市的用户移动手机之间的通话记录,来测试我们关系信息流的理论是否正确,研究人员称”这些数字结果验证了城市的知识流速度岁城市的大小而增加,符合最近提出的理论结果。“
本文作者:李勤
本文转自雷锋网禁止二次转载,原文链接