HP Social Computing Lab关于社会化媒体影响力和消极性的研究报告

郑昀 20100806

话说惠普有一个研究社会化网络数据挖掘的 Social Computing Lab(SCL) 实验室,领头的是 Bernardo Huberman 博士。

他们最近发布了一个研究报告《Influence and Passivity in Social Media》,基于250万用户的2200万 Tweets 数据。它的一个结论是:the correlation between popularity and influence is weaker than it might be expected,名气和影响力没什么关联,比人们期望的弱得多,High numbers of followers does not equal influence because those followers do not re-Tweet,名气和影响力是两码事,关注者多不等于有影响力,重要的是有多少人愿意转发你的消息

最简单测量你的名气和影响力之间关系的是,发布一个能统计点击次数的短域名网址,看看到底有多少人从你的这条 Tweet 点击,别管你有多少万关注者,你是否有足够的影响力让人点击一个链接。

做PR或Ad的公司要注意这一点,想让微博客上的人帮你营销,不要只看他的 Followers/关注者/粉丝 数量,这数字没啥用,要精确测量他的真正影响力

惠普的这个研究由于并不特定针对 Twitter ,所以它的结论也适用其他社会化网络。

 

加入了 Passivity 维度

大多数人都只是信息的消极接收者,他们并不会把东西转发到自己的网络里。为了让一个人有影响力,不应该仅仅停留在吸引别人的注意(眼球)从而变得有名上,还需要让用户克服他们的消极性(passivity)。

SCL 利用人在 Social Network 里的消极性,设计了一个影响力通用模型。它还开发了一个算法来量化网络中所有人的影响力,有点类似于HITS算法,综合考虑了网络的结构属性和用户之间的传播行为。

一个用户的影响力不仅依赖于他影响到的听众的多少,而且依赖于他们的消极性。

以前的影响力测量方法则主要基于一些个体的统计属性,比如关注者的数量,比如锐推(retweets)的数量。

SCL的这个算法有很好的预测能力,比如预测一个发布链接的点击次数上限会是多少。

SCL还发现那些高消极性的节点(node),大多数都是垃圾制造者(spammers)或者机器人账户(robot users)。(注:不知道SCL如何评估@rtmeme这种机器人。)

 

实作

SCL 像锐推榜一样也是从Twitter Search API进去,查询包含 http 关键词的 Tweets ,试图收集齐提到链接的 Tweets(下称“链接推”)。历经300小时,获得了2200万条相关消息,其中1500万条的链接经过检查是有效格式。据他们评估,这2200万只是那个时间段内 Twitter 全部消息的十五分之一。

然后对这个集合中的用户,逐一通过 Twitter API 查询该用户的元数据,尤其是 followers/followings 的数量。

这样就得到了一个带着时间戳的 URL 集合,一个对应用户的完整的 Social Graph 。

 

user retweeting rate=用户A决定转发的URLs数量 / 用户A从他的 followings(他所关注的人)接收到的 URL 数量 。

audience retweeting rate=用户A发布的URLs中被 Followers(关注者)所转发的数量 / 用户A的一个 follower(关注者)从A这里所接收到的 URL 数量 。

 

很容易计算用户之间的 pairwise influence 关系,比如在 Twitter 里,要计算用户A对用户B的影响力,只需要统计B锐推A的次数即可。但你很难利用这种 pairwise influence 信息去计算一个用户(如@zhengyun)对整个网络的影响力。

SCL设计了 IP(Influence-Passivity) 算法,每一个用户都有一个 influence score 和 passivity score 。一个用户的 passivity 得分用来评估其他人想要影响到他有多难。

该算法有以下假设:

1、一个用户的 influence score 依赖于她所能影响的人数以及这些人的 passivity 。

2、一个用户的 influence score 还要考虑到,她所能影响的人专注程度(how dedicated)。

3、一个用户的 passivity score 依赖于这样一些人的影响力:她能接收到这些人的消息但却没有被影响到。

4、一个用户的 passivity score 还要考虑到,how much she rejects other user's influence compared to everyone else.

 

算法迭代计算 passivity 和 influence 得分,有点像 HITS算法 的寻找 Authority 页面以及指向它们的 Hub 页面。

给定一个加权有向图(weighted directed graph,也叫带权有向图) G = (N,E,W),N是所有节点的集合(nodes),E是弧的集合,W是权值。某条弧 e = (i,j) 的权值 Wij ,代表一个比率:i 对 j 的影响力 / i 试图施加在 j 上的全部影响力。

IP算法将这个 graph 作为输入。SCL 是这样构图的:

nodes是那些曾经发布过三条以上链接推的人。

如果用户 j 曾经至少锐推过用户 i 的链接推一条,那么弧arc (i,j)就存在。这条弧的权值计算公式为:Wij=Sij/Qi,其中,Sij是用户 i 发布的链接推中被用户 j 锐推的数量,Qi 是用户 i 发布的链接推数量。

最终计算时,SCL 的这个 graph 的节点数是 45万个,1百万条弧,平均权值是0.07。

在这个 graph 数据基础上,SCL 计算了 PageRank、Influence和Passivity 得分、Hirsch Index.

(注:H-index ,是一种评价学术成就的方法。一名科研人员的h指数是指他至多有h篇论文分别被引用了至少h次。h指数能够比较准确地反映一个人的学术成就。一个人的h指数越高,则表明他的论文影响力越大。例如,某人的h指数是20,这表示他已发表的论文中,每篇被引用了至少20次的论文总共有20篇。)

在 Twitter 里,一个用户的 H-index 是 h ,代表他的被人锐推了至少 h 次的链接推总共有 h 条。

(待续)

时间: 2025-01-17 12:12:40

HP Social Computing Lab关于社会化媒体影响力和消极性的研究报告的相关文章

Klout:聚焦社交媒体影响力评估

140字导读 我的文章的一些主要观点回顾:1)比起线下的真实影响力评估,社交媒体影响力评估更可能实现,在营销上的利用层面更广.2)社会化媒体影响力评估让你找到真正的意见领袖在哪里.他们可以不是名人,但是在某个话题,关键词里具有影响力.3)以意见领袖为主体的营销活动是多社交媒体,跨平台的.你聚焦的不是社交媒体的平台,而是人.意见领袖在哪里,粉丝就在哪里.4)找到意见领袖,把你的产品真正实惠到每一个需要的人. 写在前面的话 据TechWeb的报道,2011年13家最受VC追捧的科技创业公司,排名第九

实例分析国外社会化媒体营销的生存业态

目前在中国以社会化媒体营销作为公司主营业务的公司还没有出现.有那么几家零星的在做何社会化媒体营销相关服务.有关企业如何开展社会化媒体营销,我之前的<<社会化媒体营销作战纲领>>有一定的叙述. 我们将以几家国外的社会化媒体营销公司作为我们的案例来看下目前社会化媒体营销公司的业态. 公司业态大体分为2种: 1,目标明确的社会化媒体营销公司 2,数字营销公司+社会化媒体营销业务 在国外社会化媒体营销也是比较新的概念,要是一个公司仅仅以社会化媒体营销作为其公司全部业务,还是存在一定风险.不

新思维:RickMilenthal让社会化媒体释放草根的影响力

■文/本刊记者周再宇 发自北京 如果facebook是一个国家的话,从人口规模看,它是全球第三大国家. 当我们讨论社会化媒体的时候,必然要提到facebook.从美国扩展到其他国家,facebook已经拥有6亿用户.在丹麦,已经有超过一半的人口在使用facebook.在澳大利亚,甚至法庭系统都在使用它.facebook每周的流量已经超过了Google.在美国,甚至有人在讨论一个社会现象,叫做"facebook沉溺症". facebook的火爆展现了社会化媒体发展的无限可能性.Engau

社会化媒体下的品牌监控

目前随着社会化媒体的广泛使用,品牌如何监控网络这个区域,企业 如何更有效的监控好用户的反应和突发事件?是摆在我们眼前的一个实在的问题. 前些日子奥美数字实验室推出了一项监控软件,国内CIC的论坛,社会化媒体的数据监控软件.通过关键词等一些keyword来检索有关品牌的言论和事件. 广告人一旦把IT,技术结合到社会化媒体的运营上来,这样效果会更有说服力. 社会化媒体的环境下我们如何对我们的品牌进行监控: 最关键部分是听和反馈 可以分为以下几个步骤: 1,发生了什么 2,用户在说什么 3,加入其中,

浅谈情感营销与社会化媒体营销手段相结合的新模式

中介交易 SEO诊断 淘宝客 云主机 技术大厅 问世间情为何物?直教人生死相许! 万事万物皆从"情"字出发. 纵然古往今来.千山万水.物是人非--也总是会有才下眉头,却上心头的情愫. 又有谁真能做到挥一挥衣袖,不带走一片云彩呢?! 倘若心有灵犀一点通,更是乐得不知魏晋了. 你都和谁谈过恋爱? 高富帅的?还是理工男? 青梅竹马的?还是暮然回首的? 落花流水的?还是爱到不能爱呢? 就算在选择中都出现过,但是, 你和消费者谈过恋爱吗? 你知道怎样让消费者爱上你吗? 因为爱 所以爱 --浅谈情

《社会化媒体营销投资与回报 》优秀图书推荐

社会化媒体营销投资与回报 [ 美 ]Olivier Blanchard (奥利弗 · 布兰查德)著 王天衍 译 ISBN 978-7-121-17153-6 2012 年 7 月出版 定价: 49.00 元 16 开 280 页 宣传语 SoLoMo已经走进了我们的生活,新营销系列的精选图书将会帮你解读 SoLoMo 背后的秘密! 编辑推荐 在社交网络和移动互联网的火爆以后,一个新名词"SoLoMo"已经诞生了,那是Social(社交的).Local(本地的).Mobile(移动的)三

你应该知道的社会化媒体营销技巧与策略

社会化媒体营销技巧与策略 [ 美 ]Liana "Li" Evans (莉娅娜 . 李 . 伊文思) 著 王正林 王权 肖静 等译 ISBN 978-7-121-16924-3 2012 年 6 月出版 定价: 49.00 元 16 开 352 页 内容简介 在如今这个新媒体时代,可以说是内容为王,而市场营销的规则也已经发生改变,而营销制胜的关键就是在于打造一个新型的营销模式--那就是社会化媒体营销.本书作者介绍了如何了解受众.建立信任.与之交流互动.保护品牌.将社会化媒体融入现有的营

营销人员如何避免社会化媒体ROI的5大误区

中介交易 SEO诊断 淘宝客 云主机 技术大厅 导读: 本文列举了营销人对社会化媒体ROI的五大误区.①社会化媒体ROI并非独立于成本.利润的要素 ②社会化媒体KPI的设立可类比以前营销的KPI③新兴的社媒KPI层出不穷,但企业不必随意推翻从前的KPI ④衡量社会化媒体ROI的工具并非一个,而是一系列,并且,你已经拥有一大部分 ⑤社会化媒体ROI可能不能真实反映社媒的一切,但能表现出当中的重点,不就好了吗? 如今,社会化媒体人都在探讨着如何考量相关工作.营销人承受着巨大压力,急需明确能够衡量其策

国内社会化媒体营销案例

上一篇漂石就社会化媒体,社会化媒体营销,以及国内社会化媒体和美国社会化媒体差异化从横向和纵向上作了一个比较,国内社会化媒体的发展起步较晚,但是发展速度较快,但是社会化媒体营销还是有着很大的差距,国内网络营销还是停留在1邮件营销,2电子商务平台营销,3搜索引擎营销初级网络营销阶段,社会化媒体的时代已经到来,如何赶上这词社会化媒体营销的大潮,掌握社会化媒体营销利器,为我所用,助力广大中小企业开展社会化媒体营销.漂石将一些国内外经典的社会化媒体案例分享,以飨各位企业网络营销从业人员,能够从中得到一些感