一种基于MapReduce架构的微博用户影响力评价算法的设计与实现

一种基于MapReduce架构的微博用户影响力评价算法的设计与实现

方超    周斌    李爱平

随着互联网的高速发展和Web2.0时代的到来,微博用户正以惊人的速度在增长.新浪微博现以粉丝数作为用户排名的依据,在僵尸粉和大量低使用率帐号的影响下,这种简单的排名依据难以表征用户的影响力.本文以海量新浪微博数据为分析对象,在分布式系统上构建微博用户的影响力评价模型.文章主要以微博用户的转发网络计算微博用户的微博影响力,再利用关注关系计算微博用户的潜在影响力,最后合成微博用户影响力的评价模型.实验及分析表明,该评价方法在微博服务中能有效的反映微博用户的真实影响力,适用于度量微博用户的影响力.

一种基于MapReduce架构的微博用户影响力评价算法的设计与实现

时间: 2024-07-29 02:53:13

一种基于MapReduce架构的微博用户影响力评价算法的设计与实现的相关文章

一种基于MapReduce的并行聚类模型

一种基于MapReduce的并行聚类模型 顾瑞春  王静宇 在对海量数据进行聚类的过程中,传统的串行模式局限性越来越明显,难以在有效时间内得出满意结果的问题,本文提出一种基于Hadoop 平台下MapReduce框架的并行聚类模型.理论和实验结果证明该模型具有接近线速的加速比,针对海量数据具有较高效率. 一种基于MapReduce的并行聚类模型

空间数据库中基于MapReduce的kNN算法研究

空间数据库中基于MapReduce的kNN算法研究 大连海事大学  刘彪 本文首次尝试设计了一种云环境下的倒排网格索引和在该索引基础上进行的基于MapReduce的空间kNN查询.本文所做的主要工作如下:(1)针对二维空间中的数据点,本文设计了一种分布式的倒排网格索引方法,该索引方法完全符合空间数据索引的标准一动态性和简单性.由于倒排网格索引具有松耦合和无共享的特殊结构,所以该索引比较适合基于MapReduce的大规模空问数据的并行查询.(2)本文提出了一种基于MapReduce的空间倒排网格索

基于MapReduce的GML并行查询

基于MapReduce的GML并行查询 许斌   关佶红 针对应用地理标记语言(Geography Markup Language,GML)表示的海量空间数据查询问题,提出一种基于MapReduce的GML并行查询方法.通过提取GML空间特征集合,实现GML文档查询到GML空间特征集合查询的查询转化,并利用MapReduce实现空间特征并行查询. 基于MapReduce的GML并行查询

基于MapReduce的分布式极图构造算法研究

基于MapReduce的分布式极图构造算法研究 北京交通大学 赵男 随着云计算技术的快速发展,很多与大规模数据处理相关的研究与应用都逐渐迁移到云计算环境中,如数据挖掘.网络搜索.图像处理以及生物信息分析等.对大规模的图数据处理技术也是当前高性能计算领域的研究热点.而在图论研究中,极图构造算法作为极图理论的一个重要研究内容,越来越受到人们的关注. 极图是指满足一定约定条件且边数最多的图,其构造算法产生大规模的临界图集合作为中间数据.传统的串行极图构造算法会因为需要处理的临界图数量的大幅增加而变得效

基于MapReduce计算模型的气象资料处理调优试验

基于MapReduce计算模型的气象资料处理调优试验 杨润芝 沈文海 肖卫青 胡开喜 杨昕 王颖 田伟 云计算技术使用分布式的计算技术实现了并行计算的计算能力和计算效率,解决了单机服务器计算能力低的问题.基于长序列历史资料所计算得出的气候标准值对于气象领域实时业务.准实时业务及科学研究中均具有重要的意义.由于长序列历史资料数据量大.运算逻辑较复杂,在传统单节点计算平台上进行整编计算耗时非常长.该文基于Hadoop分布式计算框架搭建了集群模式的云计算平台,以长序列历史资料作为源数据,基于MapRe

【近战】基于微博用户关系与行为的用户建模分析

以下为[近战]第一篇,基于微博用户关系与行为的用户建模分析. 用户建模是广告.推荐.搜索算法最基础也是最核心的技术问题之一,本报告将介绍新浪微博大数据挖掘团队如何综合利用社交关系和用户行为来建立用户模型.以下分享下精彩内容.   微博及大数据   微博作为中国最大的社交媒体平台,微博沉淀了海量的用户,内容,关系,和行为数据.   其中用户:注册人数10亿,月活人数1.98亿,日活人数:8900万.关系:关注关系近千亿,分组关系50亿+.内容:日增博文1亿+,日增原创4000万.行为:转发6000

一种基于FPGA云存储架构的关键技术研究

一种基于FPGA云存储架构的关键技术研究 云南大学  陈成 目前常见的云存储服务有:亚马逊的Simple Storage Service(S3).Nutanix的存储服务.搜狐企业网盘.百度云盘等等,而这些并不提供小型开发板所需的云服务.本系统则是以TCP/IP做为基本通信手段,并且加入自定义的数据通信协议,通过整合分布式存储的调度思想,来实现基于FPGA的云存储架构.这样不仅使FPGA开发板能够实现云存储的功能,同时也为基于FPGA的云计算打下了坚实的基础. 本系统利用集群以及分布式的思想,将

[文档]Cloudow: 一种基于用户层虚拟化的软件即服务模式运行系统

Cloudow: 一种基于用户层虚拟化的软件即服务模式运行系统 张悠慧, 李艳华, 郑纬民 本文提出了一种新的支持现有Windows 桌面软件的SaaS 模式并实现了其原型系统Cloudow: 用户可以在任意的联网兼容计算机上按需运行现有的Windows 软件(无需安装) , 且软件的个性化配置可以被保留以便下次使用时恢复. Cloudow 使用用户层虚拟化技术解决了软件无需安装便能运行的问题, 并通过用户层文件系统设计实现了软件在网络环境下的透明使用. 关键词:软件结构 面向服务架构 软件即服

微博用户架构分析(一)

中介交易 SEO诊断 淘宝客 云主机 技术大厅 2009年,微博"突袭"中国,各商家微博营销的战火迅速点起.2010年,已有不少商家实践了微博营销,更准确来说,他们是在探索微博的营销模式.同时网上关于微博营销的文章多不胜数,但笔者发现这些文章都是从企业如何经营,管理微博的角度展开论述,鲜有提及并分析微博用户.然而用户是营销核心之一,是不容忽视的.现在我们来研究一下微博用户的结构. 根据用户微博用户的规模,行为习惯及心理特征,可把微博分成两大类,个人用户和机构及组织.其中,个人用户又可以