谁关心比特币,看大数据百万条推特分析

  Derrick Harris分析了今年二月份的共计约130万条关于比特币或其创始人Satoshi Nakamoto的推文,他希望从这些信息中了解那些真正对比特币感兴趣的人,并了解推特上的活动是如何追踪大事件的,另外还详细分析了关于推文发布者、发布地和具体信息情况。本文来自Gigaom,下面看Derrick Harris给我们带来的精彩解读。

  以下为译文:

  综述:为了了解比特币这一全球现象,我分析了二月份共计约130万条关于比特币的推特。以下是关于推文发布者、发布地和具体信息的分析。

  最近我分析了今年二月份的共计约130万条关于比特币或其创始人Satoshi Nakamoto的推文。我希望从这些信息中了解那些真正对比特币感兴趣的人(至少他们的兴趣足以推动他们发这推特),并了解推特上的活动是如何追踪大事件的。

  以下是我得到的信息。点击图片阅读更详细的信息。

  (免责声明:我既不是统计学家,也不是程序员,因此我使用的是比较简单的统计工具,并和其它领域的公司合作。Gnip——现在是Twitter的一部分——提供了这些数据。我借助Chartio提供的的基于云计算的分析服务进行大部分的定量分析和部分的可视化。我通过Google Fusion Tables实现Marc Andreessen图,通过Tableau进行新闻内容的分析,通过Alchemy API分析Mt.Gox的微博人气。

  是谁在推特上谈论比特币

  共计333,144个推特账户发布过有关比特币的推文。但各账户发布的推文数量大不相同。有些账户明显是垃圾邮箱账户或其它类型的机器人账户——数千个账户仅仅发布过一条推文或者干脆没有发布过推文——其余的持续的关注着比特率和比特币的新消息。下图是2月份最活跃的十个账户。

  下图是被@次数最多的十个用户。毫无意外的比特币的新闻专家Coindesk占据了榜首。实际上大部分数字还要更高(有些甚至会高出许多),因为推文经常会引用多个推特账户,但是因为数据格式的原因,我们很难计算那些推文。

  有些账户只是“昙花一现”,某条推文突然被大量转发,如脱口秀主持人Conan O’Brien的这条推文。

  和一位名叫Bacon Bangkok.的用户的这条推文。

  加V用户中,Marc Andreessen最活跃,并备受关注

  我认为也有必要分析加V用户的情况来了解都有哪些知名人士在推特上探讨比特币。下图是2月最活跃的加V用户,风险投资家Marc Andreessen(@pmarca)位居榜首。

  Andreessen也被提到了很多次,这也在意料之中——他被提到了3600多次(包括被其它用户提到)——考虑到他只发布了145条推特,这个数字很庞大。我们通过一个交互式表格(点击这里)展示他创建的庞大的网络。小黄点代表提及Andreessen和其他人的推文,蓝色点代表发表推文的推特账户。Andreessen是一个大黄点,他连接了提到他的人和他提到的人。

  你可以发现,Andreessen直接回复或直接推的网络用户数目很小。

  比特币(可能)在哪里流行

  下图统计了发布推文数目最多的时区,考虑到垃圾账户的存在和一些账户没有明确的时区或者时区错误,这是一个大概的结果。此外,这个统计是针对单条推文的,不是面向不同时区中的不同推特账户的。例如,ALLThingsBTC账户所发布的15,000条推文中的20%是来自伦敦时区的。

  如果通过用户定义的地点来分析,问题会大不相同。例如,你会发现有成千上万种说法来指代纽约,而且Cryptogeeks代表#Bitcoin #Litecoin #Altcoins。

  如果你想看这些数据的视觉效果图,下图是使用Google Fusion Tables对小样本用户位置映射得到的效果图。这并不完全精确——Fusion Tables视图将每个事物定位,即使有些没有真正的位置——但它大致描述了全球比特币的现状。

  Mt.Gox垮台

  上述的图表描述都是谁在发布推文,但为了完整的分析二月比特币的形式,我们还需要分析比特币交易服务Mt.Gox的消亡。

  Mt.Gox的垂死挣扎见下图时间轴。2月7日是一个大跌,当天Mt.Gox官方宣布暂停比特币的取款。2月10日,Mt.Gox延长了对取款的禁令,比特币价格大跌。2月24日晚,Mt.Gox已经‘丢失’了750,00比特币,市值3.75亿美元,隔日早晨,推文数目猛增。2月28号,Mt.Gox申请破产保护。

  下图以小时为单位进行分析。注意从2月8日开始,垃圾账户数飙增。

  Mt.Gox于2月6号深夜发布了通告后,当媒体开始讨论Mt.Gox的垮台时,推特上关于提款问题的抱怨、宣称Mt.Gox即将灭亡的言论也越来越多。2月5日Mt.Gox上比特币大约贬值100美元的也是原因之一。

  2月4日,瑞典海盗党创始人Rick Falkvinge宣称,Mt.Vox已经积累了高达3千8百万的未提款(即,比特币离开用户账户但并未支付给用户)。

  总之,关于Mt.Gox的言论紧随最新消息。在下图表中,蓝线代表态度消极的推文,黄线代表态度积极的推文,紫线代表当天所有关于比特币的推文。2月25日,提及Mt.Gox的消极推文数量占据了所有关于比特币推文数量的四分之一。

  将记者算进来

  当记者了解一个故事后,他们的文章往往传播广泛。2月,共计247,000个不同的连接被分享,共被分享102万次。我分析了被分享次数最多的前10,705条连接,这些链接最少被分享了12次。其中,1328(不足总链接数目的1%)——程度上、形式上——来自25个技术和通用新闻网站。他们被分享了121.931次,占据了2月份分析活动总次数的12%。

  (关于链接的一点说明:考虑到RSS、Google或其它社交媒体在分享链接时会修改链接,我们很难获得针对每个链接的确切数字。通过Excel我将单元格们缩短为100个特征,这是一种对付有多个链接单元格的好办法。)

  长话短说:评估出版物的普及度时,使用总分享量比使用单一链接得到的结果更精准。对前44,810个链接使用这种分析方式,我们将得到针对每个出版物的多个链接,最低限度的更高分享数。

  现在来看看当我们加入Coindesk,这个关注货币流通的新闻站点时,我们将得到什么。点击这里查看这个图表的交互式版本。

  同样,新闻站点与垃圾信息、比特币钱包链接、交易所、监视器或其它非新闻站点并不匹配。分享次数最多的前15个链接正是如此的站点,共计76,534次分享。你可以点击这里查看。这篇来自Wired的文章(这个版本似乎取代了早期的版本)是分享次数最多的链接,被分享了1404次,

  向Satoshi致敬

  通过对推文的分析,我得到了上述信息,全文终。

时间: 2024-10-07 08:52:19

谁关心比特币,看大数据百万条推特分析的相关文章

从百万条推特分析,谁真正关心比特币

关于比特币或其创始人Satoshi Nakamoto的推文,他希望从这些信息中了解那些真正对比特币感兴趣的人,并了解推特上的活动是如何追踪大事件的,另外还详细分析了关于推文发布者.发布地和具体信息情况.本文来自Gigaom,下面看Derrick Harris给我们带来的精彩解读. 以下为译文: 综述:为了了解比特币这一全球现象,我分析了二月份共计约130万条关于比特币的推特.以下是关于推文发布者.发布地和具体信息的分析.最近我分析了今年二月份的共计约130万条关于比特币或其创始人Satoshi

看大数据如何颠覆医学:分析、大数据和临床试验

在看医生的时候,我们相信医疗专业人员的知识,他们能运用行之有效的科学方法对我们进行治疗,这种科学方法被称作"循证医学"(EBM).这意味着他们开的处方药或着选择的治疗方法,在临床研究中已经被证实是成功的.循证医学(Evidence-Based Medicine,EBM),其概念和范畴自最早被提及,就不断在扩大.变迁和泛化.Evidence Based Medicine,重点在Evidence.解决的是什么是Evidence的问题,说的是什么样的东西可以作为临床的依据,这些依据如何确定孰

用"数据"说话 从SACC看大数据应用之道

文章讲的是用"数据"说话 从SACC看大数据应用之道,正如<大数据的冲击>的书中提到的那句话:"Google.Amazon.Facebook.Twitter,这些称霸全球互联网的企业,它们的成功都具备一个共同的因素,你知道是什么吗?"当然不是商业模式,因为他们的商业模式不尽相同.当然也不是客户服务,尽管这个很重要,那这其中最重要的共同点恐怕就是大数据技术的应用. 曾经有人说互联网将改变很多的行业,但在热衷大数据技术的人眼里,真正改变那些行业的并不是互联网

从5大行业领域看大数据场景应用

大数据定义 对于"大数据"(Bigdata)研究机构Gartner给出了这样的定义."大数据"是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力来适应海量.高增长率和多样化的信息资产. 随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注.分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱.大数据分析常和云计算联系到一起,因为实时的大型数

坐看大数据之道:51CTO专访大数据专家郑玮

大数据已经渗透进人们生活的方方面面,比如商店促销决策.政治活动指引等等.究竟大数据目前发展状况如何?51CTO专访大数据专家郑玮将为您讲述大数据之道. 专访视频专题,请访问<坐看大数据之道> NoSQL与大数据 NoSQL最早出现时,主要是Twitter这些社交媒体网站在用.因为他们需要处理每时每刻用户上传的海量图片.视频等非结构化数据.大数据概念提出之后,由于其在非结构化数据方面的优势,迅速融入大数据整体平台. HBase在大数据平台发展较快 为什么之前XML数据库没有成功?NoSQL的数据

王珊看大数据 - 产品和技术

王珊看大数据 发布时间:2012.05.16 09:22      来源:赛迪网     作者:赛迪网 大数据时代的到来,数据带来了爆炸式的增长,数据设备使真实世界能够被数字化处理,数据由量的积累而产生了分析处理价值. 中国人民大学信息学院教授.博士生导师王珊表示,大数据的来源主要来自互联网公司Facebook.大型企业.电信.金融等行业的简单数据类型和结构化数据.现在Facebook拥有强大的数据仓库.互联网和电子商务的发展使数据库技术面临着海量数据处理的挑战,需要高度的可扩展和高度的可伸缩.

大数据:通过设备行为分析降低支付风险

看大数据在互联网风控中的应用:通过设备行为分析降低支付风险 从2012年起,大数据的话题在中国互联网以及各个行业开始大热,据说2013年已经被国外媒体称为"大数据元年".除了最常规的用户挖掘.广告价值提升,大数据被用来制作热门电视剧,建设医疗机构,甚至帮助奥巴马连任等各种神话已经层出不穷.但互联网最最基础的一项工作--安全工作,似乎一直跟这股潮流没什么关系. 很多人的印象中,互联网安全无非就是装个杀毒软件,网上支付的时候最好再拿个硬件盾(U盾)心里才能踏实点.一出问题,得出互联网始终还

Qlik潘应麒:大数据时代下的现代分析学

文章讲的是Qlik潘应麒:大数据时代下的现代分析学,大数据时代的来临同时意味着我们将进入人工智能化的时代.我们所面对的数据容量,数据种类,数据变化的数据同之前都大不相同.但是,在面对这样庞大的数据量多变的场景下,对于企业来说对每一位企业的员工在每天工作的时候做出的决定有很大的变化. 从业务掌握数据,利用数据做出最优的业务决定,利用数据来帮助我们企业做出最优化的业务经营.最终做出决策的是靠我们的员工.靠人,所以,提供给每个员工先进的技术,来掌握数据,使每个企业员工在共同优化的环境下面,为企业做出最

[译]大数据将何去何从?规范性分析的三个应用实例

在2014年,Gartner公司(著名的IT市场分析公司)将规范性分析(又名时效性数据分析,prescriptive analytics)置于他们的技术成熟度曲线(Hype cycle,用以考察新兴技术)上过高期望峰值阶段的最开始.Gartner称,规范性分析还需要5-10年的时间才能成为世界各地会议室的讨论话题.那么,什么是规范性分析?我们能够如何利用它?以及它如何帮助企业机构在制定决策中起到作用呢? 规范性分析可以被看作是大数据的未来.如果我们将描述性分析(descriptive analy