大数据与情感分析:言多必得与言多必失

SmogFarm从事的是基于大数据的情绪分析,衡量、跟踪、聚合数百万人的情绪,然后做出全球第一份衡量群众心理的定量指标—地球脉搏。为什么要这么做?因为数据就是未来,情感是笔大买卖,选举、调查结果、流行新闻故事乃至于股市都会受到“群众”情绪的影响。

言多必得

相比之下,KredStreet则找到了另一个似乎更容易变现的垂直商业模式并已开始进行不公开测试:社会化股票交易员排名(The ">Social Stock Trader Rankings)。The Social Stock Trader Rankings对StockTwits的数据进行情绪分析,对Twitter数据流进行采样,以便确定交易员总体看涨还是看跌。它还会将当前的股市表现与交易员过去的涨跌判断进行比对,进而依据交易员的准确率对其进行评分和排名。

这个排名系统的创意的确好。因为这里一切都是靠实力和结果说话,无名之辈只要预测准确率高也能把夸夸其谈的知名人士压倒。实际上,这一思路完全可以推广到许多领域,比方说倡导声音有力则不需名气的舆论网络初创企业State的做法。说实话,这套东西有时候的确比文凭和砖家管用。

当然SmogFarm/KredStreet之流所从事的情绪分析,以及Summly从事的自然语言处理,还有Palantir从事的数据挖掘等尚处在早期阶段,还很不成熟。但请你设想一下5年之后。如果他们的大数据、高能量探照灯打在Facebook timeline这样的东西上,会有多少东西被他们洞悉?

几年前,EFF(电子前沿基金会)发现,哪怕是像浏览器设置这么简单的东西都会让你的匿名性下降到无法想象的地步。上一周,一项新研究又发现人的移动轨迹具有高度的独特性,按照这份研究的说法,从各人匿名提供的手机方位数据中只需抽取四个时空点就能识别出该用户,识别率高达95%。好的软件能够从这些看似稀疏、空白的数据中挖掘出甚多宝物。

言多必失

随着语言和图像处理软件的不断进化,一旦被运用到Facebook timeline这样的东西上,就有可能产生出你意想不到的效果。你所说的话、发出去的图、玩过的游戏等,都会逐渐勾勒出你本人的一幅准确得令人恐怖的肖像,那些东西可能是你从来都不曾想公开的隐私。

更糟的是这件事有可能容易得出奇。老板可能根本就不需要通读你的Facebook timeline,只需将档案分析软件往你的头像一点,半分钟之后,你的工作习惯、神经衰弱、人生受挫、情绪不稳、对老板的态度等悉数就被推断出来—你的照片、评论、喜欢、顶等,这些信息从个体上看虽然毫无意义,但是拼凑起来就能形成你的拼图。

这是一笔大买卖。前不久,IBM开发的新型安全工具就能够运用大数据来识别安全威胁和不满员工。Facebook之流显然也指望此类大数据应用为其定向广告挖掘出大金矿。

但是这会受到用户的反制。我们可以设想,一旦这样的工具成熟起来,大家在网上的表现一定不会再像以前那样直率,会变得更加小心翼翼。或者甚至只看不说。这样的网络到头来也许只有两种结果:死气沉沉、人人自危,或者只谈风月、口是心非。

扎克伯格定律认为互联网用户共享的信息每年都会翻番。但是一旦大家都意识到言多必失时这条规律还能不能延续?

工具无所谓好坏,言多必得还是言多必失,要看用者做不做恶,对于用户和商家来说结果只有两个:双赢或双输,善用则情感成为好买卖,滥用则数据没有未来。

(责任编辑:fumingli)

时间: 2024-10-02 07:25:42

大数据与情感分析:言多必得与言多必失的相关文章

大数据舆情情感分析,如何提取情感并使用什么样的工具?(贴情感标签)

情感分析是学术领域研究多年的课题,用google学术搜索可以找到很多paper,基本的方法上有基于词典规则的方法.语言文法的方法,此外还有分类器以及近几年比较火的深度学习的方法(稍后有详细介绍). 各类paper是有一定的借鉴意义的,不过这主要是学术界在单个问题上的细化,要真正从研究领域落地到大数据的处理还有很多工作要做. 一.工程上的处理流程 工程上的处理流程具体包括以下几个方面: 1.情感分析任务的界定 在进行情感分析任务的界定时,要弄清楚工程的需求到底是什么:要分析文本的哪个层面上的情感,

物联网时代制造企业对大数据的运用分析

文章讲的是物联网时代制造企业对大数据的运用分析,每个人都是数据产生者.拥有者和消费者, 有人已经预言未来的时代是一个"大数据"的时代,关注大数据的人越来越多,同时 物联网的出现与发展推动了数据采集的能力,为数据库的建立提供了有力的支撑.数据的采集处理应用将成为时代的发展主题. 大数据对促进供应链中的生产环节产生了前所未有的巨大影响,每个企业都有自己的规划和自己企业在运营环节的管理最佳实践,在众多的运营决策改进里面,大数据的影响包括产品设计,质量控制,客户画像等等.下面从八个方面介绍大数

亚马逊CTO:大数据不仅仅是分析

亚马逊CTO Werner Vogels在Cebit上发表的主题演讲称,企业在思考大数据的时候,需要注意的不仅是需要分析大量的数据,还包括信息的存储方式. Vogels的演讲题目是"无限的数据",此外,还鼓励企业思考大容量图片的问题,他还介绍了用于实施大数据系统的http://www.aliyun.com/zixun/aggregation/13888.html">亚马逊云蓝图. Vogels表示:"大数据不仅仅是分析,它是关于整个流程.当你思考大数据的解决方

.NET批量大数据插入性能分析及比较

原文:.NET批量大数据插入性能分析及比较   数据插入使用了以下几种方式 1. 逐条数据插入2. 拼接sql语句批量插入3. 拼接sql语句并使用Transaction4. 拼接sql语句并使用SqlTransaction5. 使用DataAdapter6. 使用TransactionScope及SqlBulkCopy7. 使用表值参数   数据库使用SQL Server,脚本如下   create table TestTable(Id int ,Name nvarchar(20))   程序

基于大数据的资金流量分析:思路与应用前景设想

传统的资金流量分析方法,主要是编制部门之间的资金流量表,并据此展开分析,为宏观经济政策决策提供参考.资金流量表分为实物交易表和金融交易表, 分别统计国民经济各个部门(非金融企业部门.金融机构部门.政府部门.住户部门和国外部门)的资金运用与来源情况.通过引入大数据技术,传统的资金流量分析将面临重塑,并将成为精准宏观调控的基础. 大数据对资金流量分析的拓展与重构 大数据的应用将极大地改变资金流量分析的技术基础,拓展资金流量分析的范围,进而重构资金流量分析的内涵和外延. 首先,大数据的应用将极大地改变

当大数据遇到安全分析:思科OpenSOC即将开源

https://yqfile.alicdn.com/e0c1a2bfa5a8e6291a296afbf2f5deda0d374f93.png" > OpenSOC是大数据分析与安全分析技术的结合大数据与安全分析技术的结合是信息安全市场的热点话题,而思科公司的安全大数据分析框架OpenSOC也在BroCON大会亮相(演讲幻灯片.视频),有迹象表明OpenSOC距离开源已经进入倒计时. 据Solidot报道,今年BroCON上最受广泛关注的议题之一就是OpenSOC,Cisco之前说是准备在2

IDC:银行业和制造业推动全球大数据和业务分析市场双位数增长

据IDC全球半年度大数据和分析开支指南称,全球大数据和业务分析(BDA)的收入将从2016年的1301亿美元增长到2020年的2030亿美元. "数据的可用性.新一代技术.向数据驱动决策转变的文化,这将继续成为对大数据和分析数据及服务需求的推动力,"IDC分析和信息管理副总裁Dan Vesset表示."这个市场在2015年收入达到1220亿美元之后,预计2016年的收入将增长11.3%,并且预计到2020年之前的复合年增长率为11.7%." "推动这一增长

IDC:2017年大数据和业务分析收入将突破1508亿美元

根据IDC半年度全球大数据和分析开支指南,IDC预测大数据和业务分析(BDA)收入到2017年将达到1508亿美元,相比2016年增长12.4%.BDA相关硬件.软件和服务的商业采购预计到2020年前将保持11.9%的复合年增长率,收入将超过2100亿美元. IDC分析和信息管理副总裁Dan Vesset表示:"在经过多年的采用S曲线之后,大数据和业务分析解决方案终于步入了主流.BDA作为决策支持和决策自动化的推动技术,现在已经受到了高层管理者的关注.这一类解决方案也是在全球各行业和业务流程实现

全球大数据和业务分析收入预计到2019年突破1870亿美元

根据IDC新的全球半年度大数据和分析开支指南,全球大数据和业务分析收入将从2015年的1220亿美元增加到2019年超过1870亿美元,在5年间的增幅超过50%.这个新的开支指南在IDC此前的预期基础上进行了扩展,提供了技术.行业和地区方面的详细收入信息. 在大多数的预测期内,服务相关的商机将在所有大数据和业务分析收入中占到超过一半的份额,IT服务的收入是业务服务年收入的近3倍.软件将是第二大类别,到2019年收入规模将超过550亿美元.其中近一半的收入将来自于最终用户查询.报告.分析工具和数据