大数据:算得出数字 算不出人性

信息时代,没有人能逃脱数字的包围,我们的日常活动情况都被数字化的信息形式记录下来,就连手机里的好友都拦不住大数据无形的手。最近微信新增了删除“不常联系好友”功能——半年内无单聊、无共同小群、半年内没有回复过他(她)的朋友圈的微信好友,都可以被批量删除。每一个看似不常联系人,背后都隐藏着千丝万缕的关系网。活生生的好友,真的可以被大数据以清理之名一键删除吗?

这是个“数据为王”的时代,数据失真却远比我们想象的要严重得多。不可否认,互联网的野蛮生长,少不了大数据为文化、生产提供参考和指南,大数据也的确为避免盲目出击立下不少汗马功劳。于是,大数据打着科学的名义,肆无忌惮地入侵我们的生活:淘宝数据暴露了你的消费状况、微信数据透露了你的社交圈子、银行账务交易数据反映了你的金融状态……在某些人眼里,大数据意味着人气和流量,没有数字的搀扶,我们似乎已经寸步难行。

大数据已无孔不入,从商务、体育、医疗到我们生活的方方面面,在蓬勃发展的同时,也面临着异化变形。“大数据押题”代替“名师预测”、“占卜星术”变身大数据算命,得出很多令人啼笑皆非的荒谬结论。例如,有数据称上海居民用电量出现下降,因而断言:人口大批撤离上海。然而,仔细用心分析下,用电量和人口之间并非单向因果关系,用电量变化背后可能同时有天气、价格等多重因素的作用。事实上,大数据不是简单的数据,更不是堆积在一起被任意拼贴剪裁的数字。大数据只是技术,真正有价值的是隐藏在大数据背后的思维。大数据的本质不在于“大”,而是以崭新的思维和技术去分析海量数据,揭示其中隐藏的人类行为方式,否则,就算数据再大,也不过是奴役人们思维的工具。

大数据并非无所不能,它本初的意义是提醒人们注意其蕴含的是计算和思维方式的转变,但过于简单的曲解,助长了“大数据迷信”。几百年的统计学发展史已经足以证明,任何单纯通过统计数据来认知现实世界的方式都有缺陷,样本误差和统计偏差,都足以构置种种“陷阱”。

离开了温情的大数据,不过是一堆冰冷的数字。

本文转自d1net(转载)

时间: 2024-10-03 00:15:30

大数据:算得出数字 算不出人性的相关文章

大数据应用之双色球算奖平台总体设计数据规模估算篇

作者:张子良 版权所有,转载请注明出处 引子:什么才算大数据? 自从写了上一篇<大数据应用之双色球算奖平台总体设计大纲篇一>,受到许多园友的关注和指导,在此表示感谢,尤其是园友个人知识管理给出的一个评论,让我深思,原文如下"双色球算奖这么简单的活,也称大数据.先生:不是数据多,叫大数据.双色球算奖,用Oracle数据库的索引,1分钟内就算完.关键是人家不想这么快".话不太好听,尤其是称我为先生那句,但却发人深思,是啊:到底什么是大数据呢?选择双色球算奖作为大数据应用的切入点

大数据应用之双色球算奖平台总体设计历史数据存储篇

作者:张子良 版权所有,转载请注明出处 1.1 引子:文件OR数据库 历史期次的双色球选注数据的存储,采用什么样的格式比较好呢?这需要重点从三个方面考虑,一.文件访问方便吗?二.文件服务器空间够用吗?三.软硬件故障环境下,如何保障数据的可用性.基于这几个方面的考虑,到底是采用文件存储还是采用数据库存储呢?本文,从传统和前沿技术两个角度给出了两种相应的解决方案. 1.2 文件存储 1.2.1 三大问题 根据上一篇<大数据应用之双色球算奖平台总体设计数据规模估算篇>分析,双色球单期次数据的存储规模

大数据+分析学 数字油田的两把利剑

在石油和天然气行业,数据都是以太字节(TB)和拍字节(PB)来表示的.这两个词语对于你来说或许有些陌生,下面我给你打个比方,一切就清晰明了了. 一个吉字节(GB)相当于七分钟的高清视频;一个太字节(TB)等于1024个吉字节(GB);而一个拍字节(PB)等于1024个太字节(TB),相当于13.3年同样的高清视频. 每天全球油气行业都会产生数百个太字节(TB)的数据,每年总计达一个拍字节(PB)数据,也就是13.3年的高清视频了.在这里举个例子,在北美1200英里的管道里每天都会产生大约1TB数

大数据时代的数字营销趋势

mbaonline网站曾发布了一个有意思的统计叫<互联网的一天>:一天内互联网产生的数据流量可以装满1.68亿张DVD光盘:上传到Facebook的照片打印堆积起来有80个埃菲尔铁塔那么高:上传到Youtube的视频时长可以不间断播放98年:在Pandora播放音乐的时长达到1.87亿小时,如果一台电脑从公元1年开始播放,到现在还没有播完-- 毋庸置疑,我们已经进入大数据(Big Data)时代,这些庞杂的数据是垃圾也孕育商机,而最先将这里数据挖掘清洗产生商业价值的,正是网络广告人.正如Fac

利用大数据技术探索“数字公民”创新

全球化.信息化促进社会现代化的同时,也对国家治理体系提出了新要求,治理能力成为国家竞争力的关键.保障和改善民生是国家推进改革发展的重要着力点,政府迫切希望能为百姓提供完善的公共服务,百姓也迫切希望能享用精细化.主动化.人性化的服务,如何实现服务的供需平衡在不断考验我们,从目前效果来看,推力不足,呈胶着状态,公共服务和社会治理面临困境. <国家信息化发展战略纲要><促进大数据发展行动纲要>等文件提出:"以信息化驱动现代化为主线,推进国家治理体系和治理能力现代化",

大数据时代,我们能逃离出那双窥视的眼睛吗

我们的背后不知道有多少窥视的眼睛,身份.位置.银行账号--各种个人敏感信息正被各形各色的采集者获取,滥用.泄露的风险无处不在.大数据时代,个人信息保护正遭受严峻的挑战. 你放心把自己的钥匙交给陌生人吗? 在不久前支付宝的一次升级中,用户可以提供更多信息用以提升芝麻信用值.当中国移动员工宁宇发现支付宝希望客户提供客服密码,授权给芝麻信用使用时提出了质疑:"把你的客服密码告诉支付宝,就等于把自己家的钥匙交了出去,你放心么?" 我国电信运营商都要求客户设置客服密码,通过这组6位数字的密码可以

日华媒:大数据让中日地方经济分出“明暗”

日本<新华侨报>6月6日文章,原题:大数据在让中日地方经济分出"明暗"第一次听到日文的"Big Data"这个词时,为到底翻译成"海量数据"还是"大数据",费了一些周折.说实在的,很多新词笔者时从日语中首先听说的.不过要是说大数据在政务上的运用,给人的感觉是现在中国可能已经走在了日本的前面. 中国在很长一段时间内,工业生产能力完全不能和日本比.钢铁.化工.机械等老的重工业就不用说了,手表.家用电器.电子原材料也在很

大数据:可“感知”情绪“挖”出抄袭

记者从香港中文大学深圳研究院日前主办的"富媒体大数据:感知.处理.检索及应用"博文论坛(第二期)了解到,如何对富媒体大数据进行有效挖掘成为大数据领域的研究热点,对数据进行精确建模.设计高效算法.构建核心技术,从而实现http://www.aliyun.com/zixun/aggregation/13873.html">数据驱动运营,是目前产业界和学术界正在探索和研究的主要方向之一. "21世纪的'数据'相当于20世纪的'石油'."据香港中文大学计算机

广东省首批省级大数据产业园、大数据创业创新孵化园将出炉

日前,我国网络强国战略提升到综合施策的新高度.其中,大数据作为国家基础性战略资源备受重视.去年国务院印发<促进大数据发展行动纲要>,明确加快大数据发展,使之成为推动经济转型发展的新动力.重塑国家竞争优势的新机遇.提升政府治理能力的新途径. 广东作为我国最重要的信息化产业集聚区域之一,也是实施大数据国家战略的重要阵地.广东省委.省政府历来高度重视大数据发展,自今年4月出台<广东省促进大数据发展行动计划(2016-2020年)>以来,我省加大力度推进大数据发展,力争用5年左右时间,打造