华东师范大学社会学研究所所长、教授文军在《人民日报》撰文指出,作为新发明和新服务的源泉,大数据正在改变人类的生活乃至理解世界的方式。但我们不应盲目崇拜,而要正视潜藏的风险和挑战,避免在大数据的洪流中迷失。
一要防止大数据的“去人性化”忽视人的主体价值和数据的社会文化意义。如果人及其各类社会行为都仅仅被看作一个个数据符号,我们就很难从中解读出充满朝气、富有激情的人,也就很难从数据塑造出来的没有个性特征的人去推导群体样态和社会构成。现在一些大数据研究存在的一个重大缺陷是,它只关注“客观数据”的呈现,而缺少对“主观数据”的反映。从社会学角度看,所有数据说到底都是有关“人”的符号。而符号所蕴含的社会文化意义,是我们真正需要了解和掌握的内容。
二要防止大数据的“巨量化”强化数据霸权。大数据的复杂性不仅在于其数据样本巨量,更在于其多源异构、多实体和多空间之间的交互动态性。当前只有少数人掌握处理这种复杂的巨量化大数据的技术,因此容易导致“数据暴力”。如何防止大数据霸权,是一个需要认真对待的问题。
三要防止大数据的“碎片化”导致人们难以系统认知复杂事物。当前,许多数据仅停留在“碎片化”阶段而难以被真正挖掘和分析。对这些碎片化的数据进行清理,进而形成规整的结构,是大数据能够得到充分利用的根本所在。在大数据中,其研究范式重在发现而不是推论;不是像传统的社会调查方法那样通过假设检验来进行推论,而应通过数据的总体归纳来达成对社会现象的总体分析。这不仅要求我们在数据清理技术、存储结构上进行优化,而且要在数据采集环节尽可能做到规范。
四要防止大数据的“模糊化”产生大量信息垃圾,从而为数据造假和不当传播打开方便之门。在大数据时代,我们想要获取的信息资源可能只占数据总体的万分之一甚至更少。从这个角度说,大量的信息其实都是垃圾。不仅如此,许多大数据本身就是模糊的,其中含有虚假和有害的内容。如果纯粹凭借数据来判断和分析,甚至不假思索地利用和传播,就会导致许多误判。因此,未经前期调研论证和规范分析所获取的信息,其数据量越大可能越模糊,得到的垃圾信息也就可能越多。
本文转自d1net(转载)