■观点速递
近年来,信息化的步伐急剧推动着">海量数据,波澜壮阔的大数据浪潮席卷人类社会各个领域,一些通俗读物囫囵吞枣的浅知误见也随之流传。例如,当前国内常 常援引维克多等人撰写的《大数据时代》中提出的三个主要观点,并成为一种流行。这不仅不能揭示大数据时代的真正本质,而且将产生严重误导。
《大数据时代》提出,大数据时代“不是因果关系,而是相互关系”,这说明作者不了解因果关系本身也是一种相互关系。18世纪,英国怀疑论者休谟早就指 出,“不但我们的理性不能帮助我们发现原因和结果的最终联系,而且经验给我们指出它们的恒常结合以后,我们也不能凭自己的理性使自己相信,我们为什么把那 种经验扩大到我们所曾观察过那些特殊事物以外”。在休谟看来,“因果关系”不是自然的本质,而是因为我们所养成的心理习惯和人性所造成的。恩格斯从辩证唯 物主义立场对此给与了批判性的扬弃,他指出,“原因和结果这两个观念,只有在应用于个别场合时才有其本来的意义,……”“要认识世界上一切过程的‘自己运 动’、自生的发展和蓬勃的生活,就要把这些过程当做对立面的统一来认识”。《大数据时代》将休谟这一早已提出几个世纪的陈旧观点,作为大数据时代的新概 念,不仅陈旧,而且错误。
《大数据时代》认为,大数据时代“不是随机样本而是全体数据”,认识事物不再是从随机抽取的部分样本,而是从全部数据出发。实际上,人类在有限的时间 内不可能穷尽事物的全部。如果把现在的大数据方法和过去的小数据时代的抽样调查方法相比,我们只能说,大数据时代可以用更为精确的、全面的数据,以包含更 大因素的仿真模型来追踪、分析模拟现实,取得比过去更为精确的认识结果。尽管如此,与全体相比,我们已经认识到的永远是少数,误差、错误还是不能完全消 除。
《大数据时代》指出,大数据时代“不是精确性,而是混杂性”,其意指小数据时代讲究精确性,大数据时代却因为掌握了大量数据而不再拘泥于精确性,可以 比较模糊地行动。这显然是错误的。因为过去的方法虽然能够掌握精确的小数据,但大多数数据却会因处理能力有限而被遗漏、舍弃,认识的结果自然就无法实现精 确、全面。在大数据时代,因为掌握了更为全面的数据,可以在更大的时间和空间范围认识事物,因此能够更为准确、量化,以至于对一些事物现象的中间模糊区域 也可以得到更为准确的认识,其精确度和模糊度、误差本身都更为精确量化。
我曾预言,“信息化是上帝给中国崛起准备的礼物”,因为中国的人口数量世界第一,信息产业市场最大,最有机会发展信息化、大数据和智慧化产业。现在大 数据迅速推广,可喜可贺。但目前我国有一种极为严重的盲从国外的现象,盲目跟外国人之口风。我们千万不要因盲从国外而将上帝送来的礼物又让给别人!