大数据时代我们要的是全体数据,不再是样本数据。样本分析发展至今不足100年,在数据和 技术受限的时期,解决了当时存在一些特定问题。如人口普查,一般统计需要8-10年时间, 而此时数据已经完全不准确,失效。所以在当时条件下,有人提出采样的统计学方法。
采样分析有其固有的特性:绝对随机性和忽视细节观察。采样的目的是用最少的数据获取更多的信息。绝对随机性:要求我们在采样时,要绝对的随机,然而要做到此,是有难度 的,因为人总是会对同一样事物有不同的看法。偏离了随机性,那么采样结果的错误率会大大的增加。忽视细节观察:采样在宏观领域的作用,在微观领域失去了作用。就像经济学上的边缘理论一样,当样本达到一定值之后,个体身上的信息就会越来越少。
统计学上采样分析有个非常重要的观点:采样分析的准确性随着随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。
当我们现在能够采集">海量数据的时候,采样对我们来说就没有什么意义了。在大数据时候采集数据不在是只有大公司才能做的事情,很多公司都可以做得到。
大数据是指不用随机分析法这样的方法,而采用所有数据的方法。云计算的出现,让我们采集到海量数据提供的基础设施,通过云计算对大数据进行分析,预测,会使决策更准确,释放更多数据隐藏的价值,发挥更大的作用。
本文是由分享互联网(http://www.hed236.com)所撰写,转载请务必留下链接,谢谢!
时间: 2024-11-02 00:43:44