2.4 要点
- 数据科学的历史比人们通常想象得要悠久,然而,直到上一个10年(2000~2010年)才得以落地。
- Drew Conway在2010年9月创作的著名的韦恩图,有效地总结了数据科学的本质。
- 数据科学带来了许多新规则,它们改变了我们传统处理数据的方式,主要有如下几个。
-
- MapReduce。
-
- Hadoop分布式文件系统(HDFS)。
-
- 高级文本分析。
-
- 大规模数据编程语言(如Pig、R、ECL等等)。
-
- 替代性数据库结构(如HBase、Cassandra、MongoDB等等)。
- 数据科学的规则转变了我们处理数据的手段,而这对我们的生活产生了巨大的影响。正如它带来对处理大数据有至关重要价值的新思维一样。
- 数据科学的提升带来的新思维,同样带来了数据科学家的职业生活和他与人相处的新变化。
时间: 2024-09-14 02:15:48