由于Spark是在Hadoop家族之上发展出来的,因此底层为了兼容hadoop,支持了多种的数据格式。如S3、HDFS、Cassandra、HBase,有了这些数据的组织形式,数据的来源和存储都可以多样化~
本文转自博客园xingoo的博客,原文链接:《Spark快速大数据分析》—— 第五章 数据读取和保存,如需转载请自行联系原博主。
时间: 2024-11-04 00:04:57
由于Spark是在Hadoop家族之上发展出来的,因此底层为了兼容hadoop,支持了多种的数据格式。如S3、HDFS、Cassandra、HBase,有了这些数据的组织形式,数据的来源和存储都可以多样化~
本文转自博客园xingoo的博客,原文链接:《Spark快速大数据分析》—— 第五章 数据读取和保存,如需转载请自行联系原博主。