问题描述
最近经常看到spark的新闻。本人不懂,搜索了很多结果,还是不懂。求解惑。在哪些场合使用以及其作用。PS:openstackjuno也支持spark的特性,云计算火爆,spark火爆。故关注一下。困惑
解决方案
解决方案二:
解决方案三:
解决方案四:
解决方案五:
解决方案六:
Spark是继Hadoop之后的新一代大数据分布式处理框架,是一种可扩展的数据分析平台,它整合了内存计算的基元,因此,相对于Hadoop的集群存储方法,它在性能方面更具优势。Spark是在Scala语言中实现的,并且利用了该语言,为数据处理提供了独一无二的环境。Spark是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布数据集的处理提供一个有效框架,而且以高效的方式(通过简洁的Scala脚本)处理分布数据集。Spark和Scala都处在积极发展阶段。不过,由于关键Internet属性中采用了它们,两者似乎都已从受人关注的开源软件过渡成为基础Web技术。
解决方案七:
Spark是继Hadoop之后的新一代大数据分布式处理框架,是一种可扩展的数据分析平台,它整合了内存计算的基元,因此,相对于Hadoop的集群存储方法,它在性能方面更具优势。Spark是在Scala语言中实现的,并且利用了该语言,为数据处理提供了独一无二的环境。
解决方案八:
Spark是继Hadoop之后的新一代大数据分布式处理框架,是一种可扩展的数据分析平台,它整合了内存计算的基元,因此,相对于Hadoop的集群存储方法,它在性能方面更具优势。Spark是在Scala语言中实现的,并且利用了该语言,为数据处理提供了独一无二的环境。Spark是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布数据集的处理提供一个有效框架,而且以高效的方式(通过简洁的Scala脚本)处理分布数据集。Spark和Scala都处在积极发展阶段。不过,由于关键Internet属性中采用了它们,两者似乎都已从受人关注的开源软件过渡成为基础Web技术。
解决方案九:
楼上的几位说的估计又是百度类似的话。。。其实,spark你可以认为就是替代了你以前用的数据库的赶脚~!以前你存数据在oraclemysql啊,而现在你要存储在spark上,那么存spark上是存哪里呢?就是存在内存上。。将关系型数据库变成了非关系型数据库的赶脚呢~!我也是刚学不久,如上就是一个自我理解的赶脚~!不过,大概应该就是这个样子。
解决方案十:
数据处理框架
解决方案十一:
看官网的介绍吧
解决方案十二:
集hadoopMR&sparksql与hive整合,图计算GraphX,机器学习ML,流式计算sparkstreaming为一身的新的数据计算框架