本讲义出自Arsalan Tavakoli在Spark Summit East 2017上的演讲,主要对于虚拟化分析的技术路线的发展进行了探讨。
对于企业而言,往往希望数据积累的越多,获取的智能也就越多。但是怎样才能做到这一点呢?其实需要依靠三大支撑:数据、分析以及人。面对参差不齐并且传播速度非常快的大量数据,多种多样,越来越复杂的分析手段以及需要涉及更多的人、更多的职责以及人与人之间工作交接的低效的挑战,今天的技术栈足以应对了么?
从最初的数据仓库、到第二代的Hadoop+Data Lake,再到如今,经过了三代技术栈的更新,目前Databricks + Apache Spark成为了最好的解决方案,然而技术还需要不断进步与发展。
时间: 2024-09-11 00:32:34