对于寻找方法快速吸收数据到Hadoop数据池的企业, Kafka是一个伟大的选择.Kafka是什么? 它是一个分布式,可扩展的可靠消息系统,把采取发布-订阅模型的应用程序/数据流融为一体. 这是Hadoop的技术堆栈中的关键部分,支持实时数据分析或物联网数据货币化. 本文目标读者是技术人员. 继续读,我会图解Kafka如何从关系数据库管理系统(RDBMS)里流输数据到Hive, 这可以提供一个实时分析使用案例. 为了参考方便,本文使用的组件版本是Hive 1.2.1,Flume 1.6和Kafk