Apache Kylin权威指南1.7　小结

1.7　小结

本章介绍了Apache Kylin的历史背景和技术特点。尤其是它基于预计算的大数据查询原理，理论上可以在任意大的数据规模上达到O(1)常数级别的查询速度，这一点也是Apache Kylin与传统查询技术的关键区别，如图1-6所示。传统技术，如大规模并行计算和列式存储的查询速度都在O(N)级别，与数据规模增线性关系。如果数据规模增长10倍，那么O(N)的查询速度就会下降到十分之一，无法满足日益增长的数据需求。依靠Apache Kylin，我们不用再担心查询速度会随着数据量的增长而减慢，面对未来的数据挑战时也能更有信心。

时间： 2024-09-16 00:48:26

Apache Kylin权威指南1.7　小结的相关文章

Apache Kylin权威指南导读

前言 "麒麟出没,必有祥瑞." --中国古谚语 "于我而言,与Apache Kylin团队一起合作使Kylin通过孵化成为顶级项目是非常激动人心的,诚然,Kylin在技术方面非常振奋人心,但同样令人兴奋的是Kylin代表了亚洲国家,特别是中国,在开源社区中越来越高的参与度." --Ted Dunning Apache孵化项目副总裁,MapR首席应用架构师今天,随着移动互联网.物联网.AI等技术的快速兴起,数据成为了所有这些技术背后最重要,也是最有价值的"

Apache Kylin权威指南2.7　小结

2.7 小结本章介绍了使用Apache Kylin必备的基本概念,如星形数据模型.事实表.维表.维度.度量等,并在这些基础上快速创建了基于Sample Data的模型,构建Cube,最后执行SQL查询.带领读者体验了Apache Kylin的主要使用过程.后续的章节将继续展开和探讨这个过程中的一些关键技术,比如增量构建.可视化和Cube优化等.

Apache Kylin权威指南3.5　小结

3.5 小结增量构建是使用Apache Kylin的关键步骤.因为对于大多数使用场景,数据都是日积月累逐渐增长的.如何合理地安排增量构建,保证用户在Cube中可以及时查询到最新的数据,是Apache Kylin运行维护的日常.第4章将延续本章的内容,继续探讨流式构建,将Apache Kylin的数据延迟缩短到分钟级别.

Apache Kylin权威指南1.5　Apache Kylin的主要特点

1.5 Apache Kylin的主要特点 Apache Kylin的主要特点包括支持SQL接口.支持超大数据集.秒级响应.可伸缩性.高吞吐率.BI工具集成等. 1.5.1 标准SQL接口 Apache Kylin以标准SQL作为对外服务的主要接口.因为SQL是绝大多数分析人员最熟悉的工具,同时也是大多数应用程序使用的编程接口.尽管Kylin内部以Cube技术为核心,对外却没有选用MDX(MultiDimensional eXpressions)作为接口.虽然MDX作为OLAP查询语言,从学术上

Apache Kylin权威指南1.4　Apache Kylin的技术架构

1.4 Apache Kylin的技术架构 Apache Kylin系统可以分为在线查询和离线构建两部分,技术架构如图1-4所示,在线查询的模块主要处于上半区,而离线构建则处于下半区. 图1-4 Kylin的技术架构我们首先来看看离线构建的部分.从图1-4可以看出,数据源在左侧,目前主要是Hadoop Hive,保存着待分析的用户数据.根据元数据的定义,下方构建引擎从数据源抽取数据,并构建Cube.数据以关系表的形式输入,且必须符合星形模型(Star Schema)(更复杂的雪花模型在成文

Apache Kylin权威指南2.2　在Hive中准备数据

2.2 在Hive中准备数据 2.1节介绍了Kylin中的常见概念.本节将介绍准备Hive数据的一些注意事项.需要被分析的数据必须先保存为Hive表的形式,然后Kylin才能从Hive中导入数据,创建Cube. Apache Hive是一个基于Hadoop的数据仓库工具,最初由Facebook开发并贡献到Apache软件基金会.Hive可以将结构化的数据文件映射为数据库表,并可以将SQL语句转换为MapReduce或Tez任务进行运行,从而让用户以类SQL(HiveQL,也称HQL)的方式管理和

Apache Kylin权威指南2.6　SQL参考

2.6 SQL参考 Apache Kylin支持标准SQL作为查询语言,但是SQL有很多变体,Kylin支持的只是SQL所有变体中的一个子集,并不是支持所有现存的SQL语句和语法.用户在使用Kylin之前,需要对Kylin所支持的SQL有一个了解,以避免走弯路. 首先,Kylin作为OLAP引擎,只支持查询,而不支持其他操作,如插入.更新等,即所有的SQL都必须是SELECT语句,否则Kylin会报错. 第二,查询Kylin中SQL语句的表名.列名.度量.连接关系时,需要至少跟一个Cube的模型

Apache Kylin权威指南1.6　与其他开源产品比较

1.6 与其他开源产品比较与Apache Kylin一样致力于解决大数据查询问题的其他开源产品也有不少,比如Apache Drill.Apache Impala.Druid.Hive.Presto(Facebook).SparkSQL等.本节试图将Kylin与它们做一个简单的比较. 从底层技术的角度来看,这些开源产品有很大的共性,一些底层技术几乎被所有的产品一致采用,Kylin也不例外. 大规模并行处理:可以通过增加机器的方式来扩容处理速度,在相同的时间里处理更多的数据. 列式存储:通过按列存

Apache Kylin权威指南1.2　Apache Kylin的使命

1.2 Apache Kylin的使命 Kylin的使命是超高速的大数据OLAP(Online Analytical Processing),也就是要让大数据分析像使用数据库一样简单迅速,用户的查询请求可以在秒内返回,交互式数据分析将以前所未有的速度释放大数据里潜藏的知识和信息,让我们在面对未来的挑战时占得先机. 1.2.1 为什么要使用Apache Kylin 自从10年前Hadoop诞生以来,大数据的存储和批处理问题均得到了妥善解决,而如何高速地分析数据也就成为了下一个挑战.于是各式各样的"

猜你喜欢

androidstudio1.3安装-如何安装Android studio 1.3的版本

问题描述如何安装Android studio 1.3的版本 5C 预备了这些文件,请求大神帮助解决方案 Android Studio 1.0版本的安装问题Android Studio(1.3版本) ...

ASP实现IP地址分段计算

ip地址|ip地址 <script language="JScript" Runat="Server"> function IPDeCode(E ...

ASP.NET技巧：错误处理封装

asp.net|错误|错误处理|封装|技巧 /*---------------------------------------------------------------- * Copyright ...

基于SHA-256的HMAC文件校验器

HMAC即带密钥的HASH函数,用它产生的报文鉴别码(MAC)可以实现报文鉴别 .这里我将其做成一个软件,用于对文件的合法性进行校验.以下我先简单介绍软件相关背景知识再介绍其代码实现. 一.背景知识 ...

Windows 7中的10个绝对不能关闭的服务

相信大家对Windows7这个名字已经是十分的熟悉,它出色的地方除了继承并超越vista的美观界面,人性化任务栏,并且有XP兼容性八成功力,真是当今世上一个不错的操作系统. Vista的失败除了它&q ...

验证码识别原理浅谈--图像二值化

二值化实现方法有 1.1图像灰度化-中值滤波等,同时可以实现背景的去除 1.2图像灰度化-根据灰度值 1.3根据图像色系范围进行二值化处理图像二值化的意思就是将图像的有效点给分离出来,然后将图片用0 ...

J2EE 1.4平台和Web服务

本文是J2EE Web服务开发系列文章的第七篇,在本系列文章的前面各主题中,着重介绍了在J2EE1.3平台下使用各种技术或者工具进行Web服务开发.从本文开始,将介绍J2EE1.4平台下的Web服务开 ...

PS调出年代感和历史感的复古风格照片

复古风格照片的运用范围非常广,静物,风景,人物,建筑等都可以用这种方式来表现年代感和历史感.今天为大家推荐一个PS调出年代感和历史感的复古风格照片,挺实用的教程,感兴趣的朋友可以过来学习一下,我们 ...

Win7系统vsd文件怎么打开

1.碰到vsd格式的文件要怎么打开呢?下面教大家使用visio软件打开. 2.如果用word等其它软件打开,发现会乱码,无法浏览. 3.下载好visio安装包,这里以visio2010为例,打开并 ...

减小Windows 7系统体积的技巧

我们在使用Windows 7的时候会发现他的系统大小介于XP和Vista之间,但是对于一些人来说还是希望Windows 7做到系统的最小化.下面的三个思路会让你如愿以偿. 第一.正确设置虚拟内存 ...

计算机电池有哪些常见的故障

1.系统中电量总显示为0% 故障问题电池可以正常充电,但系统中电量总显示为0%. 故障排除这个问题通常会在两种情况下出现,即更换电芯后电池板不能正确识别,再有就是电池内部电池板的计量电路出了问 ...

cpu占用100%从硬件方面分析会是什么原因

遇到过CPU占用率100%的情况,导致系统慢.打开任务管理器,发现CPU占用率100%,而且过多占用CPU的进程并不固定,像击鼓传花般在各进程间来回传递. 故障解决步骤如下: 经过查杀,系统并未中 ...

电脑双显卡怎么切换到独立显卡？

如今大多数电脑都有这样一个特征:CPU集成核心显卡.外加电脑中还配备独立显卡,这样的电脑就拥有双显卡,正常情况下,双显卡会自动切换智能运行.不过,由于CPU集成的显卡性能有限,无法媲美独立显卡,此 ...

弹出窗口-wpf 动态改变窗口大小动画

问题描述 wpf 动态改变窗口大小动画想做一个在指定屏幕位置弹出窗口到最大化的动画效果,弹出是要不断的改变窗口的位置和窗口的高宽.用wpf的动画效果动态改变窗体的宽度和高度,这样实现时发现显示弹出效 ...

php 正则表达式的子模式详解

首先,我们先看一段PHP代码: 复制代码代码如下: <?php $time = date ("Y-m-d H:i:s"); $pattern = "/\d{4}- ...

天融信谈大数据对网络安全的挑战

2013年4月25日,在第十一届中国CSO俱乐部大会暨2013中国信息安全年会上,天融信副总裁宫一鸣作了主题为<大数据对网络安全的挑战>的精彩演讲,他从安全角度介绍了大数据的发展历程.现状 ...

网络间谍的威胁

现在被Fireeye命名为APT32(OceanLotus海莲花组织)的网络间谍行动,正在对横跨多个行业的私人企业和外国政府,异议人士和记者进行入侵.Fireeye评估APT32利用独特且功能全面的恶 ...

破重▪领先——H3C 2013渠道峰会盛大开幕

不破本参不住山,不破重关不闭关.H3C公司(杭州华三通信技术有限公司)在天津召开了主题为"破重•领先"的"2013年渠道峰会".H3C在2013年将通过&quo ...

postgresql 字符串排序问题

问题描述 postgresql 字符串排序问题 5C postgresql 字符串排序时,如果字符串为空就不进行排序比如一个字段 mobile 升序排列,排序后的数据,前几行是空字符串,后几行也是 ...

[Python,print]如何获取python print语句打印到console的值？

问题描述大家好,我的问题是这样的:我在调用一个函数solve()的过程中,这个函数会不停的向console打印值,但是这个函数不是我写的,我只能从外部看到这些打印出来的语句而无法获得他的值.现在的问 ...

朝韩网战疑云，国家型黑客再掀波澜

4月6日讯思科Talos安全威胁智能小组的研究人员认为,韩国用户再次遭到新型恶意RAT(远程管理工具)攻击,他们将该RAT称为"ROKRAT". 早在今年2月,思科Talos安全 ...

薪水最高的美国实习生科技公司

最近一段时间,国外科技网站BusinessInsider对实习生薪水最高的20家美国科技公司进行了盘点,其中VMWare.Facebook.微软分列前三甲,接下来让我们一起来看看这些令人艳羡的公司. ...

链表队列出错请大家帮忙看看好吗

问题描述链表队列出错请大家帮忙看看好吗 #include using namespace std; typedef char DataType; typedef struct QueueNode{ ...

linux-为什么我的redhat用无线网卡连不上网络？

问题描述为什么我的redhat用无线网卡连不上网络? 1. 使用命令wpa_supplicant -i eth1 -c /etc/wpa_supplicant/wpa_supplicant.conf ...

用Eclipse替代Keil&IAR来开发ARM应用（升级版）

Eclipse GNU ARM Plugin 2014/7/16 作者 kiya 几个月前写了一篇<用Eclipse替代Keil&IAR来开发ARM应用>,介绍了GNU ARM这个 ...

java-Java异常的抛出问题。

问题描述 Java异常的抛出问题. 做一个计算器.ArithmeticException属于运行时异常.5.最佳解决方案对于运行时异常,我们不要用try...catch来捕获处理,而是在程序开发调试阶 ...

linux相关类库的问题，请释疑解惑

问题描述 linux相关类库的问题,请释疑解惑 windows下api封装成类的库有MFC,想问下有没有相应的类库是封装了linux的api函数? 解决方案 linux一般用系统API就好了.或者用b ...

Intellij IDEA下flex国际化配置

原文 http://www.cnblogs.com/yangpigao/archive/2013/04/25/3043627.html 今天项目里要做国际化,在网上找了一下flex的国际化,不管外 ...

吴恩达成立1.5亿美元基金，专注AI投资

上周,吴恩达宣布了一系列深度学习的课程,这也是他deeplearning.ai项目的一个开始.雷锋网消息,在美国时间15日晚,外媒TC报道称他又有新动作了,即成立一个1.5亿美元规模的风险投资基金AI ...

apache+php+mysql安装配置方法小结_php技巧

整个安装流程如下: 1,首先安装apache:我安装的版本是: httpd-2.2.16-win32-x86-openssl-0.9.8o.msi 网址:http://www.apache.org/d ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.032 s.