报表几种常用数据方案

背景

最近做了比较多的报表需求,在这里小结一下,希望对后续工作有帮助。报表是数据分析的形象化展示,目前有比较多好用的产品,比如QuickBI,Tableau等,让报表页面的工作能够方便的所见即所得;我们也可以做最核心的事情:数据处理和加工。从数据流向的技术方案来看,主要有这几种:

1. 直接从业务库数据取数据

优点:
- 不用数据导来导去,节约时间

缺点:
- 可能对业务库性能有影响;
- 无法做复杂的数据加工,不同数据库源之间的连接运算等
- 某些历史查看需求无法实现

2. 业务数据导入到MaxCompute(原名odps),经过加工后,再导入到mysql等实时库

优点:
- 可进行复杂数据加工;
缺点:
- 数据导来导去,各个地方建表非常耗时。
- 如果每天的分区都导入而不删除,长期需考虑mysql的性能问题

3. 业务数据导入到MaxCompute,经过加工后,直接报表展示(利用QuickBI等工具的加速缓存功能)

优点:
- 可进行复杂数据加工
- 节省了从MaxCompute导入到mysql等实时库的时间和存储成本
缺点:
- 如果数据量大于20万,不支持加速(每个工具可能有不一样,但是肯定都有上限)
- 分页无法显示所有页数

4. 业务库备份库,直接业务库同步到mysql等实时库

优点
- 节约时间成本;
缺点:
- 无法复杂数据加工,增加存储成本

目前主要这几种技术方案,在实际使用中,我们可以结合各个业务项特点,灵活使用,不一定要局限于某一种,2应该是最常用的数据链路,但比较耗时,个人比较倾向于3 ,利用MaxCompute强大的数据加工能力,而且节省一步导数的操作。

时间: 2024-12-06 10:04:54

报表几种常用数据方案的相关文章

7种大数据方案重塑医疗行业

怀疑主义是一把双刃剑.如果没有怀疑主义的话,IT经理可能会去投资那些没有用处的软件.足够的怀疑,可以让IT部门等待足够的证据,以证明特定的平台可以带来好结果. 医疗行业的数据分析到达临界点 大数据分析现在已经到达了医疗行业的临界点.一些供应商承诺在减少开支的同时,会提供更好的医疗质量,但有证据表明这些说法是有争议性的.同样,一些大数据运动的批评者指出,医疗行业在开展大的项目之前,可以从小数据集榨取情报. 举例来说,在最近的一篇博客文章中,顾问兼医学博士David C. Kibbe和Vince K

Content-Type的几种常用数据编码格式

Content-Type,内容类型,一般是指网页中存在的Content-Type,ContentType属性指定请求和响应的HTTP内容类型.如果未指定 ContentType,默认为text/html. 1.text/html 文本方式的网页文件. 2.text/plain 窗体数据以纯文本形式进行编码,其中不含任何控件或格式字符.空格转换为 "+" 加号,但不对特殊字符编码. 3.application/x-www-form-urlencoded 默认地,表单数据会编码为 &quo

数据中心两种常用流量模型运用mininet的实现

数据中心两种常用流量模型运用mininet的实现 编者按:在网络性能评估中一个巨大的挑战就是如何生成真实的网络流量,还好可以通过程序来创造人工的网络流量,通过建立测试环境来模拟真实的状况.本文就以数据中心网络为目标场景,来在mininet仿真环境中尽可能地还原数据中心内部的真实流量情况.目前有两种常用的流量模型: 随机模型:主机向在网络中的另一任意主机以等概率发送数据包 概率模型:在网络中,编号为m的主机分别以概率Pt .Pa .Pc .向主机编号为(m+i).(m+j).(m+k)的主机发送数

js跨域请求数据的3种常用的方法_javascript技巧

由于js同源策略的影响,当在某一域名下请求其他域名,或者同一域名,不同端口下的url时,就会变成不被允许的跨域请求. 那这个时候通常怎么解决呢,对此菜鸟光头我稍作了整理:1.JavaScript    在原生js(没有jQuery和ajax支持)的情况下,通常客户端代码是这样的(我假设是在localhost:8080的端口下的http://localhost:8080/webs/i.mediapower.mobi/wutao/index.html页面的body标签下面加入以下代码): <scri

一种混合加密方案在软件授权中的应用

拥有知识产权的软件一般采取软件保护手段,需要使用某种方式激活软件才可以使用.软件激活本质是对密文数据进行比较,而密文数据是由软件开发商根据目标机器的特征数据进行加密产生的.激活过程是在认证服务器或者目标机器上完成,在这个过程中,数据加密方案至关重要,设计良好的加密方案,难以被破解.复制或盗用,软件保护工作做的很完善.本文分析现有软件保护方式,借鉴基础软件加密算法基础上,设计出一种高强度.难破解的混合加密方案,并在软件工程实践中验证该混合加密方案的可行性. 1 软件保护 为了保护软件开发商的权益,

常用RAID方案比较

磁盘阵列(Redundant Arrays of Inexpensive Disks,RAID),即"由廉价磁盘组成的冗余阵列". 以下是对常用的RAID方案作个总结和比较. RAID模式 RAID 0 RAID 1 RAID 10&01 RAID 3 RAID 5 名称 条带阵列 镜像阵列 条带式镜像阵列镜像式带条阵列 校验条带阵列 分散校验条带阵列 说明 连续的数据分成几份,然后分散存储到阵列中的各个硬盘上 把相同的数据写入多块磁盘 RAID 0和RAID 1结合的方式.

四种常用HTML5移动应用框架的比较

中介交易 SEO诊断 淘宝客 云主机 技术大厅 [编者按]本文译者范小虎,对于Mobile Web来说,现在是快速成长时代.由于采用了HTML5和CSS3技术,移动浏览器的性能加强了许多,同时,移动app的框架也扩展了,这意味着为移动设备创建丰富的互动的web体验的可行性又提升了. 本文通过对四种常用的框架进行比较,看看新技术带来了哪些改变. 采用诸如PhoneGap这样的封装软件,您就可以使用native app Store以及单个代码库,就可以分布式部署iPhone,iPad和Android

从用户Windows系统到阿里云NAS SMB服务:常用数据迁移备份工具

本文介绍如何由本地(on-premises) 或阿里云的虚拟机Windows系统向阿里云NAS SMB服务上传和备份数据. 阿里云文件系统SMB协议服务介绍 阿里云文件存储服务NAS(阿里云NAS)是阿里云在2016年正式推出的公有云上的网络文件系统实现.阿里云NAS主要面向阿里云 ECS 实例.HPC.Docker.弹性Web和BatchCompute 等计算节点提供文件存储服务.通过标准的文件访问协议,用户无需对现有应用做任何修改,即可在云上使用具备无限容量及性能扩展.单一命名空间.多共享.

C#的6种常用集合类

一.先来说说数组的不足(也可以说集合与数组的区别) 1.数组是固定大小的,不能伸缩.虽然System.Array.Resize这个泛型方法可以重置数组大小,但是该方法是重新创建新设置大小的数组,用的是旧数组的元素初始化.随后以前的数组就废弃!而集合却是可变长的. 2.数组要声明元素的类型,集合类的元素类型却是object. 3.数组可读可写不能声明只读数组.集合类可以提供ReadOnly方法以只读方式使用集合. 4.数组要有整数下标才能访问特定的元素,然而很多时候这样的下标并不是很有用.集合也是