《智能数据时代:企业大数据战略与实战》一1.3 大数据处理的关键——数据类型

1.3 大数据处理的关键——数据类型

体量大只是大数据概念的一部分。人们越来越认识到半结构化数据和非结构化数据也是大数据的重要部分,它们往往含有十分关键的商用信息,因而更加能够满足BI和商业操作的需要。而且我们应该认识到,非结构化的商业数据正在快速增长,并且在可预见的将来还会继续增长。
数据可以分为以下三类:结构化数据、半结构化数据和非结构化数据。结构化数据通常适用于传统的SQL语言数据库等,其中数据按照事先定义好的业务规则被写入表中。结构化数据通常被认为是最易处理的数据类型,因为它可以被定义和检索,更易于访问和过滤。
相比之下,非结构化数据通常没有相应的BI系统与之匹配。它不能被有效地写入表中,也无法被本地应用程序或数据库使用。非结构化数据的典型代表就是二进制图像文件的集合。
半结构化数据正好处于结构化数据和非结构化数据之间。半结构化数据不能按照数据库中的表和结构化关系进行管理。然而,它也不同于非结构化数据,半结构化数据拥有标签或其他标记方式,并以此划分数据属性,而且它还提供一套关于数据记录和域的层级结构,以此来定义数据。

时间: 2024-09-19 23:55:40

《智能数据时代:企业大数据战略与实战》一1.3 大数据处理的关键——数据类型的相关文章

大数据时代企业投融资创新发展

大数据时代企业投融资创新发展的问题,涉及许多前沿科学技术问题. 上世纪90年代初,我在中央党校读博期间,研究决策科学,和它包含的认识论.如何依据有效信息,科学作出决策.当时主要接受了美国西蒙教授的理论,他是一位诺贝尔经济学奖得主,提出了"有限理性"理论,认为人的理性是有限的,只能从有限的信息量中,寻找相对好的决策.比如,要买一枝鲜花,并不需要跑遍所有的花店;要找一个合适的爱人,并不需要与全世界的女人谈一遍恋爱.差不多就行了. 我同意这种观点,但说差不多就行了,未免有点过于悲观和消极,而

赛迪顾问:大数据时代企业须打好信息资源整合攻坚战

ZDNET至顶网CIO与应用频道 06月23日 北京消息:数据被认为是新时期的基础生活资料与市场要素,重要程度不亚于物质资产和人力资本.近年来,企业产生的数据量呈指数级增长,信息资源爆炸式激增,其中非结构化的数据信息达到85%左右,传统的信息资源管理技术已经无法应对大数据时代的挑战.Hadoop等大数据技术和其他大数据工具和设备的出现以及云计算数据处理与应用模式的广泛运用,为企业处理日益增长的海量非结构化数据提供了高效.可扩展的低成本解决方案,弥补了传统关系型数据库或数据仓库处理非结构化数据方面

大数据时代 企业须打好信息资源攻坚战

文章讲的是大数据时代 企业须打好信息资源攻坚战,数据被认为是新时期的基础生活资料与市场要素,重要程度不亚于物质资产和人力资本.近年来,企业产生的数据量呈指数级增长,信息资源爆炸式激增,其中非结构化的数据信息达到85%左右,传统的信息资源管理技术已经无法应对大数据时代的挑战.大数据技术和其他大数据工具与设备的出现,以及云计算数据处理与应用模式的广泛运用,为企业处理日益增长的海量非结构化数据提供了高效.可扩展的低成本解决方案,弥补了传统关系型数据库或数据仓库处理非结构化数据方面的不足,深化和拓展了企

IT现状调查:大数据时代 企业面临挑战

[IT168 调查报告]2012-2013中国IT技术趋势大调查活动于2012年10月16日启动,历经1个月的时间.在线调查期间,受到了来自ITPUB.ChinaUnix(以下简称CU)以及其它合作网站的网友的极大关注和积极参与.目前调查已经完满结束,所有的数据都在后台整理和统计之中.本次网上调查共回收调查问卷17,101份问卷,其中合格问卷为14,522份.从整体上看,今年的调查更专注,无论从数量上还是质量上都较去年有比较大的提高. 本次调查的内容涉及:企业信息化.http://www.ali

大数据时代企业所需的三大技术

作为IT领域的关键词,"大数据"不断被大书特书,对其分析利用也备受关注.另一方面,靠IT技术.现有的组织和人才技能解决不了的难题也渐渐浮出水面.这就需要"分析数据及其与业务相结合的技术". 本文总结了将数据分析应用到业务中所需的技术,以及怎样在企业中实现有效的信息应用.同时,还列举了日本国内外的先进事例. 三大技术 下面,我们来看一下大数据时代企业所需的技术有哪些? 业务技能 这里的业务技能不是指提高业绩的能力,而是指将业务过程标准化.掌握各个过程中哪些信息需要输入

大数据时代企业安全面临巨大威胁 360腾讯加紧布局

2014中国互联网大会于日前在北京国际会议中心召开,在8月27日上午的中国网络安全分论坛上,对大数据时代的企业安全的探讨成为论坛上一个重要的话题,360和腾讯等安全领域龙头均在演讲或讨论中透露出下一步在大数据时代企业安全上的布局. 近一两年,大数据这个词在互联网上火了起来,但究竟什么是大数据,对于普通用户来说还是有些难懂.其实每位用户在电脑.手机屏幕上看到的任何一个简单易用的交互窗口,背后都是有大数据引擎给予支撑. 腾讯副总裁丁珂在其题为<大数据时代的企业安全新格局>的演讲中提到,大数据引擎成

大数据时代,小数据中心

文章讲的是大数据时代,小数据中心,中国(上海)国际数据中心技术设备展览会在上海隆重开幕.紧跟德国工业4.0的新趋势,威图(Rittal)携绿色.节能.可靠的数据中心系统解决方案登陆本次展会.在变革的大数据时代,威图(Rittal)将引领数据中心行业健康稳步发展. 展会现场,威图针对模拟的微模块.通道封闭系统,进行了实时监测,参观者可以通过液晶屏,直接了解数据中心内部各项指标信息.威图(Rittal)的微模块,它可根据客户需求在工厂进行预制,并可灵活拆卸,快速组装.威图(Rittal)的LCP机柜

大数据时代下的“数据失控”危机

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 麻省理工学院的阿莱克斯·彭特兰教授说"赤裸裸地站在数字聚光灯下接受审查不是人们应该得到的待遇",这句话听起来既包含着对改善人类当前数字化生活尴尬处境的坚决,又透露出对人们失去个人数据控制力的无奈.频繁发生的数据泄漏事件已经宣告了"数据失控"时代的到来. 在过去差不多十几年的时间里,我们毫无保留地把个人信息交给了互联网,这些信息

大数据时代企业CDO的新玩儿法

我们正在历经一场由大数据应用的普及引发的变革,即使如蓝色巨人IBM这样的传统巨头也在通过及时转型来应对这场技术浪潮的席卷.IBM认为,大数据与工业时代的蒸汽.电力.石油一样,都是重要的未来资源,企业需要专业人才掌握并利用这种资源,来推动这个时代的进步和发展,就好像当时有人利用石油和电力推动工业时代进步一样. 这时,企业CDO(首席数据官)责无旁贷地将挑起这个重任.CDO所关注的已经不止于企业数据库.数据工具和数据分析工具的选型,而是如何利用这些工具对企业内部.外部行业数据进行分析,并根据分析结果