一篇文章带你读懂智能家居与大数据

为何叫“大数据”?

数据体量大(VOLUMES)

代指大型数据集,一般在10TB规模左右。但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量。未来智能家居领域也有许多这种企业,目前国内智能家居领域的数据量级总和已经达到100TB以上,非结构化数据规模正在以更快的速度增长。

数据类别大(variety)

数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。也就是说,大数据最重要的变化是处理对象由结构化数据拓展到了半结构化和非结构化数据,每年非结构化数据存储总量较结构化数据增长率高出10到50倍。

非结构化数据可以看成所有无法简单转化到结构化关系型数据库中的所有数据,非结构化数据如企业的邮件和其它形式的电子通讯记录;网站上的资料,包括点击量和社交媒体相关的内容;还有设备产生的数据,如RFID、GPS传感器产生的数据、日志文件等。

数据处理速度快(Velocity)

在数据量非常庞大的情况下,也能够做到数据的实时处理。

数据真实性高(Veracity)

随着社交数据、企业内容、交易与应用数据等新数据源的兴起,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。

小贴士

TB是一个计算机存储容量的单位,它等于2的40次方,或者接近一万亿个字节,即一千千兆字节。

PB是数据存储容量的单位,它等于2的50次方个字节,或者在数值上大约等于1000个TB。

数据单位从小到大为:B.KB.MB.GB.TB.PB。1PB=1024TB,依次类推。

  TB、PB依然很难理解,我们举些例子。

美国国会图书馆在2011年4月之前总共收集了235TB的数据。

假设手机播放MP3的编码速度为平均每分钟1MB,而1首歌曲的平均时长为4分钟,那么1PB歌曲可以连续播放2000年。

如果智能手机相机拍摄相片的平均大小为3MB,打印照片的平均大小为8.5英寸,那么总共1PB的照片的并排排列长度就达到48000英里,大约可以环绕地球2周。

人类功能记忆的容量预计在1.25个TB。这意味着,800个人类记忆才相当于1个PB。1PB足够存储整个美国人口的DNA,而且还能再克隆2倍。

如果以每秒1个位的速度数一下1PB所包含的位数,那么一个人需要2.85亿年才能数完,如果每秒数1个字节,那么一个人需要数357万年。

谷歌为用户提供了超过20PB(215亿MB)的地图影像——包括卫星图片、航拍照片和360度街景图片。

即使在2008年,谷歌每天处理的数据已经达到20PB,一年就是7300PB。

社交媒体网站早就开始生成PB级数据,Facebook在2012年前已经存储了100PB数据。

宇宙每天将生成1376 PB数据,相当于每天传输的全球互联网流量的两倍。

大数据的挑战:

总结:

数据本身是资产,所有大数据的属性,包括数量、速度、多样性等反映了数据库不断增长的复杂性。

大数据存储和分析

大数据分为大数据存储和大数据分析,属于两种截然不同的计算机技术领域,大数据存储用于大数据分析。大数据存储重点在于研发可以扩展至PB甚至EB级别的数据存储平台;大数据分析关注在最短时间内处理大量不同类型的数据集。目前无论是大数据存储还是大数据分析,都已经成为帮助企业主业务的关键应用。在智能家居领域,例如家庭数字网络摄像头的云端存储,音视频设备背后的云端流媒体,家庭电量实施云端监测等等,都在大规模使用云存储和分析技术。

智能家居云存储方式

高度智能化的智能家居涉及数据量非常庞大,传统存储技术无法满足,所有云存储技术的逐渐发展与应用也为智能家居的发展迎来了广泛的关注。

下面举例其中一种云存储方式:

新一代的面向智能家居大数据云存储系统主要由逻辑控制模块、用户访问模块、存储模块、文件读/写模块和面向智能家居的大数据云存储模块。

逻辑控制模块:是整个面向智能家居大数据云存储系统的核心,是逻辑处理的枢纽,各业务请求均在该模块中被处理。

用户访问模块是智能家居中的用户和云储存系统交互的纽带,利用该模块可以透明地为用户提供底层实现的各项功能。

存储模块为新一代智能家居云存储系统提供了透明的存取功能。文件读/写模块主要负责将上层逻辑处理和底层存储进行隔离。

逻辑结构:请求处理后传输至存储模块,再由存储模块发送到面向智能家居的大数据云存储模块,在该模块中实现大数据云存储。

每个数据的处理流程:

每一个数据都有一个ETL,就是抽取、转化,然后去加载,包括做数据的清洗。如果数据大批量进来,有些数据可能是有问题的。比如说,好多地址会写得比较模糊,如果要搜索北京这个词的时候,数据仓库里可能只有一个京字,这些都要统一整理成一个,比如说北京,这样后面分析就会简单,比如山东,有人会输入“鲁”字来进行搜索,而不是山东,这就需要在大数据分析前期做好数据清理工作,做规范化,这样后面的数据分析起来就方便很多。

大数据的分布式计算:

通常用于数据分析平台的分布式计算平台内的存储不是我们以往面对的网络附加存储(NAS)和存储区域网络(SAN),而通常是内置的直连存储(NAS)以及组成集群的分布式计算节点,无论是数据部署安全、保护和保存流程都非常复杂。但大数据分析中包含各种快速成长中的技术,简单用分布式技术对其定义也并不准确。

大数据在智能家居领域的贡献

我们每个人都是数据的贡献者,全球平均每人大概携带200GB的数据,而智能家居作为围绕人与设备的新兴领域,大数据对于相辅相成的贡献也是不言而喻的。我们谈论的一定是有价值性的采集,如果我们都不知道哪些数据要采集或者放弃,最终搭建数据分析系统的时候,可能会不知道怎么搭建,也不知道用什么技术,甚至收集到许多无用的信息纯属浪费时间。我们可以把企业的运营、产品、用户使用情况、设备信息都存储,但是提取分析要有清晰条理的规划,最终的数据价值才有意义。

智能家居系统的所产生数据的包含面非常广,既有硬件传感器的数据、也有硬件本身的数据运行状态、也有用户和硬件交互的数据,还有用户通过APP等客户端产生的数据、更有用户自身的使用习惯和生活场景的数据等等,这就导致整体的智能家居所产生数据的积累速度和量都很大。智能家居企业初期围绕业务驱动,下面一些数据是必须要收集的,建议采用分布式大规模的云存储架构,以满足未来企业高速发展和创新需求的必然趋势。



  智能家居大数据的采集内容:

智能家居大数据的采集内容,包括APP的使用情况、故障自诊断信息、服务运营信息、用户画像、设备使用状态、用户使用行为、APP交互行为、用户信息数据、设备功能信息、用户信息、设备功能信息、设备日志、APP日志、子设备参数与运行状态等等其他数据。

智能家居为何需要大数据?

智能家居是多领域融合的切入点,是社会家庭管理的支撑点,是民生服务的新亮点。物联网生产大数据,大数据支持智能家居,从智能家居到数据再到智能化,构成了从感知到认知的全过程。大数据是智能硬件竞争的制高点,可以帮助硬件厂商挖掘用户的设备使用行为,让厂商可以了解自己的用户、优化产品策略和市场策略。还可以对用户进行学习,建立用户画像,针对不同的用户提供个性化智能体验,给不同的用户提供个性化优惠,加大二次销售。也可以做设备活动状态的分析、故障率的分析,这样来指导产品、硬件后面怎么做迭代层、怎么做升级,包括知道用户喜欢用什么功能、用户在什么时间段喜欢用这个功能,知道后面营销策略针对哪些地域作为重点。利用大数据可以挖掘出非常多的价值,这需要在IoT领域不断地去探索。

云计算与大数据

想获得海量数据,设备必须接云,智能家居领域将面对的将是千亿乃至万亿的设备。如果在云安全部署还未成熟的情况下,就将这些设备盲目入云,将会导致不可想象的灾难。所以数据前提是云安全,所以云计算的方式方法至关重要。

云计算和大数据是一个硬币的两面,云计算是大数据的IT基础,而大数据是云计算的一个杀手级应用。云计算是大数据成长的驱动力,而另一方面,越来越多的数据需要云计算去处理,所以云计算与大数据是相辅相成的,在智能家居产业中体现得更加淋漓尽致。

未来通过云计算对大数据进行存储分析和准确提取的同时,需要深度学习和深度挖掘数据,模拟学习用户行为,实现更加“聪明”的智能体验。

编辑点评

很多企业,尤其的是大的国企在做智能家居时,会上很大的决心和项目,对于海量数据收集他们也是很感兴趣。追随潮流搭建大数据平台后,实现的结果是PB级存储能力和秒级处理能力,也许并不接入公有云去收集到大量数据,最终只是先存起来,等需要的时候再用,其实这种思路是没有必要的。随着大数据技术的不断改进,其灵活性、透明性和鲁棒性会不断提升,有效的存储、管理和维护形式也在不断的发生着变化,可行性和实用性才是大数据的本质。如果不能利用数据产生价值,将非常可惜,也将是一个灾难,数据产生越多,存储空间、浪费的资源也就越多。但总体来看,数据运营不论以间接生产力还是直接生产力的方式体现,最终的都会成为下一个时代的新浪潮。

本文转自d1net(转载)

时间: 2024-11-08 22:25:49

一篇文章带你读懂智能家居与大数据的相关文章

一篇文章让你读懂“股权众筹”的生死演进

文|丁辰灵众筹已经成为了一个大众话题,而在最难的股权众筹领域,更是引来了无数大鳄的目光,从最开始的天使汇,大家投,到网信金融发起原始会,到各路新的竞争者如银杏果,我爱创等等,在拥挤的股权众筹行业每家都想分一杯羹.但实际上,股权众筹领域已经曾经沧海难为水,浮现出了不少待解决的行业生死问题.先说五个问题吧问题一:这是一个真实案例,一家企业在某众筹平台上众筹募资,领投人是创始人的太太;结果募了100万人民币.这种情况如何对待呢?从专业投资角度来讲,领投人是自己有直接亲缘关系的人不是一件值得鼓励的事情,

一篇文章带你了解Paxos算法

本文讲的是一篇文章带你了解Paxos算法,[编者的话]本文是Quora上关于Paxos算法的回答,两位答者分别从不同的角度描述Paxos算法.Vineet Gupta的回答细致入微,更偏向理论.Russell Cohen用具体的例子讲解Paxos算法,相辅相成. Vineet Gupta的回答 有很多关于一致性(consensus)问题的解决方案,而这些解决方案中,我认为Paxos相对来说很好理解. 『达成一致性』最简单的例子就是结婚誓词: "你愿意......."(男:)"

智能家居十大必备功能 乐享真正智能生活

一.智能家庭安防系统 智能家居十大必备功能 乐享真正的智能生活 行千里有千里眼,看得见的守护才更放心 居家全能安全卫士,配备高清摄像头,人体红外感应器,门磁报警器,烟雾传感器,煤气传感器,十八班武艺全天候保护您的家,一旦有火灾或煤气泄露时,手机自动弹屏,收到短信,接到电话报警,并启动安全模式切断,拒绝危险的发生,手机实时连接家里的高清摄像头,可随时随地看到您的家,还可以一键呼叫和您的父母孩子实时对讲,远在千里,爱常在身边! 二.智能灯光控制系统 智能家居十大必备功能 乐享真正的智能生活 随心而发

三一:在互联网风口 智能制造、大数据和物联网都不能

随着工业4.0概念的兴起,越来越多的人开始认识到智能制造.大数据和物联网这几个名词.然而,就像十年前我们对云计算的认知一样,对于智能制造这些新名词仍旧云里雾里.有人对大数据很是不屑,并调侃大数据就是大忽悠;也有人认为物联网之流离自己太遥远,不可触碰.三一:在互联网风口 智能制造.大数据和物联网都不能少 其实,三一的挖掘机早就从各个层面开始布局,让智能制造.大数据和物联网渗入客户,就让小编带大家一一了解吧. 一.智能制造的产品和理念 很多人对智能制造的的认知还停留在集成方面,即将工作的自动化和生产

详解智能交通应用大数据“三重门”

文章讲的是详解智能交通应用大数据"三重门",武汉市悬在路口立杆上的金属小盒子--超级电子眼3个月抓了13万起交通违法,逆行.压线.套牌一眼识别,并能自动报警. 只需10秒,重庆市凭借280万多张"电子牌"的信息传递,各地的道路拥堵信息即可传递到设置在附近的交通诱导屏上. 400多个公交站点,1000多辆公交车, 80多条公交线路,全部被江苏省镇江市交通系统中央指挥中心的工作人员透过实时全景视图,实时监控.出行者随时可获得公交时刻信息和延误预报-- 全国智能交通(IT

富士康在贵州实践智能制造与大数据的结合

"给我们几个月的时间,我们将在贵州贵安新区建设第六座关灯工厂."富士康科技集团总裁郭台铭近日在参加中国国际大数据产业博览会"工业大数据与智能制造"高峰对话时如是说. 所谓"关灯工厂",就是厂房一片漆黑,机器却还在运行.它把工人从单调的流水线上解放出来,取得代之的是机器人处理. 作为全球最大电子产业专业制造商,富士康与贵州的结缘始于一场生态文明论坛.2013年7月,当郭台铭第一次前来参会,他就喜欢上了这儿青山绿水的环境:"一件衬衫,穿了两

智能互联时代 大数据成企业核心资产

文章讲的是智能互联时代 大数据成企业核心资产,在4月8日的中国基金业金牛奖颁奖典礼现场,国务院发展研究中心企业研究所所长马骏发表了<智能互联时代的企业变革>.在演讲中提到了企业当下需要关注的4个趋势:1.产品从硬件转为软硬并重;2.企业与用户的交易转变为长期服务;3.大数据成企业核心资产;4.企业间竞争演变为产业生态圈竞争. 国务院发展研究中心企业研究所所长马骏(图片来源于网络) 以下内容整理自网络公开的演讲实录: 上世纪90年代,做投资的思路是重点寻找"中国的GE.索尼"

【参会邀请】2017智能交通与大数据峰会将在吉林举办

由国家"千人计划"指定杂志<千人>联合吉林高新技术产业开发区.千人智库共同发起的"2017中国·吉林松花湖论坛--智能交通与大数据峰会"将于2017年8月17-19日在吉林举行. 据悉,本届大会以"智能交通和大数据"为主题,将齐聚大数据.云计算.人工智能等相关领域的专家,行业巨头以及创新.务实的企业代表,围绕智能交通和大数据发展中的共议和热点话题展开深入探讨和交流分享,引导行业方向,创造商机. 大会的讨论内容将覆盖议智能交通系统.车联

《大数据管理概论》一第1章概  述1.1 大数据的基本概念

本节书摘来自华章出版社<大数据管理概论>一书中的第1章,第1.1节,作者 孟小峰,更多章节内容可以访问"华章计算机"公众号查看 |第1章 概 述 1.1 大数据的基本概念 已故的图灵奖得主Jim Gray在其<事务处理>一书中提到:6000年以前,苏美尔人(Sumerians)就使用了数据记录的方法,已知最早的数据是写在土块上,上面记录着皇家税收.土地.谷物.牲畜.奴隶和黄金等情况.随着社会的进步和生产力的提高,类似土块的处理系统演变了数千年,经历了殷墟甲骨文.