《拥抱机器人时代——Servo杂志中文精华合集》——4.8 理解大数据

4.8 理解大数据

当物联网从各种各样的设备中收集到的数据被创造性地使用时,就会变得更加有价值。这就是所谓的大数据的技术问题。这是一个描述大量数据的简单术语——数据集合如此之大,以至于无法用传统的关系型数据库技术来处理了。为了体现物联网真正的价值,需要开发处理海量数据的应用以建立连接和相关性,从而达到智能决策的效果。总的来说就是要把从各处收集的传感器数据连接起来,得到一个非常独到的结论。

处理物联网所收集的大数据实际上会面临3个挑战。首先是数据的获取,其次是数据的存储,最后是数据的分析。

4.8.1 数据获取

数据获取(Data Harvesting,也称作Data Ingestion)是一个多步骤的过程,包括从各个设备收集数据,然后将数据传送到某个中心数据库。这主要是关于设备和网络的问题,当然,也包括数据库。前面我们基本上已经讲解了相关的内容。

4.8.2 数据存储

数据存储看起来很简单,但这种说法非常有欺骗性。你所需要的就是很多的服务器,也许是云服务器,以提供足够的能力来存储所有收集到的数据。这听起来很简单,特别是看到存储的成本不断下降的时候。

问题当然不会那么简单,即使这是一个老问题。很多公司就是被存储层面的问题挡住了而一直没能实现更重要的分析功能。

这可真糟糕!因为实际上有很多公司可以提供解决数据库存储需要的方法,而且有好几种这样的方法可用。

一个流行的方法就是找一家提供“数据库即服务(Database as a Service,DBaaS)”能力的公司,通常都是基于云的数据仓库。已经有很多选择,包括Amazon Redshift、来自Hortonworks的Enterprise Hadoop以及Cloudera Enterprise。这些数据库管理和自动化服务缓解了公司安装、管理和运行他们自己的大型数据库的需要——从而把珍贵的资源释放出来进行更重要的数据分析。

管理服务提供商(Managed Service Provider,MSP)与DBaaS提供商很相似,但是它们提供了更加有用的服务,比如All Covered和Treasure Data。这些公司不仅能够进行外包数据的收集和存储工作,还可以享受基本分析功能,通常是从主数据中抽取特定的信息。利用MSP来完成最费时耗力的工作,一个公司就可以把它的注意力聚焦在数据分析的细节上——并根据那些分析进一步采取措施。

4.8.3 数据分析

这是第三个挑战,也是最具挑战性的。假设一个公司可以外包数据的获取和存储,那么现在的问题就是如何从收集到的海量数据中抽取价值。换句话说,当收集到了海量数据之后,一个公司要怎么做呢?

为了处理这个数量级的数据,必须开发用来分析所收集的数据的趋势、模式和压点(pressure point)的应用。这是一个巨大的计算挑战,特别是当你希望实时呈现结果的时候。

当处理这个数量级的数据的时候,数据经常是以一种非结构化的形式收集(和存储)的,主要问题之一就是你要确保没有一不小心忽略重要的东西而在根本无关紧要的数据上花费了太多的时间。对于特定的应用,很有必要把麦粒和糠皮分离开。

注意

因为将来所有的物联网数据都需要分析,人力资源团队预测对数据分析专家的需求会很快上升。这应该是一个可以进入的好职业。
但是仅仅分析数据是不够的。对于一个真正从海量的潜在实时数据流中受益的公司,必须建立一种数据驱动决策的文化。这就是说,公司需要按照数据所指引的方向行进——而不是按照老式的管理层所认为的方向行进。这是个勇敢的新世界,是由物联网所收集的新数据所驱动的。有些公司将茁壮成长,而另一些则相反。

时间: 2024-12-10 11:15:17

《拥抱机器人时代——Servo杂志中文精华合集》——4.8 理解大数据的相关文章

《拥抱机器人时代——Servo杂志中文精华合集》——第4章 智能技术:物联网怎样工作

第4章 智能技术:物联网怎样工作 拥抱机器人时代--Servo杂志中文精华合集 物联网,正如其发展趋势那样,是一场技术造就的魔术.它利用各种现存的或将要出现的技术和协议,再加上新奇有趣的方式,最终把我们每天的生活和互动都实现了各种各样的自动化.它把各种相对简单的技术组合起来,却成就了比把这些零件简单叠加起来更伟大的东西. 那么,物联网究竟是怎样工作的呢?让我们瞧瞧吧.

《拥抱机器人时代——Servo杂志中文精华合集》——3.5 物联网何时降临

3.5 物联网何时降临 所有把物联网称作"互联网的明天"的说法,都在某种程度上歪曲了一个事实,即物联网就在今日的当下.虽然我们毫无疑问还没有处于物联网的高级阶段,但我们的确已经有了一个物联网的初级阶段,包括传感器.设备.云架构以及数据挖掘和分析工具.这些组成部分中的许多已经准备就绪,正等待最终的联网. 今天,超过10亿的现存设备包含内置的传感器,具有捕获各类数据的能力.我们所需要的就是为了智能的目的,把这些设备连接到互联网或者互相连接. 回到前面的智能汽车的例子.虽然今天的汽车的确没有

《拥抱机器人时代——Servo杂志中文精华合集》——4.7 理解智能应用

4.7 理解智能应用 数据要变得有用,必须要有利用它的能力.这可以是通过专门分析数据的人员手工来实现并做出相应的决策的.但是建立一个以人为中心的过程是不符合当前的技术趋势的,因为期望是每个操作都是由某种算法所触发的.为了使物联网发挥作用,它不能是劳动密集型的,它必须是更加自动化的. 解决问题的关键是创造出可以理解数据,并基于预设的参数值给出自动反应的智能应用.例如,一个应用连接到你的洗碗机或者洗衣机,可以分析从水表采集来的数据,并且当用水量低于某个值的时候自动启动洗涤的过程--或者当用水量太高的

《拥抱机器人时代——Servo杂志中文精华合集》——3.1 欢迎来到未来

3.1 欢迎来到未来 在未来,世界会变得如此不同. 想象一下你未来的家.它将是个智能的家,它会知道你正在做什么并随之调节自身.它知道你什么时候下班回家并打开家里的灯.暖气.炉子,甚至打开你最喜欢的流媒体音乐台,来欢迎出现在门口的你.它知道何时是开启洗碗机清洗餐具的最佳时机:它知道当你离开房间的时候关上灯,当你离家出门的时候锁上门. 想象一下你在未来所拥有的汽车.就像你的智能家居一样,它可以说是一辆智能汽车.它知道谁在驾驶它并按照你的偏好来调节驾驶模式.音乐以及空调:它自动为你配置了运动驾驶模式.

《拥抱机器人时代——Servo杂志中文精华合集》——4.9 从物联网中盈利

4.9 从物联网中盈利 作为消费者,从物联网中发现对我们的价值是一个角度,但是商业世界是从另一个角度,即作为一个有广阔盈利前景的角度,来考察物联网的.这毕竟是资本主义的本性. 物联网的机会到底有多大?在第1章中,我们大体估计到2020年为止有19000亿美元到89000亿美元的规模.即便是采取最低的估计,这对某些人而言也是很大一笔钱了. 无怪乎很多大公司,包括Cisco.IBM.Intel.Qualcomm和Samsung,都在物联网基础架构上投入很大的赌注.这些公司当然把销售必要的硬件当作赚钱

《拥抱机器人时代——Servo杂志中文精华合集》——3.6 物联网有多么重要

3.6 物联网有多么重要 多数专家期望物联网可以超越当前互联网的规模.影响和收入.如果所有的预期都能实现,它将成为非常伟大的事物. 首先,有多少物体将接入物联网呢?Gartner研究公司预计到2020年物联网将连接近260亿台设备.与其竞争的研究机构ABI(Allied Business Intelligence)认为这个数字将达到200亿台.技术先驱Cisco公司,预言在同样的时间段内将达到500亿台:Nelson Research认为将达到1000亿台的设备:Intel认为2000亿台:ID

《拥抱机器人时代——Servo杂志中文精华合集》——4.5 审视无线技术

4.5 审视无线技术 在一个严格的有线网络中,设备是通过以太网卡连接到路由器的.如果网络是无线的,路由器内就包含一个小的无线发射器来传送和接收所有联网设备的无线信号. 今天有好几种无线技术在使用.所有发送和接收的信号(为射频信号)都是有一个特定频率的.这些和用在AM或者FM收音机中的频率是类似的:最大的区别就是AM/FM只接收信号,而无线网络设备中发送和接收均可被处理. 4.5.1 理解射频技术 射频技术(Radio Frequency,RF)是怎么工作的呢?所有的一切都是单一的无线电波,这也就

《拥抱机器人时代——Servo杂志中文精华合集》——4.4 理解网络连接

4.4 理解网络连接 对于物联网中每个需要与其他设备通信的设备,都必须通过某种网络连接.当两个及以上的设备相互连接就形成了网络,通常是为了传输或分享数据或别的什么通信目的. 当我们讨论物联网的时候,网络连接一般是无线的.这主要是出于实践上的考虑,因为用电线彼此连接数以亿万计的智能设备会很困难,甚至是根本不可能的.如果用无线方式把设备彼此连接.连接到中心集线器或者连接到互联网,那就相对容易得多. 4.4.1 传统的网络如何工作 在传统的网络中,无论是无线还是有线,一般每个设备都不是直接与其他设备连

《拥抱机器人时代——Servo杂志中文精华合集》——4.6 理解数据

4.6 理解数据 每个设备所收集的数据是和该设备的用途相关的.也就是说,不同的设备将收集不同类型的数据. 举个例子,在水表中的传感器收集的是一所房子内的用水方式--什么时候用了多少.一个室内恒温器收集壁炉和空调的使用数据.一天中不同时间的室内(或者外部的)的温度等.车里的传感器收集发动机温度.油位等的数据.一个内置在高速公路上的传感器收集经过的车流量,或者也许还包括周围的环境温度. 然后某个传感器收集到的数据传送到另一个设备或者服务,最后把这些数据和其他的数据对比,并根据这种对比来决策.举个例子