大数据服务还是那个大数据服务吗?

2012年大数据是个流行词,没想到4年过后,在一些大数据论坛上还有人会说“如果我有大数据,我会怎样怎样……”好吧,如果还停留在如果上,就不该随便上论坛演讲,讲不好说不准工作都没了。现在大数据挖掘的技术都很成熟,更完善更系统的解决方案早已有人做得非常好。如果连数据都还没有,那就什么都不用提了。毕竟,人工智能+大数据的生态模式已经开启。

7月初,据外媒福布斯报道百度将人工智能+大数据为中国政府采集数据提供支持。7月13日,李彦宏在百度的开放云战略发布会上首度公开百度开放云“人工智能、大数据和云计算”三位一体的发展战略。为什么谷歌和百度都在人工智能领域重金发力?2015年百度投入研发创新的资金占公司总营收的16%。谷歌就不用说了,在量子计算这样离实现还遥不可及的技术上都已经投入很多研发资金。因为互联网未来向智能+发展的基础是数据。有数,有趋向完整的海量数据是现在所有巨头在布局人工智能+大数据生态模式的重点。

数据获取的最新模式:众包

众包是一种整合资源提升效率的方式,通过众包可以在集合海量数据中,筛选符合一定标准的有效数据,能够降低数据收集的成本,提高机器学习训练的效率。有个生物学家叫戴维•休斯(David Hughes),他和作物流行病学家马塞尔•萨拉斯(Marcel Salathé)将机器视觉技术和深度学习算法应用于农业病虫害智能防治上。他们将关于植物叶子的5万多张照片导入计算机,并运行相应的深度学习算法,针对在明亮的光线条件及合乎标准的背景下拍摄出植物的照片,最终程序正确识别率高达99.35%。如果在互联网上随机选取的植物叶子照片,其识别准确率将降至30%-40%,这也是目前视觉识别技术在复杂环境下尚未突破的地方。为了突破算法的限制,提高准确率,休斯和萨拉斯开发手机应用Plant Village,让世界各地的农民通过Plant Village上传患病作物照片,其中包含照片如何拍摄、拍摄地点、年份等大量数据,并包含农业专家对此做出相应诊断的信息。这种方式出现之后,数据获取的难度依旧聚焦在多维度数据资源的聚合,众包可以解决从分散的个体获取目标数据的问题,但对于基础数据资源层的扩张和占领依然是一场没有硝烟的砸钱战斗。

数多了怎么办:智能计算

有些人在努力获取数据,有些人在为数据多而未能充分利用而焦虑。

数据量级达到一定程度,再利用数据优化服务需要人工智能算法。随着企业数据量的积累,挖掘数据提高效率变成了必需。比如商业应用中打车平台的应用,国内平台滴滴与快滴合并之后,业务线从出租车扩张到专车、顺风车、公交等领域,数据范围猛增,数据量包含司机行为数据、顾客行为数据及各种路线数据、实时交通情况数据,定位数据等,据滴滴官方公布,滴滴出行每天处理的数据量达到70TB,由于订单处理响应时间的要求,单纯处理数据的效率已无法满足实时服务的需求,必须借助人工智能算法才能够进一步提升服务效果。从用户体验角度,也需要实现提升定位精准度,提高接单率,缩短应答时间。目前滴滴内部基于海量数据+机器学习算法的推荐匹配系统,针对海量司机的交班时间、地点、接单/拒单情况等海量数据进行司机画像,以此为基础,针对实时的订单数据,分配订单时实时按需分配,满足服务需求。从数据应用展现更宏观价值的角度来看,基于滴滴已有数据,可整合实时交通情况数据,包括拥堵路段、集中路线、集中商圈等多维度动态数据,进行结构化处理,达到整合一个城市的车辆分布,实现统筹平衡调度的目的。

大数据服务的现在及未来:智能+生态模式

未来人工智能+大数据生态模式将更多的应用于在商业场景下。我们认为,大数据服务未来将有以下四种模式:

一是形成数据资源和计算资源提供平台。当前企业数据大多仅留存于企业内部,在开发应用上一般也只有内部应用,企业之间数据各自孤立,独立计算,行业内尚未形成整合大数据,目前第三方数据采集、监测机构已经开始致力于多维数据的采集服务,包括外部数据的直接采集和企业内部数据的间接采集,已有第三方在提供基础数据库资源。未来伴随数据维度的丰富和数据量的扩大,第三方机构将采集并使用智能算法结构化处理形成相对完整的数据资源提供平台,并针对些海量数据的存储、整合及计算提供基于云端的平台式服务。

二是出现技术服务平台,包含提供Paas服务的开源平台及计算能力、大数据解决方案及技术服务支持。从目前人工智能和大数据企业发展来看,只有巨头和少数创业企业掌握核心算法及存储真正大数据,更多企业通过合作或建立产业联盟的方式获取行业或其他领域的数据。但对于数据的存储、处理和应用需要技术支撑且突破这些技术需要消耗大量人力物力财力,没必要所有企业都去做这件事。PaaS服务将数据处理能力作为模块开放出来,使得数据挖掘技术的使用门槛和成本大幅降低,更多企业有能力利用云端数据服务创造附加价值。因此形成Paas服务平台或解决方案技术服务平台,据此可以聚合数据资源,优化算法,提高准确率。另外也会形成基于数据存储、处理及挖掘技术的整体服务解决方案提供商,企业可以将数据服务完全外包给第三方机构,第三方机构也可以通过这种方式在云端整合资源并优化技术,提高准确率,同时产生推动行业发展的效果。

三是出现资讯服务平台。大数据产业相对仍是新兴产业,发展日新月异。一方面企业需要寻找大数据资源或技术服务平台,另外一方面第三方服务机构需要推广宣传自身及行业发展、技术发展现状。在这种背景下将出现起到桥梁作用的专业资讯服务平台,连接企业和第三方服务机构,同时起到发布整个行业前沿信息的作用。

四是出现交叉/垂直化服务应用。现阶段在教育、金融领域的垂直应用以及在未来智能营销、智能制造等交叉行业的应用。如在教育行业已出现利用积累的教、考、学环节的大数据结合深度学习算法推出个性化学习平台,如国外的Knewton、国内的智学网都是这种模式。未来将延伸至农业、制造业、交通、医疗等各行各业,出现如智能农业生产管理、智能交通、个性化精准医疗等创新服务。

本文作者:慧辰

来源:51CTO

时间: 2024-10-28 13:01:10

大数据服务还是那个大数据服务吗?的相关文章

大数据趋势下,航企服务管理如何转变?

民航资源网2017年4月11日消息:4月11日,第三届民航服务峰会在四川成都锦江宾馆隆重开幕.来自民航局.国际航协.航司.机场等100余家民航单位的近300位民航领袖及行业精英参加了本次盛会.山东航空服务发展部总经理沙总在会上做了精彩演讲. 在日常的工作中,大数据的应用提升可以大大提高工作效率.航空公司做大数据应用,最终还是要回归本质,真诚服务旅客以提升旅客满意度.在航空公司的服务管理过程当中,大数据应用主要围绕三个方面:一个是对服务过程的管理,一个是服务风险的管控,另外就是个性化服务的提供.航

如何让“大数据”更好为企业运营服务?

天再一次塌下来了.这一次是"大数据"让IT部门如临大敌.正如街谈巷议的传闻一样,不管你走到哪里,关于"大数据"的讨论无处不在.在Google搜索这个词组,搜索结果超过13亿条.它甚至在维基百科拥有专门的条目.数据泛滥导致很多人得出结论:企业将不堪重负.这并不是说企业内部的信息量不会增长.相反地,企业内部信息量也难逃增长的命运.因为,大数据一直是个难题. 尽管不断有人声称,数据洪流将导致厄运来临,但IT行业却始终能够通过改进计算基础架构,使它们速度更快.容量更大.价格

大数据为何会冲击传统媒体服务模式

大家都知道大数据对于媒体的杀伤力是巨大的,这其中包含传统媒体(例如报纸.电视)也包含网络媒体(例如新闻门户).可是大数据为何能够冲击传统媒体呢? 用学术的口吻,可以这样描述:"媒体渠道碎片化,带来对指标的要求:大数据模式清晰的结果导向带来对广告客户的巨大吸引力." 通俗地说,就是:做媒体的人多了于是客户就要去判断哪一家的效果最好.也就是说做媒体的人越来越多,客户看着越来越晕,最后忍不住了要问"你们究竟谁家的效果好?有什么样的评估标准?"随着数据经营理念的提升,大家发

大数据时代的图书馆科研用户服务模式探索

大数据时代的图书馆科研用户服务模式探索 周涛 杨志萍 王春明 大数据时代的来临,图书馆特别是研究型图书馆以及大学图书馆正面临着贡献边缘化的危机.通过对知识创造的生命周期模型进行分析,当前和未来科技创新需要科研数据管理和基于知识的交互协同创造能力.图书馆服务应抓住机遇,通过科研数据管理与用户关系管理相结合,探索融入科研一线,跟踪科研全过程的图书馆知识化服务模式,提升图书馆的竞争力.本文基于国外的图书馆科研数据管理以及用户关系管理方面,从技术支撑.科研数据组织.数据分析到用户关系管理等,探索该服务模

大数据环境下金数据们的轻态数据服务还有机会

大数据是近几年IT业界中非常火热的一个词汇,由于当前主流的一些软件工具并不能满足人们对于巨量数据的挖掘.收集.整理.分析的需求的缘故,国内外都出现了不少根据这个痛点而进行突破的大数据服务企业. 当IT数据领域主流的发展目标都致力在大数据服务上的时候,那些针对中小团队甚至个人的数据服务是否又还是拥有较大的市场继续挖掘呢? 国庆放假期间,偶然间在微信朋友圈中打开了一位微信好友分享过来的问卷调查链接.问卷调查的内容没有太多复杂的选项,很多需要你选择的地方都是一个相对比较广泛领域中少数的几个选择.虽然我

联想大数据入选工信部国家“大数据优秀产业、服务和应用解决方案”

   近日获悉,由联想创投集团大数据平台推出的"联想大数据企业应用解决方案"成功入选由工信部组织的全国"大数据优秀产业.服务和应用解决方案"征集.该方案聚合了联想创投集团在大数据领域的多项技术成果与行业经验,成为国内极具影响力的企业级大数据平台及多行业解决方案. 此次征集是国内首次在大数据领域进行的政府权威征集."联想大数据企业应用解决方案"以全球部署超大规模集群的行业实力.多年海量数据分析与持续性业务支撑的行业积累.行业领衔的先进技术.多角度贴

浪潮张东:商业智能、政府管理及公共服务是中国大数据的应用重点

"发展大数据产业将推动中国转变社会经济发展方式,对于提升企业竞争力和政府管理服务能力具有紧迫的现实意义."11月27日,浪潮集团系统软件总监.云计算产品研发部总经理张东在浪潮集团大数据战略发布暨云海大数据一体机产品发布会上,指出:商业智能.政府管理及公共服务是中国大数据产业的重点应用领域. 用大数据指导精准的商业决策 商业智能是数据挖掘的产业,但是传统的商业智能所挖掘的数据往往就商业来挖掘商业数据.比如零售业挖掘的就是消费者以前在这个超市里面卖东西的情况,零售业巨头沃尔玛曾把啤酒和尿布

数据服务托起大数据产业链兴起

随着大数据概念深入人心,越来越多的企业开始认可数据存在价值.挖掘自身数据价值.获取外部数据是企业两大需求.但在实践中,企业发现两大需求存在同样问题,不论是自身数据还是外部数据,原始数据与有价值数据之间存在鸿沟,自身缺乏填平鸿沟的技术手段. 新兴大数据公司成为解决问题的答案,他们具备处理数据的经验和技术,可以将原始数据转化成能为业务提供支持的数据.数据服务产业链就此形成. 整个数据服务产业链可以分为三个部分,从上游的数据源到中游的数据服务商,再到下游的企业级用户.因为大数据公司大多成立时间较短,自

大数据帮助政府做好服务--联合国发布大数据政务白皮书

7月11日,联合国在纽约发布了一份关于大数据政务的白皮书,总结了各国政府如何利用大数据更好地服务和保护人民.这份白皮书举例说明在一个数据生态系统中,个人.公共部门和私人部门各自的角色.动机和需求:例如通过对价格关注和更好服务的渴望,个人提供数据和众包信息,并对隐私和退出权力提出需求:公共部门出于改善服务,提升效益的目的,提供了诸如统计数据.设备信息,健康指标,及税务和消费信息等,并对隐私和退出权力提出需求:私人部门出于提升客户认知和预测趋势目的,提供汇总数据.消费和使用信息,并对敏感数据所有权和