大数据定义
对于“大数据”(Bigdata)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据可实现的功能与意义
现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是DataTechnology数据科技,显示大数据对于阿里巴巴集团来说举足轻重。
有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键。
大数据的价值体现在以下几个方面:
1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销
2)做小而美模式的中小微企业可以利用大数据做服务转型
3)面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值
大数据应用整体情况
大数据应用主要集中在对业务数据的统计分析,作为系统或企业的辅助支撑,应用范围以系统内部或企业内部为主,例如各类统计报表、展示图表等。
伴随着各种随身设备、物联网和云计算、云存储等技术的发展,数据内容和数据格式多样化,数据颗粒度也愈来愈细,随之出现了分布式存储、分布式计算、流处理等大数据技术,各行业基于多种甚至跨行业的数据源相互关联探索更多的应用场景,同时更注重面向个体的决策和应用的时效性。
因此,大数据的数据形态、处理技术、应用形式构成了区别于传统数据应用的大数据应用。
当前,大数据在各个领域的应用持续升温。据Gartner公司2015年的最新调研数据显示,全球范围内已经或未来2年计划投资大数据应用的企业比例达到76%,比2014年增长3%。
中国信息通信研究院2015年的调查显示中国地区的受访企业中有32%的企业已经实现了大数据应用,另有24%的企业正在部署大数据平台。
但是,在另一方面,大数据的效益仍尚未充分得到验证。大多数的大数据系统尚处于早期部署阶段,因此它们的投资回报还未得到充分验证。
总体来看,大数据应用尚处发展前期阶段,应用快速部署,效益有待检验。大数据前景很美好,同时也可能存在“忽悠”出来的“泡沫”成分。
5 大行业应用领域看大数据场景应用
整体来看,大数据应用尚处于从热点行业领域向传统领域渗透的阶段。中国信息通信研究院的调查显示大数据应用水平较高的行业主要集中分布在电信、金融、政务、交通和医疗5大行业领域,另外一些传统行业的大数据应用发展较为缓慢,批发零售业甚至有超过80%的企业并没有大数据应用计划,远低于整体平均水平。
1 电信领域
众所周知,电信行业掌握着体量巨大的数据资源,单个运营商其手机用户每天产生的话单记录、信令数据、上网日志等数据就可达到PB级的数据规模。电信行业利用IT技术采集数据改善网络运营、提供客户服务已有数十年的历史,而传统处理技术下运营商实际上只能用到其中不足1%的数据资源。
大数据对于电信运营商而言,一是意味着利用廉价便捷的大数据技术提升其传统的数据处理能力,聚合更多的数据提升洞察能力。
比如中国移动通过对消费、通话、位置、浏览、使用和交往圈等数据的分析,利用各种联系记录发现各种圈子,分析影响力及关键人员,用来进行家庭客户、政企客户和关键客户的识别,以实现主动营销和客户维系。
二是提高数据意识,寻求合适的商业模式,尝试数据价值的外部变现。主要有数据即服务(DaaS)和分析即服务(AaaS)两种模式,一般对这两种模式,很多人都比较陌生远不如大家耳熟能详的软件即服务(Saas)来的熟悉。数据即服务(DaaS)模式往往通过开放数据或开放API的方式直接向外出售脱敏后的数据;分析即服务(AaaS)模式往往与第三方公司合作,利用脱敏后的(自身或整合外部)数据资源为政府、企业或行业客户提供通用信息、数据建模、策略分析等多种形式的信息和服务,以创造外部收益,实现数据资源变现。
2 金融领域
金融行业是信息产业之外大数据的又一重要应用领域,大数据在金融三大业务——银行、保险和证券中均具有较为广阔的应用前景。
总体说来,金融行业的主要业务应用包括企业内外部的风险管理、信用评估、借贷、保险、理财、证券分析等,都可以通过获取、关联和分析更多维度、更深层次的数据,并通过不断发展的大数据处理技术得以更好、更快、更准确的实现,从而使得原来不可担保的信贷可以担保,不可保险的风险可以保险,不可预测的证券行情可以预测。
更多的金融企业利用大数据技术整合来自互联网等渠道的更大的外部数据,典型的例子便是淘宝网的“阿里小贷”依托阿里巴巴(B2B)、淘宝、支付宝等平台数据,海量的交易数据在阿里的平台上运行,阿里通过对商户最近100天的数据分析,准确把握商户可能存在的资金问题。宜信的互联网金融产品就是以互联网为获客主要渠道,除了借贷信用记录,还结合大数据分析技术,捕捉来自大众点评、豆瓣等社交网络上的有用信息,帮助信用审核人员多维度分析借款客户的信用状况。
3 政务领域
大数据政务应用已经逐渐获得世界各国政府日益重视。我国政府也非常重视利用大数据提升国家治理能力。《国务院关于印发促进大数据发展行动纲要的通知》提出“大数据成为提升政府治理能力的新途径”,要“打造精准治理、多方协作的社会治理新模式”。
首先,大数据有助于提升政府提供的公共产品和服务。一方面,基于政务数据共享互通,实现政务服务一号认证(身份认证号)、一窗申请(政务服务大厅)、一网办事(联网办事),大大简化办事手续。另一方面,通过建设医疗、社保、教育、交通等民生事业大数据平台,有助于提升民生服务,同时引导鼓励企业和社会机构开展创新应用研究,深入发掘公共服务数据,有助于激发社会活力、促进大数据应用市场化服务。
其次,大数据支持宏观调控科学化。政府通过对各部门、社会企业的经济相关数据进行关联分析和融合利用,可以提高宏观调控的科学性、预见性和有效性。比如电商交易、人流、物流、金融等各类信息的融合交汇可以绘出国家经济发展的气象云图,帮助人们了解未来经济走向,提前预知通货膨胀或经济危机。
第三,大数据有助于政府加强事中事后监管和服务,提高监管和服务的针对性、有效性。《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》提出四项主要目标:
一是提高政府运用大数据能力,增强政府服务和监管的有效性;
二是推动简政放权和政府职能转变,促进市场主体依法诚信经营;
三是提高政府服务水平和监管效率,降低服务和监管成本;
四是实现政府监管和社会监督有机结合,构建全方位的市场监管体系。
“大数据综合治税”、“大数据信用体系”等以大数据融合加强企业事中事后监管的新模式的探索正在全国各地展开。
大数据超越了传统行政思维模式,推动政府从“经验治理”转向“科学治理”。随着国家大数据战略渐次明细,各方实践逐步展开,大数据在政府领域的应用将迎来高速发展。
4 交通领域
交通数据资源丰富、具有实时性特征,大数据在交通领域的应用也是当前较为成熟和效果十分显著的领域应用。
在交通领域,数据主要包括各类交通运行监控、服务和应用数据,如公路、航道、客运场站和港口等视频监控数据,城市和高速公路、干线公路的各类流量、气象检测数据,城市公交、出租车和客运车辆卫星定位数据,以及公路和航道收费数据等,这些交通数据类型繁多,而且体积巨大。此外,交通领域的数据采集和应用服务均对实时性要求较高。
目前,大数据技术在交通运行管理优化、面向车辆和出行者的智能化服务,以及交通应急和安全保障等方面都有着重大发展。
在出行方面,面向公众出行信息需求,整合交通出行服务信息,在公共交通、出租汽车、道路交通、公共停车,以及公路客运等领域扩大信息服务覆盖面,使公众出行更便捷。可以提供综合性、多层次信息服务,包括交通资讯、实时路况、公交车辆动态信息、停车动态信息、水上客运、航班和铁路等动态信息服务以及出行路径规划、出租召车等信息交互服务。例如,滴滴、Uber打车软件提供出租车、快车、专车、顺风车服务,同时接入地图、路线查询、实时路况、在线支付等相关服务。智能停车软件也进入市场,如停简单、好停车、PP停车等,实现停车行业与动态交通的有效衔接。
在物流方面,物流数据可以为物流市场预测、物流中心选址、优化配送线路、仓库储位优化等提供支撑,甚至能够提供交通路况、车辆运行、社会经济发展动态的信息。对于跨境物流,整合集口岸监管、物流运输、航运信息,可以实现物流产业链的业务单据、车辆船舶动态、通关状态等要素信息的跨行业、跨区域贯通,提高物流效率。
在管理方面,利用交通行业数据,支撑交通管理与决策。利用数据挖掘技术可以深入研究交通网优化,为行业发展趋势研判、政策制定及效果评估等提供支撑保障。此外,交通与公安、建管、环保等相关职能部门的大数据平台对接,可以提高跨领域管理能力。
在运营方面,整合行业数据,形成地面公交、出租汽车、轨道交通、路网建设、汽车服务、港口、航空等领域的一体化智能管理。通过车载、运营数据的精确、实时采集,可以实现公交调度、行车安全监控、公交场站管理,支持公交安全、服务、成本管控的全过程管理和交互。通过打通出租汽车电调平台与互联网召车平台之间的信息渠道,可以提供多渠道便捷的召车服务,实现对出租汽车服务质量的动态跟踪、评估和管理。对轨道交通线网基础设施、运行状况、运营数据、服务质量、隐患治理、安全保护区等进行监测,可以实现安全管理和应急协同。
5 医疗领域
医疗卫生领域每年都会产生海量的数据,一般的医疗机构每年会产生1TB-20TB的相关数据,个别大规模医院的年医疗数据甚至达到了PB级别。
从数据种类上来看,医疗机构的数据不仅涉及服务结算数据和行政管理数据,还涉及大量复杂的门诊数据,包括门诊记录、住院记录、影像学记录、用药记录、手术记录、医保数据等,作为医疗患者的医疗档案,颗粒度极为细致。所以医疗数据无论从体量还是种类上来说都符合大数据特征,基于这些数据,可以有效辅助临床决策有效支撑临床方案。同时通过对疾病的流行病学分析,还可以对疾病危险进行分析和预警。
临床中遇到的疑难杂症,有时即便专家也缺乏经验,做出正确的诊断和治疗更加困难。临床决策支持系统可以通过海量文献的学习和不断的错误修正,给出最适宜诊断和最佳治疗。大数据分析技术将使临床决策支持系统更智能,这得益于对非结构化数据的分析能力的日益加强。
大量的基因数据、临床实验数据、环境数据以及居民的行为与健康管理数据形成了“大数据”,同时随着人类对疾病与基因之间映射关系的认识加深,基因测序成本的下降,可穿戴设备的普及,监控设备的微型化,移动连接和网络覆盖范围的扩大和大数据处理能力的大幅提升,针对患者个体的精准医疗和远程医疗成为可能。通过收集和分析数据,医生可以更好地判断病人病情,可实现计算机远程监护,对慢性病进行管理。通过对远程监控系统产生的数据的分析,可以减少病人住院时间,减少急诊量,实现提高家庭护理比例和门诊医生预约量的目标。
公共卫生部门可以通过覆盖全国的患者电子病历数据库,快速检测传染病,进行全面的疫情监测,并通过集成疾病监测和响应程序,快速进行响应。百度通过对全国各地用户产生的搜索日志的分析,提供全国331个地级市,2870个区县的疾病态势。百度还准备将社交媒体数据、问答社区数据、甚至是各地区天气变化、各地疾病人群迁徙等特征数据融合到预测里,进一步提高预测的准确性。
总结
以上便是从电信、金融、政府、交通和医疗健康等5个行业,分析行业大数据应用的典型模式、发展状况。
大数据的应用其实是无所不在的,其他行业如工业、零售业、农业的应用场景也非常多。但是总体来说,大数据应用尚处于初步阶段,受制于数据获得、数据质量、体制机制、法律法规、社会伦理、技术成本等多方面因素制约,实际成果还需要时间检验。
大数据行业应用的发展,是沿袭数据分析应用而来的渐变的过程。观察大数据应用的发展演变,可以从技术强度、数据广度和应用深度三个视角切入。从以上的应用来看,大数据区别于传统的数据分析有以下特征。
数据方面,逐步从单一内部的小数据,向多源内外交融的大数据方向发展,数据多样性、体量逐渐增加。
技术方面,从过去的报表等简单的描述性分析为主,向关联性、预测性分析演进,最终向决策性分析技术阶段发展。
应用方面,传统数据分析以辅助决策为主,大数据应用中,数据分析已经成为核心业务系统的有机组成部分,最终生产、科研、行政等各类经济社会活动将普遍基于数据的决策,组织转型成为真正的数据驱动型组织