人才储备不足映射出“大数据”技术缺陷

本文讲的是人才储备不足映射出“大数据”技术缺陷,根据咨询师和IT经理的观点,“大数据”分析的最大挑战可以简单地归结为两个方面:1、技术尚未成且用户体验不佳;2、缺乏相关领域的技术人才储备。

  许多大数据技术(如Hadoop MapReduce)都来自开源社区,由致力于研究高效处理大容量信息的互联网志愿者进行开发,如Google和Yahoo,其中包括结构化和非结构化数据。因此,大多数技术在成熟度和可访问性方面都不及传统数据库和数据管理套件,而且可用于帮助数据仓库和分析人员熟悉这些环境的补充分析工具还很有限。

  Ron Bodkin是大数据分析咨询公司Think Big Analytics的CEO,他指出,所有这些技术的学习曲线都不平坦,有许多新技术和无文档的技术需要学习。大多数人都习惯于使用关系数据库管理系统,这是一种完全不同的数据存储和处理模式。

  在管理和组织高度结构化的数据和SQL建模与报表制作上,虽然数据管理团队一般都具备良好的知识积累,但是这些常规技能并不适用于非结构化和扁平文件的大数据领域,其中命令行和NoSQL数据库技术 才是大多数新兴平台的核心构建模块。

  comScore是一家Web分析提供商,近年来主要销售开发和实现大数据分析策略的智能服务。公司的软件工程副总裁Will Duckworth指出:“您必须着手准备。它现在还不是成熟的产品,还不能简单地购买、安装和运行在服务器上。您需要配备良好的系统管理员,以及掌握建立这些环境的实践方法。”

  人才缺乏严重

  大数据分析主要基于预言建模或未来趋势分析。但是,一般业务用户或者传统B数据分析师并不具备开发 预言分析应用程序模型的技能。此外,许多数据都处于原始形式,来源于Web活动日志或检测器等。因此,公司需要配备一些精通于统计和数学原理的骨干专家,他们要能够建立高级分析模型,发现趋势和隐藏的模式,使大数据真正发挥作用。

  Forrester研究公司的首席分析师Brian Hopkins说:“您不仅需要能够实现价值的IT运营技能,而且我们现在最缺乏的大数据科学家——具备统计博士学位的人才。大部分数据是原始数据——它们不能直接读取和分析。处理这些原始信息的人员一定要具备一些特定的技能集,而且您需要在业务中引入这些人才。”

  comScore公司的业务主要是通过大量的Web数据分析预测出客户趋势,许多分析用户都接受过预言建模培训,技术上足够理解特定查询对于整个系统性能的影响。然而,Duckworth指出,其他公司并不具备这样的条件。所以comScore在再次教育方面投入了许多时间和资金,帮助他们重新审视数据规模,而在他们建立模型和查询时投入时间考虑数据分区、负载规模等细节问题。

  同时,公司还设计了考虑制衡的大数据系统。例如,如果有人试图运行可能破坏集群的查询,那么系统会发出提示,保证该用户完全知晓所执行任务的危害。Duckworth说:“基于规模效应,问题会传播得很快。”ComScore还引入了预打包应用程序,给它的Hadoop大数据分析环境增加了类似SQL的环境,因此它更容易被主流用户接受。

  Zions Bancorporation是一家商业银行,它利用大数据技术对各种贷款业务进行建模和风险管理。在这家公司中,培训也是大数据分析策略的主要部分。但是,培训不仅仅是学习Hadoop技能,也不是统计学速成课。相反,要花费一定的时间和精力使技术团队成员适应新技术,使他们能够顺利过渡到全新的数据管理方式。

  作为Zions的前任数据仓库、BI和分析高级副总裁,Clint Johnson指出:“这是一种传统且保守的IT部门不愿意实现的新技术。您的系统管理员或数据库管理员一直以来的工作都是围绕一个特定的技术集,而此时您突然给他们强加一种新技术,并要求他们学习这种新技术。您必须面对这项新模型支持所带来的文化挑战。”

作者: 曾少宁

来源: IT168

原文标题:人才储备不足映射出“大数据”技术缺陷

时间: 2024-09-15 09:46:32

人才储备不足映射出“大数据”技术缺陷的相关文章

大数据技术的发展历程 及其演化趋势

最早提出词汇"Big Data"的是2011年麦肯锡全球研究院发布的<大数据:下一个创新.竞争和生产力的前沿>研究报告.之后,经 Gartner技术炒作曲线和2012年维克托·舍恩伯格<大数据时代:生活.工作与思维的大变革>的宣传推广,大数据概念开始风靡全球. 基于Web of Science数据库中1994年后涉及大数据概念的4495篇文献,采用Citespace知识图谱工具,通过热点关键词和高被引文献分析,能够勾勒出大数据技术从萌芽到成熟的发展历程. 上世纪

阿里云携手达内教育培养大数据技术人才

本文讲的是阿里云携手达内教育培养大数据技术人才,1月12日,达内教育集团与阿里云在北京召开新闻发布会,共同向外界宣布双方达成战略合作关系,共同培养云计算.大数据方向的技术人才. 按照协议,到2017年4月,将有5万人次的达内学员享受阿里云高端的云计算培训和ACF认证. 据了解,达内将与阿里云共同研发面向阿里云认证考试的培训课程,面向终端用户推广阿里云的培训及认证产品. 阿里云为达内的每位学员提供两次免费参加ACF(Ali cloud foundation)认证考试,提供在线考试平台的机会.这意味

借力大数据技术 证券行业迎转型契机

互联网+时代,证券行业制定大数据战略迫切而适时.一方面,近年来大数据被提升到国家发展战略层面,政府提供资金及政策支持,鼓励企业在大数据方面的发展和转型,大数据技术体系发展逐渐成熟.基于开源和商业技术共同形成的大数据技术体系已经在互联网行业应用多年,推出的稳定软件版本及云服务能够支持后来者落地实施大数据战略.另一方面,得益于部分互联网行业龙头在大数据方面的探索和推动,具备大数据项目经验的人才培养体系逐渐建立,形成了大数据发展的良好土壤.同时,经过多年的发展积累,大数据资源已经越来越丰富,国内外领先

调查结论:业界对于大数据技术热情仍在上涨

约有三分之一受访者表示大数据分析为其带来更理想的决策结果. 众多企业目前仍在努力管理规模持续增长的庞大数据,并希望能够凭借各类分析项目从当前持有的数据当中获取更为可观的商业价值.不过对于大多数企业而言,单纯与数据规模增长保持同步就已经是个难以解决的问题. 根据IDG公司发布的最新调查报告来看,在全部1139位受访IT决策制定者当中,多数都对大数据技术保持着稳定上升的关注与兴趣.超过一半(53%)的受访者目前正在实施或者将在明年内在企业当中实施由数据驱动的项目规划--这一比例与2014年相比增长了

《Spark大数据分析:核心概念、技术及实践》大数据技术一览

本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第1章,第1节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问"华章计算机"公众号查看. 大数据技术一览 我们正处在大数据时代.数据不仅是任何组织的命脉,而且在指数级增长.今天所产生的数据比过去几年所产生的数据大好几个数量级.挑战在于如何从数据中获取商业价值.这就是大数据相关技术想要解决的问题.因此,大数据已成为过去几年最热门的技术趋势之一.一些非常活跃的开源项目都与大数据

Facebook前主管谈大数据技术趋势和演变

本文讲的是Facebook前主管谈大数据技术趋势和演变,全球系统架构师大会于8月10-12日在深圳万科国际会议中心隆重举行.首先给大家带来分享的是前Facebook数据基础设施团队主管,Qubole创始人,CEO Ashish Thusoo,他主要介绍了大数据架构以及怎么样不断的演进,与其说演进,不如说革命.其中主要包括三个方面的主题: ▲全球系统架构师大会现场报道 第一,大数据的需求.当今世界需要大数据,有哪些驱动因素促使我们不同方式考虑大数据?以不同方式处理数据. 第二,技术给我们带来哪些架

《Spark大数据分析:核心概念、技术及实践》一 第1章 大数据技术一览

第1章 大数据技术一览 我们正处在大数据时代.数据不仅是任何组织的命脉,而且在指数级增长.今天所产生的数据比过去几年所产生的数据大好几个数量级.挑战在于如何从数据中获取商业价值.这就是大数据相关技术想要解决的问题.因此,大数据已成为过去几年最热门的技术趋势之一.一些非常活跃的开源项目都与大数据有关,而且这类项目的数量在迅速增长.聚焦在大数据方向的创业公司在近年来呈爆发式增长.很多知名公司在大数据技术方面投入了大笔资金. 尽管"大数据"这个词很火,但是它的定义是比较模糊的.人们从不同方面

专访携程李亚锋:大数据技术融合下的Spark更具魅力

大数据"作为当下最火热的IT行业词汇,在主流的数据处理工具当中Hadoop和Spark都被大家所熟悉.不过,目前基于内存计算的Spark适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,已经逐渐获得很多企业的支持.这是否意味着我们应该彻底抛弃Hadoop?在前不久的北京Spark亚太峰会上 ,记者有机会专访到携程大数据平台高级经理李亚锋,为大家分享如何通过Spark与Hadoop大数据技术间的融合,实现优势互补,引导企业发现用户的潜在需求. 李亚锋,携程大数据平台高级经理,负

引领大数据技术创新 加快大数据产业聚集

在近日公布的全市2015年度绩效目标考核中,高新区斩获开发区类一等奖,在各大开发区中排名第一. "这得益于近年来市委.市政府坚持围绕创新做文章,确立大数据这一主导产业,先人一步.棋高一筹,帮我们摆脱了'路径依赖',找准了发展方向.发展路子."高新区党工委副书记.管委会主任黄昌祥说,高新区将以此为新的起点,抓住大数据这个核心,引领大数据技术创新,加快大数据产业聚集,全力打造创新型中心城市示范区. 走好"先手棋"发展新业态 前不久,朗玛信息技术股份有限公司披露,从201