推动AI民主化 英特尔开源BigDL背后的原动力

在万物智能互联时代,数以亿计的智能互联设备及其产生的数据洪流带来了产业的数字化变革。

在汹涌而来的数字洪流中,英特尔不仅针对包括计算、存储、网络在内的硬件基础设施进行持续创新,也通过开源基于Apache Spark的BigDL深度学习框架等多项举措,持续聚焦数据的创新应用,并与生态系统合作伙伴及开源社区一道,加速数据分析与机器学习的普及和应用。

近日,英特尔公司软件与服务事业部副总裁兼系统技术和优化部门总经理Michael Greene及英特尔大数据首席架构师兼高级首席工程师戴金权接受了至顶网记者的采访,畅谈了英特尔开源BigDL背后的原动力。

英特尔积极推动AI技术民主化

英特尔公司软件与服务事业部副总裁兼系统技术和优化部门总经理Michael Greene

Michael表示,英特尔一直以客户需求为方向,并为他们带来能够切实的解决方案。对我们来说,客户的需求永远是第一位的。

“人工智能和机器学习不仅是目前行业的趋势,也是绝大多数客户需求的技术方向。BigDL的初衷就是希望能够让客户用更简单和高效的方式运用他们的大数据做更好的分析的解决方案。”Michael说。

英特尔大数据首席架构师兼高级首席工程师戴金权

戴金权补充说,英特尔在大数据分析、深度学习等开源软件方面做的工作,就是推动AI技术的民主化,让更多人以更方便的方式使用到AI技术。

的确,人工智能正在改变各行各业。戴金权表示,在英特尔我们专注做的一件事情,就是使人工智能计算进入民主化时代,让各行各业更方便地使用人工智能技术。

所谓AI民主化就是人工智能技术能够更方便、更广泛地让大家使用。虽然深度学习社区几乎每周都会有新的技术突破,但是真正在生产环境中应用人工智能技术还是有待提升。

“BigDL要做的就是让深度学习被各行各业的工程师、数据科学家,甚至分析师更方便地使用。这样才能让深度学习在各行各业中得到非常广泛的应用,推动技术变革。”戴金权说。

同时,英特尔在人工智能技术方面的布局也是非常全面的,从硬件到软件再到上层体验,包括从数据中心端再到设备端,英特尔有一个非常完整、一致的体验和技术。

在软件方面,英特尔提供了MKL(英特尔数学核心函数库),可以说这是英特尔平台上最快的数学运算的高性能计算库,而上层是各种深度学习、机器学习的框架。一方面,英特尔在大量现有的深度学习的框架下,例如TensorFlow、Caffe、Torch等方面都做了大量优化工作;另一方面,英特尔和最主流的大数据处理分析框架Spark相结合,开发并开源BigDL这样的深度学习库,再到上面就有更高级别的SDK,各种各样的解决方案等等。

英特尔为什么要推出BigDL?

在大数据分析软件方面,除了我们熟知的Hadoop,还有Spark。目前,Spark已经成为业内进行大数据处理分析的主流计算框架,里面包含非常多的提供各种各样丰富功能的组件,从SQL查询、流式处理、机器学习、图像计算等等。

BigDL是英特尔在Spark上构建的一个面向Apache Spark的开源、分布式的深度学习框架。“我们希望做的事情,就是能够将深度学习和大数据平台相结合,提供一个统一的大数据分析平台。我们的目标是使深度学习更方便使用,更易于一般的大数据用户和数据科学家使用。”戴金权说。

为什么要做这样的事情?戴金权解释说,这其实是由几个比较重要的业界趋势或者技术趋势导致的。

第一,数据规模的扩展推动了深度学习的发展。深度学习之所以今天这么有效,其中一个非常重要的原因是由于今天我们所能够访问到的数据不断增加,以及我们能够在数据上进行高效分析、处理。而深度学习就是不停地对大量的数据进行处理和分析。

第二,Hadoop成为“数据重力中心”。经过这么多年的发展,以Apache Hadoop平台为代表的开源生态系统已经成为大数据平台存储、处理和分析的事实标准。

随着Hadoop和Spark平台和集群建立起来之后,所有的数据慢慢都会集中到这个平台上。这样任何数据分析的框架或者技术,包括深度学习的框架技术都能够很好地在Apache Hadoop为代表的大数据平台上运行和集成。

第三,今天大量的大数据分析,不论是流式分析、图分析、SQL,其实都是基于分析流水线来构建。为了支持人工智能或者深度学习的应用,需要加入新的机器学习或者深度学习的能力。但是从某种意义上来说,机器学习、深度学习的算法必须能够在一个端到端的复杂流水线上,和其他的组件非常好地工作在一起,这也是构建工业级深度学习应用的要求。

“BigDL的推出就是迎合了这些需求,使深度学习更方便地被大数据和数据科学家这样的社区用户来使用。”戴金权说。

相比其他深度学习框架 BigDL有什么特点?

戴金权表示,虽然现在有非常多的深度学习框架,大家也可以看到来自于深度学习社区各种各样的突破。但是怎样能够使深度学习更方便、更普遍地被一般用户、大数据用户和普通的数学科学家所使用,这是BigDL想要解决的一个问题。

具体来说,BigDL是Spark上一个标准的深度学习库,用户可以像编写标准的大数据Spark程序一样开发深度学习应用。它可以直接在现有的Hadoop和Spark的集群上运行,不需要对集群做任何修改,用户可以直接重新使用现有的软硬件架构,而不需要设置特殊的软件或者硬件。

另外,BigDL能够无缝地和Spark(同时它本身是一个Spark程序)结合,所以可以直接在企业工作流里面处理数据。

从BigDL本身来说,它具备和主流的深度学习框架Caffe、Torch、TensorFlow等等相同的功能,它也特别为大数据平台或者大数据的集群、Hadoop集群、Spark集群进行了优化。

“和其他深度学习框架不一样的一个地方,BigDL是专门针对大规模、分布式的大数据运行环境所优化。一方面,在单点上利用英特尔的MKL库,多线程编程等等,BigDL可以得到非常高的性能。同时又充分利用了Spark架构,可以很方便在集群上进行横向扩展。”戴金权说。

此外,BigDL本身是运行在Spark上的一个深度学习框架,能够和主流的大数据架构和云平台进行完美匹配。比如BigDL可以在Cloudera的Data Science Workbench、AWS、微软Azure、阿里云等平台上运行。

戴金权还透露,新版本的BigDL即将推出。如果说现有BigDL聚焦在易用性、可扩展性等方面,新版本BigDL将提供更加丰富、更加易用的分布式深度学习的支持,包括对一些功能性的API支持,例如支持对TensorFlow模型的导入以及TensorFlow模型定义的支持。

还有就是新版本BigDL增强了和Spark ML的整合,可以和原生的Spark ML Pipelines进行整合。

BigDL推动AI技术民主化的深入发展

目前BigDL已经被众多用户使用,这些用户分布在金融、工业制造、医疗健康等领域,例如中国银联使用BigDL构建了一个端到端的欺诈交易检测应用。

Michael说,如今各行各业的企业正在转型成为一个数据驱动的公司,这一个趋势不管是在中国还是在全球范围内都是相当一致的。BigDL的推出加速了这些公司转化为数据驱动公司。现在整个世界的连接度是非常高的,中国公司的BigDL应用和实践也是可以供全球市场借鉴。

其实从BigDL我们也看到了英特尔在开源方面的不遗余力。在大数据方面,从Hadoop到Spark、HBase等等,英特尔已经有非常大的投入,同时,英特尔在Linux、虚拟化等方面也做了非常大量的工作。“英特尔通过开源社区、开源软件将整个生态圈打造好,使整个产业快速发展,让产业里所有人受益。”戴金权最后总结说,“BigDL也是这样,通过聚焦开源项目,让更多的人使用BigDL,推动深度学习在人工智能领域的更广泛应用,使得整个产业得到更好的发展。”

原文发布时间为:2017年7月27日

时间: 2024-12-04 17:14:54

推动AI民主化 英特尔开源BigDL背后的原动力的相关文章

英特尔开源BigDL,可直接在Spark框架下运行深度学习

雷锋网获悉.近日,英特尔开源了基于 Apache Spark 框架的分布式深度学习库 BigDL.通过使用BigDL,用户可以将他们的深度学习应用程序作为标准的 Spark 程序发布(即将基于BigDL的深度学习代码直接嵌入已有的Spark程序中),同时,BigDL还简化了基于Hadoop框架的数据加载过程. 据团队在GitHub平台上的介绍,BigDL具有如下三大特点: 1. 丰富的深度学习支持. BigDL的源代码基于Scala语言实现,同时从Torch框架中汲取了诸多先进的理念.比如像To

英特尔开源分布式深度学习库BigDL:支持高性能大数据分析

近日,英特尔开源了一个运行在 Apache Spark 上的分布式深度学习库 BigDL,其可以利用已有的 Spark 集群来运行深度学习计算,并且还能简化从 Hadoop 的大数据集的数据加载. 开源地址>>> 据介绍,在 Xeon 服务器上的测试表明,BigDL 相比于 Caffe.Torch 或 TensorFlow 等开源框架实现了显著的速度提升.其速度可与主流的 GPU 相媲美,而且 BigDL 也能扩展到多达数十个 Xeon 服务器. BigDL 库支持 Spark 1.5.

英特尔开源OpenGL驱动快于苹果驱动

英特尔的开源Linux OpenGL驱动已经比苹果自己开发的OS X OpenGL驱动更快.Phoronix在硬件规格基本相同的 Mac Mini(双核Intel Core i5,2GB内存,OS X 10.8.3)和运行Ubuntu 13.04的PC(四核Intel Core i5 2415M,2GB内存)上测试了英特尔集成显卡 HD 3000的跨平台 OpenGL 性能. 结果显示,开源Linux OpenGL驱动比苹果快30%以上,而最新的英特尔开源OpenGL驱动与苹果驱动的性能差距更大

英特尔开源 SGX For Linux 工具的早期版本

一直以来,开源虽然在大踏步向前发展,但是软件领域的微软和硬件领域的英特尔似乎一直是专利的代名词,也曾经成为开源路上的阻力.如今微软纳德拉已经多次向开源示好,与Linux讲和,并在最新的Windows10的中原生支持了Linux bash.那么英特尔与开源的情缘现在如何呢? 在前不久的OpenStack Days China上,英特尔公司软件与服务事业部(SSG)副总裁.英特尔开源技术中心总经理Imad Sousou先生受邀参加,并接受了笔者的采访,作为英特尔开源的掌门人Imad Sousou认为

英特尔开源PC伽利略 第一时间入华

英特尔全球副总裁.中国区总裁杨叙日前向 腾讯科技表示,英特尔开源PC伽利略将会第一时间进入 中国市场,目前正在建设相关的开放社区.杨叙称,开源PC的想象空间很大,依托开放平台,他希望除了合作伙伴及学校,更多的大学生也能够接触和参与这个产品的创新,开发自己的新硬件和机器人.他表示,各种创新.微创新可以在很多小的地方开始,明年英特尔的核心就是Quark技术,英特尔会用80年代做嵌入式一样专注的策略来关注这一市场.英特尔发言人克劳丁·曼加诺(Claudine Mangano)曾在上周一通过电子邮件表示

发力AI,英特尔欲借Nervana芯片挑战英伟达GPU

英特尔正在发力人工智能技术,试图在这一领域挑战领先者英伟达.近期收购的Nervana Systems将是英特尔开拓人工智能市场的先锋. 英特尔已公布了关于人工智能的计划,但至少有一块关键拼图尚未完成. 英特尔此前收购了Nervana Systems,并宣布将继续销售该公司的所有产品.这些产品面向高端应用,尤其是神经网络的训练.这一领域目前的领先者是英伟达.与此同时,英特尔收购Movidius的交易尚未完成,因此在计算机视觉和边缘网络方面还有很大的缺失需要填补.此外,英特尔还公布了多个人工智能软件

英特尔收购Movidius背后:为什么我们需要一款专门的CV处理芯片?

(Movidius Myriad 2,图片来源:Movidius) 编者按:本文作者为英梅吉CEO朱郁丛,该公司推出了基于手机摄像头的手势交互产品Hand CV. 背景:科技界又迎来了一桩大额收购案,芯片巨头英特尔收购了硅谷计算机视觉领域的初创公司 Movidius,该公司主要产品为低功耗视觉处理器:Myriad 系列 VPU.今年八月,Intel还以 3.5 亿美元收购了主攻深度学习的公司 Nervana,这一笔收购能够让英特尔获得深度学习的 IP 和具体产品,从而满足 AI 开发及数据中心对

英特尔马子雅:深度学习四大痛点与BigDL解决之道

   [51CTO.com原创稿件]在万物智能互联时代,数以亿计的智能互联设备及其产生的数据洪流带来了产业的数字化变革.越来越多的企业希望借助机器学习与深度学习,从海量数据中获取切实可行的洞察以指导企业决策.创造更多价值.借助计算.存储和网络等基础设施的优势,英特尔在数据分析与人工智能领域深耕已久,并通过与合作伙伴的合作,给用户提供了端到端的软硬件全平台解决方案.近期,由O'Reilly Media和Cloudera联合举办的Strata Data Conference大会在京召开.期间,笔者受

英特尔组建超级AI 部门,中国人工智能顶级峰会为何选择与英特尔合办?

新智元3月24日消息,英特尔官方宣布,将组建一个统一的 AI 部门 the Artificial Intelligence Products Group (AIPG),由英特尔去年收购的AI公司 Nervana的 CEO Naveen Rao 统领.另外,英特尔还将创建新的 AI 实验室. Naveen Rao 在公开信中写道: AI 正在改变世界.从智能工厂到无人机,从体育到医疗再到无人车,所有的事情都将被改变.数据是横贯所有这些应用的一条线,我们的战略是使英特尔成为覆盖每个行业的数据革命的驱