可能是2017最全的机器学习开源项目列表

摘要: 2016 和 2017 年对机器学习来说都是令人兴奋的,机器学习领域在 2016 年取得了重大的进展,2017 年,热度继续上升......

2016 年,似乎所有巨头公司都在做机器学习,如果没有,也是在赶来的路上。所以 2016 或许会因为 “机器学习大热” 而被载入史册。2017,这个热潮并没有消退的迹象,前阵子 AlphaGo 的升级版以横扫千军的姿态战胜几乎所有中国的围棋大师,如入无人之境,最后更是以 60 连胜完美收官。人们对于机器学习的热情再度被点燃起来。

机器学习的热度如此高,大家也许会需要查找相关资源进行学习和研究。本文整理了一份优秀的开源的有关机器学习的框架 、平台、系统、库和工具包的列表。

平台和系统

  • TensorFlow — TensorFlow 是谷歌的第二代机器学习系统,内建深度学习的扩展支持,任何能够用计算流图形来表达的计算,都可以使用 TensorFlow
  • PaddlePaddle — 百度研发的深度学习平台,具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持
  • Apache SINGA — SINGA 是基于大型数据集训练,大型深度学习模块的常规分布式学习平台。SINGA 支持各种流行的深度学习模块
  • Scikit Flow — TensorFlow 的简化接口,模仿 Scikit 学习,用户可在预测分析和数据挖掘中使用
  • VELES — 分布式深度学习应用系统,用户只需要提供参数,剩下的都可以交给 VELES。VELES 是三星开发的另一个 TensorFlow
  • SpeeDO — 为通用硬件设计的并行深度学习系统。SpeeDO 不需要特殊的 I/O 硬件,支持 CPU/GPU 集群,可以很方便地在各种云端环境上部署,如 AWS、Google GCE、Microsoft Azure 等等

框架

  • Torchnet — Facebook 为加快 A.I 研究而开源的深度学习框架
  • LightGBM — 微软开源的一个实现 GBDT 算法的框架,支持高效率的并行训练。旨在解决 GBDT 在海量数据遇到的问题,让 GBDT 可以更好更快地用于工业实践
  • Guagua — Hadoop 迭代式计算框架 Guagua 是 PayPal 的一个开源机器学习框架 Shifu 的子项目,主要解决模型训练的分布式问题
  • Chainer — Chainer 在深度学习的理论算法和实际应用之间架起一座桥梁,深度学习的灵活框架
  • Shifu — 基于 Hadoop 的快速和可伸缩的机器学习框架
  • KeystoneML — 用 Scala 编写的框架,旨在简化构造大规模、端到端的机器学习管道,基于 Apache Spark 构建
  • LightNet — 轻量级,多功能,完全基于 Matlab 的深度学习框架。目的是为深度学习研究提供一个易于理解、易于使用和高效的计算平台
  • DeepLearningKit — 针对 iOS、OS X 和 tvOS 的开源深度学习框架
  • GoLearn — GoLearn 是一款 Go 语言实现的机器学习框架
  • YCML — 使用 Objective-C 编写的机器学习框架,也支持 Swift

工具包和库

  • DMTK — 微软开源的分布式机器学习工具包,包括 DMTK 分布式机器学习框架、用于训练主题模型的 LightLDA以及分布式词向量
  • CNTK — 微软开源的用于语音识别的深度学习工具包,借助 GPU 的能力,该工具包的效率相当高
  • DSSTNE — 亚马逊开源的深度学习工具,能同时支持两个图形处理器(GPU)参与运算,主要用作智能搜索和推荐
  • Scikit-learn — Python 的机器学习项目,简洁、高效的算法库,提供一系列的监督学习和无监督学习的算法,用于数据挖掘和数据分析。SciKit-learn 几乎覆盖了机器学习的所有主流算法
  • Deeplearning4j — 为 Java 和 Scala 编写的首个商业级开源分布式深度学习库,为商业环境所设计,以即插即用为目标,通过更多预设的使用,避免太多配置,让非研究人员也能够进行快速的原型制作
  • MXNet — 轻量级且灵活高效的深度学习库,允许使用混合符号编程和命令式编程
  • CaffeOnSpark — 雅虎开源的基于 Hadoop/Spark 的分布式深度学习包
  • BigDL — 英特尔开源的基于 Apache Spark 的分布式深度学习库,支持高性能大数据分析
  • Swift AI — 高性能的人工智能和机器学习库,完全用 Swift 编写,目前支持 iOS 和 OS X,包括一组人工智能和机器学习的通用工具
  • Gorgonia — Go 机器学习库,用于撰写和评估多维数组的数学公式。与 Theano 和 TensorFlow 理念相似,支持 GPU/CUDA,支持分布式计算
  • Shark C++ — 快速、模块化、功能丰富的开源 C++ 机器学习库,提供了各种机器学习相关技术,比如线性/非线性优化、基于内核学习算法、神经网络等
  • MLPACK — C++ 的机器学习库,亮点在于其扩展性、高速性和易用性。旨在让新用户通过简单、一致的 API 使用机器学习,同时为专业用户提供 C++ 的高性能和最大灵活性
  • smile — 包含各种现有的机器学习算法的 Java 库。例如邻接表和矩阵图算法、基于 Swing 的可视化库等
  • PredictionIO — 开源的机器学习服务器,开发工程师和数据分析师可以使用它构建智能应用程序,还可以做一些预测功能,比如个性化推荐、发现内容等
  • Aerosolve — 支撑 Airbnb 定价建议系统的机器学习引擎
  • Vowpal Wabbit — 机器学习系统,它利用诸如在线,散列,减少,缩减,学习,搜索,主动和交互式学习等技术推动机器学习技术的前沿发展
  • Apache SystemML — SystemML 是灵活的、可伸缩机器学习 (ML) 语言,使用 Java 编写。它提供自动优化功能,通过数据和集群特性保证高效和可伸缩。SystemML 可在 MapReduce 或者 Spark 环境中运行

本文作者:佚名

来源:51CTO

时间: 2024-10-03 00:45:35

可能是2017最全的机器学习开源项目列表的相关文章

Hadoop创始人寄语2017:五种让开源项目成功的方法

搭建一个开源平台,组织就能利用云供应商套利来降低成本 由于Doug Cutting和Apache软件基金会有多年的合作关系,于是经常被问到"什么是开源技术的未来?".Doug的回应一般要么是"我不知道",要么是"有无穷的可能性". 在过去的一年中,我们已经看到开源技术强势的发展成了企业的技术主流.谁会想到十年前Doug在Hadoop所做的工作会影响到那么多的行业,从制造到电信,再到金融等等.它们都掌握了开源生态系统的力量,不仅改善了客户的体验,变

Hadoop创始人Doug Cutting寄语2017:五种让开源项目成功的方法

搭建一个开源平台,组织就能利用云供应商套利来降低成本 由于Doug Cutting和Apache软件基金会有多年的合作关系,于是经常被问到"什么是开源技术的未来?".Doug的回应一般要么是"我不知道",要么是"有无穷的可能性". 在过去的一年中,我们已经看到开源技术强势的发展成了企业的技术主流.谁会想到十年前Doug在Hadoop所做的工作会影响到那么多的行业,从制造到电信,再到金融等等.它们都掌握了开源生态系统的力量,不仅改善了客户的体验,变

十大Python机器学习开源项目

1.Scikit-learn 用于数据挖掘和数据分析的简单而有效的工具,基于NumPy,SciPy和matplotlib,开源,商业可用的BSD许可证. Commits: 21486, Contributors: 736, Github地址: Scikit-learn 2.Tensorflow  最初由Google机器智能研究机构的Google Brain小组的研究人员和工程师开发. 该系统旨在促进机器学习的研究,并使其快速和容易地从研究原型过渡到生产系统. Commits: 10466, Co

五个鲜为人知,但又不可不知的机器学习开源项目

借着人工智能的热潮,各种机器学习项目也迎来了一个爆发期.其中有一些因为背后的巨头支持或者稳定可靠的性能而广为人知,例如Tensorflow.Caffe和Theano等.但实际上,有为数更多的项目却并不为人所知.在这些相对小众的项目中,是否隐藏着一些版本迭代积极,且具有一定参考价值的项目?答案显然是肯定的. 本文将介绍的这五个小众项目来自不同的生态系统和编程语言,并且版本更新活跃,具有一定的参考价值.或许你会觉得了解这些小众的项目并没有太多实际意义,但本文的原作者Matthew Mayo,一位资深

GitHub上史上最全的Android开源项目分类汇总

今天在看博客的时候,无意中发现了 @Trinea在GitHub上的一个项目 Android开源项目分类汇总,由于类容太多了,我没有一个个完整地看完,但是里面介绍的开源项目都非常有参考价值,包括很炫的界面特效设计.个性化控件.工具库.优秀的Android开源项目.开发测试工具.优秀个人和团体等.可以这样说,每一位Andorid开发人员都能从中找到一个或多个适用自己项目的解决方案,消化吸收并加以利用,可以为自己的APP增色不少.文章最后还列出了部分国外著名Android开发者的信息,包括GitHub

史上最全的iOS开源项目分类汇总

楼主转载的,并未亲自测试 Category/Util  sstoolkit 一套Category类型的库,附带很多自定义控件 功能不错-        BFKit 又一套Category类型的 Kit,还有几个工具类        APUtils 又一套Category类型的 Kit        QSKit 又一套Category类型的 Kit        iOS-Categories 又一套Category类型的 Kit        BlocksKit 将Block风格带入UIKit和F

NASA 美国国家航空航天局开源项目列表

美国宇航局,即 NASA ,将 253 个软件项目开源目前托管在 Gitithub上(https://github.com/nasa),NASA 希望可以通过开源收获更多项目改进的建议,同时NASA也希望用户可以给NASA提交项目,为此专门开通了官方的开源网站 Code NASA . Livingstone2 -- 人工智能(AI)软件系统 Livingstone2 是一个可重用的人工智能(AI)软件系统,旨在帮助飞船生命支持系统.化工厂或其他复杂系统在操作强劲以最小的人力监督,即使面对硬件故障

BAT 在下一盘大棋?深度盘点国内四大机器学习开源平台

2015-2016 的机器学习平台开源大潮中,美国是当之无愧的引领者:无论是谷歌.亚马逊.微软.IBM 等互联网巨头,还是美国各大科研院所,为开源世界贡献了品类繁多的机器学习工具.这其中不乏华人的身影,比如开发出 Caffe 的贾杨清. 但在大陆这边,无论是 BAT 还是学界,在开源机器学习项目上始终慢了一拍,令人十分遗憾.这与我国世界最大 AI 研究者社区.占据 AI 科研领域半壁江山的江湖地位*颇为不符.让人欣喜的是,2016 下半年,百度和腾讯先后发布了它们的开源平台战略.虽然姗姗来迟,但

盘点四大民间机器学习开源框架:Theano、Caffe、Torch 和 SciKit-learn

本期,我们将带领大家来看看诞生于民间(学界)的另外四大开源项目: 1. Theano Theano 在深度学习框架中是祖师级的存在.它的开发始于 2007,早期开发者包括传奇人物 Yoshua Bengio 和 Ian Goodfellow. Theano 基于 Python,是一个擅长处理多维数组的库(这方面它类似于 NumPy).当与其他深度学习库结合起来,它十分适合数据探索.它为执行深度学习中大规模神经网络算法的运算所设计.其实,它可以被更好地理解为一个数学表达式的编译器:用符号式语言定义