Open Source Insider令人值得关注的是,Apache Software Foundation本月接受了MXNet机器学习项目(MXNet Machine Learning)作为一个开放源代码项目。
这个公告最让人惊讶的并不是ASF在众多选择中接受了这个项目,现在在软件世界里如果没有机器学习工具就很难翻身,而是MXNet的开发人员绝大部分都来自于亚马逊,他们相信ASF是相关的。
MXNet是一个开放源代码的“深度学习”框架,允许您在各种设备上定义、训练和部署所谓的神经网络。它也恰好是Amazon Web Services(AWS)上机器学习(ML)工具的选择,并且通过已经部署好的EC2实例可用。
深度学习是目前非常流行的机器学习的子集,专注于具有非线性的分层算法,这有助于在数据集中找到模式和学习陈述。说它在发现的时候学习,这是一种奇怪的说法。由于它在语音识别、自然语言理解和推荐系统(例如Siri、Alexa等)等应用程序中取得了成功,深度学习目前广受欢迎。每次当你坐在沙发上对着Alexa大喊大叫,都是在使用深度学习系统。
亚马逊声称MXNet是该公司拥有的最具扩展性的工具,这让MXNet在现在这个阶段变得非常有趣,亚马逊可是一家知道哪些东西具有扩展性而哪些东西没有扩展性的公司。
MXNet远非深度学习领域唯一的宠儿。事实上,它加入这场游戏的时候已经有点晚了。深度学习世界中的其他流行工具包括在Facebook、谷歌和NYU使用的Torch以及微软的Adam,但也许最大的直接竞争对手是谷歌的TensorFlow。TensorFlow是开放源代码的,使用Apache许可证,并在本月发布了1.0版本,客户已经开始使用了。
谷歌在AWS上使用Tensorflow已经超过一年了。谷歌已经在旗下很多谷歌服务,例如Gmail和Google Photos上使用它,而且谷歌在2015年11月针对满怀热情的测试者们提供了一个稳定的版本,比AWS收购MXNet早了整整12个月。去年六月,谷歌声称Github上有1500个存储库提到了TensorFlow,其中只有五个来自于谷歌自己。
如果你是开放源代码世界中的新人,机器学习工具和开发人员通常都是如此,那么你对于ASF缺乏真正的了解是可以被原谅的。
即使你非常熟悉ASF,你可能仍然好奇为什么像亚马逊这样一家数十亿美元的公司会对于一个全是由志愿者组成的团体采用其宠爱的项目感到如此兴奋?要知道ASF一年的运营费用才几乎不到50万美元。
答案只用一个词就够了:社区。
ASF成立于1999年,完全由捐款资助,ASF系统首先帮助Apache HTTP服务器成为网络上最受欢迎的网络服务器。这一成功公式已经被一些最新的成功重复证实,包括Hadoop、 Spark、Tomcat和Struts。在受到对OpenOffice破坏性的控制的伤害之后,Oracle将OpenOffice放到ASF中,希望以此帮助其得到更广泛的采用。
ASF孵化器的目的是帮助外部项目提高他们的代码的质量,并参与更大的社区。它是一种开放源代码项目的盖章认可,证明项目是真正开放源代码的,并使用ASF的表决程序和ASF已经开发的所有其他的准民主治理体系,也就是被神圣化地成为Apache Way的方法。
考虑到这种社区和TensorFlow社区之间的选择,ToxFlow社区虽然是开放源代码的,但却在很大程度上受到谷歌的管理,MXNet就变得看起来更具吸引力。而且它的吸引力越大,参与的开发者就会越多,而代码也会越好。如果你从机器学习的角度来思考它的话,那么ASF就是一个开发人员的学习网络。
值得注意的是,并非所有进入ASF孵化器的项目都能够“脱离父母”。但正式的项目在能够证明自己独立于任何一个贡献者或者赞助实体之前,都不能完成孵化阶段。
孵化是一个项目成为ASF正式项目的第一步,但不能保证项目在ASF的支持下最终会成功还是终止。
孵化器的成功项目包括Cassandra、CouchDB、Mesos以及其他很多项目。还有OpenOffice,另一个孵化器的“毕业生”,但是它的风头在很大程度上被LibreOffice夺走了。
现在亚马逊希望MXNet可以从ASF学到一些技巧,或许建立一个可以帮助其赶上竞争对手的社区。作为AWS人工智能的总经理,Matt Wood表示,该项目希望成为Apache孵化器的一部分的原因是“利用Apache Software Foundation的流程、管理、外延和社区活动。
简而言之,想利用ASF的影响力来吸引更多的开发者。很容易看明白亚马逊的这一举动是完全为了自己,事实上也是如此,但这只是这个故事的开始。
也许ASF的名字不再家喻户晓,但它仍然有相当的影响力,它的治理和所谓的Apache Way真的发展出了一些令人印象深刻、发展得非常好的社区项目。由于MXNet背后的原因,它打败TensorFlow和其他产品的可能性相当大。
当然,ASF可能得到的是迄今为止最好的机器学习项目。MXNet当然是最容易部署的一种,因为已经有一个AWS深度学习AMI可用了,还有大量的预编译好并已经为使用做好准备的示例代码。之前提到的服务器实例恰好与其他AWS服务密切相关,而用户可能想要投资的服务器实例也是如此。
原文发布时间为:2017年2月26日
本文作者:作者:李超
本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。