想知道 GitHub 上各开源项目的生存状况如何?这个软件告诉你!

这是一个针对 GitHub 资源库的交互式数据分析与可视化工具,能方便地对各开源算法库的活动、状态、人气进行比对,包括新 commits 和 pull requests。开发者可用它来考察开源项目大趋势,以及筛选感兴趣的项目。顺便说一句,它免费使用。

它基于 GitHub 和谷歌去年公开的 3TB GitHub 项目数据。

据雷锋网了解,操作它不需要写代码,界面简洁。因此,即便是新手也能轻松使用,用它来挖掘 GitHub 项目信息,在时间轴上与趋势进行交互。另外,数据范围也可任意调节。

DataScience Inc. CTO William Mercha 表示:

“当下,正是开源工具不断蚕食有偿解决方案市场空间的时候。使用 DataScience Trends 挖掘出的开源项目信息,对于需要找到合适开源软件的开发团队非常宝贵。去年在 Burtch Works 的市场调查中,有 62% 的数据分析从业者表示,相比经典解决方案 SAS,他们更倾向于使用开源语言 Python 和 R。在企业级领域,这是一个市场大趋势。

在  GitHub 文档里,有许多可探索的领域。比如某个资源库的热门程度(从星标数量、书签收藏数量获知) ,还有开源工具集的合作(从 pull requests 看出)。

我们使用 DataScience Trends 来寻找最受欢迎的开源工具,然后把它们整合入我们的企业平台  DataScience Cloud。比如,我们通过 DataScience Trends 能清楚看出,TensorFlow 刺激了开发者对与之兼容的神经网络库 Keras 的兴趣;还有,数据可视化工具 ggplot 在 Python 开发者群体中的影响力不断壮大。随着 GitHub 的存档不断增长,DataScience Trends 用户能够挖掘出更多的有价值信息。“

由于数据集多达 3 TB,DataScience Trends 带来的探索可能性几乎是无限的。它覆盖了一万个最热门 GitHub 资源库的数据,包含项目开发活动、流行程度、合作等方面的信息。此外,DataScience Trends 还内置了其它几项功能,以方便探索开源软件数据:

  • 具体日期与数值

    用户可利用任意数据可视化方法,来观察某一日期节点的数据与数值。

  • 标准化的比较趋势

    任意大小、任意流行度的算法库,可通过一个通用检索框架来进行比较。只需一次点击,就能从“相对”视图返回到“绝对值”视图。

  • 共享功能

    每次探索都会生成一个独立的 URL。当然,用户也可点击“共享”图标。

本文作者:三川

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-29 11:59:35

想知道 GitHub 上各开源项目的生存状况如何?这个软件告诉你!的相关文章

go语言项目如何引用依赖Github上的开源项目

用go语言写项目时,难免会引用到一些Github上的开源项目,下面说说在开发时如何引用. 系统:windows Go:1.3.1 开发工具:LiteIDE 比如: 1 2 3 4 5 6 7 import ( "bytes" "fmt" "github.com/yankai913/go-tools/timetool" "net" "os" ) 当正确引用后,在写"timetool."时,

如何使用github上的开源项目?

问题描述 如何使用github上的开源项目? 以slidingMenu为例:如何把下载下来的项目运行起来?可以看到效果? 我自己的理解是: example中是开源作者的事例代码 library类似于是依赖的jar包 1.把library以import-Existing Android Code Into Workspace引入到Eclipse中 2.把example以Existing project into workspace 导入到Eclipse中 3.把exmple项目导入library,

ios-iOS 在github上的开源项目下载到本地 ,怎么使用?

问题描述 iOS 在github上的开源项目下载到本地 ,怎么使用? 这都是干什么用的? 解决方案 Github上600多个iOS开源项目Github上600多个iOS开源项目Github上600多个iOS开源项目 解决方案二: 直接导入啊!将改工程导入到项目里 解决方案三: example里面打开项目就可以看例子

github上的开源项目

    Wagn 是一个采用 Ruby on Rails 开发的Wiki 软件.   你相信用100行代码可以实现一个博客吗?用Sinatra框架就可以做到. Sinatra一个ruby轻量级的Web框架,封装了Web开发的DSL.   Rainbows! 是一个为 Rack 应用而开发的 HTTP 服务器,基于 Unicorn .主要为一些长时间请求和慢速的客户端而设计. 该版本是一个重要的里程碑版本,对内部的很多API进行了重构,使用非阻塞IO对性能方面有很大的提升,修复了一些bug.  

怎样在Github上托管开源代码库

怎样在Github上托管开源代码库 大家好,今天我们要学习一下怎样在github.com提供的仓库中托管开源软件源代码.GitHub是一个基于web的Git仓库托管服务,提供基于 git 的分布式版本控制和源代码管理(SCM)功能,并加入了自身的特点.它给开源项目和私有项目提供了一个互相协作的工作区.代码预览和代码管理功能.不像Git是一个完完全全的命令行工具,GitHub提供了一个基于web的图形化界面和桌面,也整合了手机操作.GitHub同时提供了私有库付费计划和通常用来管理开源软件项目的免

android-如何托管项目到github上如何托管项目到github上

问题描述 如何托管项目到github上如何托管项目到github上 如何托管项目到github上如何托管项目到github上如何托管项目到github上 解决方案 http://blog.csdn.net/lxk_1993/article/details/50441442 解决方案二: 下载一个github客户端直接在本地上传,比较方便

将项目从 CVS 转 Git 并和 Github 上 Fork 的项目合并的详细步骤

在捣鼓我的 Gregarius 时,发现无法读取 HTTPS 的 RSS , 追查发现是他所使用的 HTTP 客户端类 Snoopy 的原因. 想升级新版 Snoopy 却发现原作者已经几年都不更新了, Github 上倒是有人弄了几个镜像, 其中 hurrycaner 的这个 还对 README 进行了一些改进. 但所有镜像都没有 SourceForge 上的修改历史. 所以,我想作的是,基于 hurrycaner 的镜像进行 Fork, 但是要把 SourceForge 上的修改历史也弄进来

版本控制CVS转到分布式Git并和Github上Fork的项目合并

在捣鼓我的 Gregarius 时,发现无法读取 HTTPS 的 RSS , 追查发现是他所使用的 HTTP 客户端类 Snoopy 的原因. 想升级新版 Snoopy 却发现原作者已经几年都不更新了, Github 上倒是有人弄了几个镜像, 其中 hurrycaner 的这个 还对 README 进行了一些改进. 但所有镜像都没有 SourceForge 上的修改历史. 所以,我想作的是,基于 hurrycaner 的镜像进行 Fork, 但是要把 SourceForge 上的修改历史也弄进来

我在Github上的flare-spark项目

Flare-Spark 介绍 我在自己的github上建了个flare-spark项目,本身是Apache Spark项目Master分支的镜像.在Spark的基础上,增加了flare子项目. 预计大多数改动都会增量添加到flare子项目里,尽量不改变Spark本身的代码. 新增的代码都会在线下机器上编译.运行成功之后再提交上来. 对于flare-spark项目的维护和新增逻辑如下图: 新的代码在线下编译测试通过之后,提向develop分支,再以PR的形式merge到master主干. 同时不定