一些开源的数据挖掘系统/软件

 Data Scientist


  • Orange   
    Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++
    和 Python开发,它的图形库是由跨平台的Qt框架开发。
  • Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了
    Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。
  • RapidMiner 
    RapidMiner, 以前叫 YALE (Yet Another Learning Environment), 其是一个给机器学习和数据挖掘和分析的试验环境,同时用于研究了真实世界数据挖掘。它提供的实验由大量的算子组成,而这些算子由详细的XML
    文件记录,并被RapidMiner图形化的用户接口表现出来。RapidMiner为主要的机器学习过程提供了超过500算子,并且,其结合了学习方案 和Weka学习环境的属性评估器。它是一个独立的工具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到你的产品中。(15年使用较多)
  • RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。

    功能和特点
    免费提供数据挖掘技术和库
    100%用Java代码(可运行在操作系统)
    数据挖掘过程简单,强大和直观
    内部XML保证了标准化的格式来表示交换数据挖掘过程 
    可以用简单脚本语言自动进行大规模进程
    多层次的数据视图,确保有效和透明的数据
    图形用户界面的互动原型
    命令行(批处理模式)自动大规模应用
    Java API(应用编程接口)
    简单的插件和推广机制
    强大的可视化引擎,许多尖端的高维数据的可视化建模 
    400多个数据挖掘运营商支持
    耶鲁大学已成功地应用在许多不同的应用领域,包括文本挖掘,多媒体挖掘,功能设计,数据流挖掘,集成开发的方法和分布式数据挖掘

  • Weka
    Weka 由Java开发的 Weka (Waikato Environment for Knowledge Analysis) 是一个知名机器学机软件,其支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。其技术基于假设数据是以一种单个文
    件或关联的,在那里,每个数据点都被许多属性标注。 Weka 使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。它主要的用户接品是Explorer,也同样支持相同功能的命令 行,或是一种基于组件的知识流接口。
  • WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。

    WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

    如果想自己实现数据挖掘算法的话,可以看一看weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。

    2005年8月,在第11届ACM SIGKDD国际会议上,怀卡托大学的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习 历史上的里程碑,是现今最完备的数据挖掘工具之一(已有11年的发展历史)。Weka的每月下载次数已超过万次。

  • JHepWork
    为科学家,工程师和学生所设计的 jHepWork 是一个免费的开源数据分析框架,其主要是用开源库来创建 一个数据分析环境,并提供了丰富的用户接口,以此来和那些收费的的软件竞争。它主要是为了科学计算用的二维和三维的制图,并包含了用Java实现的数学科
    学库,随机数,和其它的数据挖掘算法。 jHepWork 是基于一个高级的编程语言 Jython,当然,Java代码同样可以用来调用 jHepWork 的数学和图形库。

  • jHepWork是一套功能完整的面向对象科学数据分析框架。 Jython宏是用来展示一维和二维直方图的数据。该程序包括许多工具,可以用来和二维三维的科学图形进行互动。
  • KNIME
    KNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。它给了用户有能力以可视化的方式创建数据流或数据通道,可选择性
    地运行一些或全部的分析步骤,并以后面研究结果,模型 以及 可交互的视图。 KNIME 由Java写成,其基于 Eclipse 并通过插件的方式来提供更多的功能。通过以插件的文件,用户可以为文件,图片,和时间序列加入处理模块,并可以集成到其它各种各样的开源项目中,比如:R 语言,Weka, Chemistry Development Kit, 和 LibSVM.
  • KNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。它给了用户有能力以可视化的方式创建数据流或数据通道,可选择性地运行一些或全部的分析步骤,并以后面研究结果,模型
    以及 可交互的视图。 KNIME 由Java写成,其基于 Eclipse 并通过插件的方式来提供更多的功能。通过以插件的文件,用户可以为文件,图片,和时间序列加入处理模块,并可以集成到其它各种各样的开源项目中,比如:R
    语言
    Weka
    Chemistry Development Kit, 和 LibSVM.
时间: 2024-11-01 07:29:17

一些开源的数据挖掘系统/软件的相关文章

电商新手盘点八款开源网店系统

中介交易 SEO诊断 淘宝客 云主机 技术大厅 全球电子商务巨头Amazon当家人贝索斯说过,"在现实世界的商店最有力的武器就是地段,地段,地段,而对于我们来说最重要的三件事就是技术,技术,技术."可想而知,若要进军电子商务,网店系统的地位举足轻重,强大的系统在工作效率.业务实现等更给力. 经过网站技术的迅速发展,如今,想在多达数十种网店系统中,挑选一套适合自身需要的绝非易事,相信很多朋友并不希望在这个问题上纠结太久.最近笔者也顺便关注了一下这方面的信息,下面,本文就盘点一下认为八款不

免费开源web oa系统

 [ 大型PHP开源OA办公系统(OA软件) v2.0 ] 下载地址: V2.0.20131008_A5.zip  115网盘礼包码:5lbb2x23esw3 http://115.com/lb/5lbb2x23esw3 或: http://pan.baidu.com/s/1o6FjIeY     备注:解决了在部份Linux环境下不能安装的问题! 天生创想OA办公系统为国内首家开源OA软件产商,采用领先的B/S架构.跨平台语言(php+MySQL)等灵活应用, 是中国用户群最广泛的OA软件之一

TCExam基于网络的开源在线考试系统 v11.1发布

TCExam是一款基于网络的开源在线考试系统,用于在线试题的生成.管理等方面.最近,在线考试作为替代传统"纸笔考试"的一种方法逐步在很多学 校和企 业流行起来,这种方法能够大大简化整个考试流程,将出题.考试.管理.阅卷等常规过程一并纳入一个系统中,不仅减少了人力,而且极大的提高了整个效率和考 试结果的可信度. 开源通过支持独立的同行审查和迅速发展的源代码软件的可靠性和质量.通过开源模式通过派生的一般优点是: 开放性:所有的开放源码的优势是其开放性的结果.具有代码可以很容易地http:/

EduSoHo开源网络课堂 系统“开源”机构“节流”

在线教育这两年十分火热, 2011年开始,各种类型和名称的在线教育网站就开始冒头,甚至连百度.腾讯.阿里等互联网巨头也声势浩大地加入,但是在这股浪潮里,却很少能听到传统教育机构,尤其是中小型教育机构的声音. 教育机构:开拓在线教育市场 遭遇技术难题 主要原因是"技术"这个门槛的存在.对于教育机构而言,要进入在线教育领域一般有三种选择:自己开发程序.购买现成程序或入驻第三方平台.这三种方案都有各自的优势,但是缺憾或制约也同样明显. 第一种方案的优点在于量身定制.不同领域或行业的教育机构在

谷歌开源深度学习系统TensorFlow 的图片文字说明模型

谷歌开源深度学习系统TensorFlow 的图片文字说明模型 责任编辑:editor007 作者:aiko |  2016-09-23 22:27:27 本文摘自:36kr   今天,谷歌宣布开源图片文字说明模型 Show and Tell,该模型具有自动生成图片文字说明的功能,准确率达 93.9%. 谷歌于 2014 年发表论文首次介绍了 Show and Tell 这一系统模型,在 2015 年又对其进行了内容更新,对相关技术做了更加准确的改进.之后,谷歌一直在完善这一技术,最终作为谷歌 T

Python Flask开源博客系统Blog_mini

  本博文在51CTO技术博客首发.         开源不易,Python良心之作,真心送给广大朋友,恳请给予支持,不胜感激!                  大家可以从下面的地址中去体验Blog_mini的功能,我把副本部署在了腾讯云上供大家使用: 地址:Blog_mini 账号:blog_mini@163.com 密码:blog_mini 0.Blog_mini送给你们:让每个人都轻松拥有可管理的个人博客         你从未架设过服务器或网站,希望可以接触一下这方面的知识--    

FileZilla Client v3.4.0发布 免费开源的FTP客户端软件

FileZilla是一个免费开源的FTPhttp://www.aliyun.com/zixun/aggregation/5218.html">客户端软件,分为客户端版本和服务器版本,具备所有的FTP软件功能.可控性.有条理的界面和管理多站点的简化方式使得Filezilla客户端版成为一个方便高效的FTP客户端工具,而FileZilla Server则是一个小巧并且可靠的支持FTP&SFTP的FTP服务器软件. 更新日志: FileZilla Client 3.4.0 release

在Ubuntu上部署开源博客系统Blog_mini

0.说明         本文为开源博客系统Blog_mini的官方部署文档,通过本文的阅读,你将可以在一个全新的CentOS系统上完全部署Blog_mini,从而成功架设属于你的个人博客网站.         这里使用的操作系统为:Ubuntu 15.10,理论上,只要操作系统上安装的Python版本为2.6.x或2.7.x,都可以成功部署Blog_mini. 1.获取Blog_mini源代码         有以下两种方式可以获取Blog_mini的源代码: 通过git的方式 通过Blog_

在CentOS上部署开源博客系统Blog_mini

0.说明         本文为开源博客系统Blog_mini的官方部署文档,通过本文的阅读,你将可以在一个全新的CentOS系统上完全部署Blog_mini,从而成功架设属于你的个人博客网站.         这里使用的操作系统为:CentOS 6.5,理论上,只要操作系统上安装的Python版本为2.6.x或2.7.x,都可以成功部署Blog_mini. 1.获取Blog_mini源代码         有以下两种方式可以获取Blog_mini的源代码: 通过git的方式 通过Blog_mi