单机模式处理大数据的一些开源利器

1. LibFM:&">nbsp;项目主页

2. Svdfeature: 项目主页

3. Libsvm和Liblinear: libsvm项目主页、 liblinear项目主页、 初次使用必读、 libsvm的开发心得by林智仁

4. rt-rank: 项目主页

5. Mahout: 项目主页

6. MyMediaLite: 项目主页

7. GraphLab 和 GraphChi: GraphLab项目主页、 GraphChi项目主页、 GraphChi的下载地址、GraphChi介绍、 CF for GraphChi

时间: 2024-10-04 00:27:49

单机模式处理大数据的一些开源利器的相关文章

中国联通赵越:打通数据源到数据应用,大平台模式发展大数据

从共同意识的"大爆炸",到打开应用大门,大数据风暴已经席卷到生活的各个角落,不仅是是一场技术革命,也是一场经济变革,更是社会治理的变革.运营商大数据在数据集中.应用探索的基础上,正在走向基于专业化.市场化.公司化的实践和运作阶段.用大平台模式发展大数据,为社会创造价值,成为国家产业升级和经济转型的新动能. 在"517世界电信和信息社会日主题论坛"上,中国联通宽带在线有限公司副总经理赵越在发言中表示:"在政策与市场的双重驱动下,运营商有如抓住微笑曲线的两端,

《Hadoop与大数据挖掘》——第2章 大数据存储与运算利器—Hadoop 2.1 Hadoop概述

第2章 大数据存储与运算利器-Hadoop 本章主要介绍了Hadoop框架的概念.架构.组件.生态系统以及Hadoop相关编程,特别是针对Hadoop组件HDFS.MapReduce.YARN,Hadoop MapReduce编程做了较详细的介绍.在介绍各个知识点的同时,结合动手实践章节,帮助读者理解对应的内容. 2.1 Hadoop概述 2.1.1 Hadoop简介 随着现代社会的发展,各种信息数据存量与增量都非常大,很多情况下需要我们能够对TB级,甚至PB级数据集进行存储和快速分析,然而单机

大数据搜索选开源还是商业软件?ElasticSearch 对比 Splunk

本文就架构,功能,产品线,概念等方面就ElasticSearch和Splunk做了一下全方位的对比,希望能够大家在制定大数据搜索方案的时候有所帮助. 简介 ElasticSearch (1)(2)是一个基于Lucene的开源搜索服务.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便. E

改变传统客服模式,大数据提升客户体验的创新与实践

步入互联网时代,高速的信息交换渠道和多样的数据呈现视角,为消费者提供了全新的信息获取方式和更加开放的意见交流平台.在移动互联网.新媒体处于风口浪尖,人工智能.云服务方兴未艾的大数据跳跃式发展时期,用户获取信息的渠道与投诉反馈方式正发生着翻天覆地的变化:当越来越多的消费者利用互联网和新媒体手段,以更加直接.快捷.高效的方式完成消费决策.购买过程及服务反馈时,传统"应答式"的服务模式正面临着前所未有的挑战. 客户服务中心,或称呼叫中心,近年来一直处于一个非常尴尬的位置:面对愈发多元化的信息

如何逃出大数据困境?开源或是关键手段

现在的数据不再整齐划一地按行和列排列,而是大规模地以非结构化形式堆放在数据库中.企业创建.收集.访问.分享和分析这些不同类型的数据以提高经营业绩.曾经用于进行数据分析的商业智能已经不再适用于目前的异构http://www.aliyun.com/zixun/aggregation/18278.html">数据类型,包括电子邮件.字处理文档.协作网站和机器生成的数据等. 与此同时,繁琐和昂贵的专有企业搜索产品不能处理现有的结构化数据存储,并且不能以具有成本效益的方式来测量数据的规模和速度.现在

Jasppersoft:2012年Q2大数据报告:开源势头不减

报告显示,人们对大数据开源软件的兴趣持续增长,无论是构建大数据http://www.aliyun.com/zixun/aggregation/13748.html">基础架构的NoSQL数据库和Hadoop扩展,还是相关软件和连接器(Connectors)的下载量都在持续升温. 在今天加州举行的Hadoop峰会上,开源BI提供商Jasppersoft发布了今年第二季度的大数据指数报告(存储.分析.虚拟化),报告的数据来自JasperForge社区. 报告的关键发现如下: ● 2012年大数

大数据里的小利器

如今,90%的数据分析师都在谈大数据,在大数据的背景之下,数据分析师收集数据的边界在哪里?又该如何运用数据呢?作者在美国参加Strata 2012大会期间,跟很多数据中人交流,其中前LinkedInhttp://www.aliyun.com/zixun/aggregation/5913.html">首席科学家DJ Patil给他的印象最深. 对话:先有需求,后有数据 车品觉:我有一个问题一直很困惑,现在的企业获取数据很容易,并且数据的增长速度非常之快,那么对于公司来说,到底要收集什么数据呢

大数据如何成为安全生产“利器”

信息化一方面加速了安全生产事故信息传播速度,导致安全生产的被关注度空前高涨,另一方面,也为解决安全生产问题带来了"利器"--大数据.当前,大数据正以惊人的速度渗透到越来越多的领域,电商.零售商.IT企业等应用大数据的成功案例屡见不鲜.大数据在安全生产中的应用,最基本的功能就是从海量的安全生产数据中寻找事故发生的规律.预测未来,从而对症下药,有效遏制事故的发生.同时,大数据在提升安全监管能力和明确安全责任方面也可发挥重要作用. 大数据对安全生产意义非凡 将大数据用到安全生产中,可提升源头

高负荷大数据量建站利器--Biweb

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 最近总是有站长朋友问我写一些目前市场主流建站工具的文章,我想这也是有必要的,最近将陆续为大家进行主流建站程序的特点剖析与讲解,希望能够帮助到每一个站长朋友. 今天首先给大家讲解组建高负荷,大流量网站要用的建站程序,如有补充,欢迎提出. 如果想建大流量,高负荷承载力的网站,那BIWEB将是一个很好的选择. BIWEB建站程序是上海网务网络公司花