免费教材资源第二弹!这回侧重数据科学

昨天与大家分享了最值得一读的机器学习免费书籍。这次,雷锋网再为大家呈上数据科学领域的相关图书、教程。仍然是正版免费,仍然是英文原著,部分有汉语译本。

本列表不分先后次序。

█《Foundations of Data Science》

作者:John Hopcroft, Ravindran Kannan

未出版的教学笔记。正在学习数据科学理论课程的童鞋,这本书是一个不错的补充。

地址:https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/book-No-Solutions-Aug-21-2014.pdf 

█《UFLDL Tutorial》

作者:吴恩达, Jiquan Ngiam, Chuan Yu Foo, Yifan Mai, Caroline Suen

吴老师等斯坦福学者整理的教程, 讲解无监督特征学习和深度学习的主要概念,以及相关算法的实现和应用。需要基础机器学习知识。吴老师建议修完他的 Coursera 机器学习公开课再来读这个。

地址:http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial 

█《Python Data Science Handbook》

作者:Jake VanderPlas

书如其名,介绍用 Python 进行数据开发的主流工具库,包括 IPython, NumPy, Pandas, Matplotlib, Scikit-Learn。 O'Reilly Media 出版。

地址:https://github.com/jakevdp/PythonDataScienceHandbook 

█《Hands-On Machine Learning and Big Data》

作者:Kareem Alkaseer 

这本以墙皮为封面的书,是理解机器学习和大数据基本概念的好去处,包含大量代码示例。

地址:https://www.gitbook.com/book/kalkaseer/hands-on-ml-and-bigdata/details 

█《Think Stats》

作者:Allen B. Downey

针对 Python 开发者的概率论和统计学入门。这本书十分强调用于现实中数据集的简单实用技巧。O'Reilly 的“Think X”系列,是帮助有编程基础的开发者进行跨界学习的不错资源,程序猿可多关注。该系列基本都有中文译本,本书名为《统计思维》。

地址:http://greenteapress.com/thinkstats/ 

█《Think Bayes》

作者: Allen B. Downey

从计算方法角度对贝叶斯统计的入门介绍。同样是 O'Reilly“Think X”系列(雷锋网注:感谢下 O'Reilly 的分享精神),同样对程序员友好:使用 Python 代码而不是数学,使用 discrete approximations 而非 continuous mathematics。中文译版名为《贝叶斯思维》 。

地址:http://greenteapress.com/wp/think-bayes/

█《Convex Optimization》

作者:Stephen Boyd,Lieven Vandenberghe

如书名,对该领域做了比较全面的综合介绍。至于如何高效地用算术方面解决这类问题,书中有许多细节。这本书是剑桥大学出版社出版,但在网上免费分享(好吧,剑桥中国史卖那么贵我就不吐槽了)。中文版《凸优化》可在主流书商买到。

地址:http://stanford.edu/~boyd/cvxbook/ 

█《Essentials of Metaheuristics》

作者:Sean Luke

作者是教这门课的教授,这是他根据课程编写的笔记,面向本科生、开发者、程序员、或其他需要打基础的人。作者将这本书免费分享,雷锋网获知,他希望大家在其网站上填一份个人信息表格再下载。

地址:https://cs.gmu.edu/~sean/book/metaheuristics/ 

在上述书籍之外,倒还有几本不错的机器学习和统计领域的免费电子书。但雷锋网(公众号:雷锋网)此前盘点过的,本文不再重复。请参考此前文章:最近很火的《计算机科学的数学》是本什么样的书?

另外,更全面的机器学习外文书籍盘点,请看:机器学习漫游指南 最完整的入门书单(外文版)。

本文作者:三川

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-12-28 10:16:25

免费教材资源第二弹!这回侧重数据科学的相关文章

[你必须知道的.NET]第二十五回:认识元数据和IL(中)

书接上回[第二十四回:认识元数据和IL(上)],我们对PE文件.程序集.托管模块,这些概念与元数据.IL的关系进行了必要的铺垫,同时顺便熟悉了以ILDASM工具进行反编译的基本方法认知,下面是时候来了解什么是元数据,什么是IL这个话题了,我们继续. 很早就有说说Metadata(元数据)和IL(中间语言)的想法了,一直在这篇开始才算脚踏实地的对这两个阶级兄弟投去些细关怀,虽然来得没有<第一回:恩怨情仇:is和as>那么迅速,但是Metadata和IL却是绝对重量级的内容,值得我们在任何时间关注

闹鬼软件锁屏精灵,万圣节第二弹温柔来袭

万圣节来临之际,受网络上一款名为"鬼屋梦魇"闹鬼软件引发的"闹鬼事件"的影响,这几天让该款软件着实火了一把,而关于这款软件真正的名字也逐渐浮出水面--锁屏精灵! &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 锁屏精灵是一款免费的.趣味十足的手机锁屏软件.它集趣味解锁.丰富场景.快捷功能.酷炫动画.安全性于一体,让你的手机锁屏动起来!一直秉承"只做精品的锁屏&qu

iOS7免费设计资源汇总

上周破例发了一篇iOS7体验报告,而今次仍是与常规的风格有所不同.我确实很少做这种资源汇总一类的东西,除非是对自己很热.很有实际用处的玩意儿,那这次就是这样了.参考了几篇国外的相关介绍,另外到dribbble逛了逛,简单汇总了一些目前市面上比较过的去的iOS7免费设计资源,拿过来分享给各位,也留给自己平时找起来方便.资源包含图标.界面及控件.重设计mockup三个方面. 图标 1.iOS7应用图标模板(PSD,用于Photoshop和Sketch).由设计师Rob Sim创建,文件中的应用图标模

新浪微博私信接口合作第二弹:阿里巴巴旗下购物助手如意淘与新浪微博合作,可在商品降价

摘要: 如意淘 近日在其官方微博上宣布,与新浪微博联合推出降价提醒功能,通过微博私信将淘宝商品的降价信息推送给用户.要使用这一功能,用户首先得在新浪微博上关注 @如意淘 ,随后 如意淘近日在其官方微博上宣布,与新浪微博联合推出降价提醒功能,通过微博私信将淘宝商品的降价信息推送给用户.要使用这一功能,用户首先得在新浪微博上关注@如意淘,随后如意淘会向用户发送绑定淘宝账号的私信通知,用户点击通知内链接完成绑定后,即可去如意淘网站设置折扣提醒的标准,自行选择当淘宝上收藏或者已放入购物车的商品达到几折以

新浪微博私信接口合作第二弹

摘要: 如意淘近日在其官方微博上宣布,与新浪微博联合推出降价提醒功能,通过微博私信将淘宝商品的降价信息推送给用户.要使用这一功能,用户首先得在新浪微博上关注@如意淘,随后如 如意淘近日在其官方微博上宣布,与新浪微博联合推出降价提醒功能,通过微博私信将淘宝商品的降价信息推送给用户.要使用这一功能,用户首先得在新浪微博上关注@如意淘,随后如意淘会向用户发送绑定淘宝账号的私信通知,用户点击通知内链接完成绑定后,即可去如意淘网站设置折扣提醒的标准,自行选择当淘宝上收藏或者已放入购物车的商品达到几折以下时

预览office文件-如何通过免费的资源预览Office系列文件和PDF文件呢?

问题描述 如何通过免费的资源预览Office系列文件和PDF文件呢? 在实现局域网内预览Office文件和PDF文件时遇到了问题,希望各位大牛能指导一下,先说声谢谢啦.

[你必须知道的.NET]第二十六回:认识元数据和IL(下)

书接上回: 第二十四回:认识元数据和IL(上) , 第二十五回:认识元数据和IL(中) 我们继续. 终于到了,说说元数据和IL在JIT编译时的角色了,虽然两个回合的铺垫未免铺张,但是却丝毫不为过,因为只有充分的认知才有足够的体会,技术也是如此.那么,我们就开始沿着方法调用的轨迹,追随元数据和IL在那个神秘瞬间所贡献的力量吧 5 元数据和IL在JIT编译时 CLR最终执行的只有本地机器码,所以JIT编译的作用是在运行时将IL代码解析为机器码执行.对于JIT编译,我们会以专门的篇幅来全面了解,本文只

新手快速学习JavaScript免费教程资源汇总

  这篇文章主要介绍了新手快速学习JavaScript免费教程资源汇总,都是非常不错的学习站点,有需要的小伙伴可以参考下. "JavaScript"的名头相信大家肯定是耳熟能详,但只有一小部分人群了解它的使用与应用程序构建方式.这"一小部分"人指的当然是技术过硬的有为青年.网络程序员以及IT专业人员.但对于一位新手或者说外行人而言,"JavaScript"只不过是复杂计算机编程学科当中的另一个不知所云的术语. 那么,JavaScript到底是什么

MaxCompute - ODPS重装上阵 第二弹 - 新的基本数据类型与内建函数

MaxCompute(原ODPS)是阿里云自主研发的具有业界领先水平的分布式大数据处理平台, 尤其在集团内部得到广泛应用,支撑了多个BU的核心业务. MaxCompute除了持续优化性能外,也致力于提升SQL语言的用户体验和表达能力,提高广大ODPS开发者的生产力. MaxCompute基于ODPS2.0新一代的SQL引擎,显著提升了SQL语言编译过程的易用性与语言的表达能力.我们在此推出MaxCompute(ODPS2.0)重装上阵系列文章 第一弹 - 善用MaxCompute编译器的错误和警