challenger.ai 国内数据挑战赛
机器学习/数据挖掘
Real World Machine Learning(现实世界中的机器学习)
作者:Henrik Brink,Joseph W.Richards和Mark Fetherolf 本书介绍了现实世界中机器学习的应用,旨在教会工作开发者ML项目执行的艺术。 书籍链接:https://www.manning.com/books/real-world-machine-learning
An Introduction To Statistical Learning(统计学习介绍)
作者:加雷思詹姆斯,丹尼尔·维滕,特雷弗·哈斯蒂和罗伯特·蒂布拉尼 本书提供了统计学习方法的介绍。适合于高年级本科生,硕士研究生和博士学位。非数学科学中的学生。 书籍链接:http://www-bcf.usc.edu/%7Egareth/ISL/
An Introduction To Statistical Learning(统计学习的要素)
作者:TrevorHastie Robert Tibshirani Jerome Friedman 简介:这本书的覆盖面广泛,从监督学习到无监督学习。涵盖了神经网络,支持向量机,分类树等经典算法。 书籍链接:http://statweb.stanford.edu/%7Etibs/ElemStatLearn/
Probabilistic Programming & Bayesian Methods for Hackers (概率编程与黑客的贝叶斯方法)
本书综合的从数学和概率编程的角度介绍了贝叶斯方法。 书籍链接:http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/
Think Bayes(贝叶斯方法)
作者:Allen B.Downey 本书从计算的角度介绍贝叶斯统计。 书籍链接:http://greenteapress.com/wp/think-bayes/
Information Theory, Inference, and Learning Algorithms(信息理论,推理和学习算法)
本书主要阐述了信息理论知识,以及其中的推理过程、学习算法,适合于机器学习辅助知识阅读。 书籍链接:http://www.inference.phy.cam.ac.uk/mackay/itila/book.html
Gaussian Processes for Machine Learning(机器学习的高斯过程)
作者:Carl Edward Rasmussen和ChristopherK. I. Williams 书籍简介:在这本书中,我们将关注监督学习,并根据输出的特性,讨论了回归,分类等问题。 书籍链接:http://www.gaussianprocess.org/gpml/chapters/
Data-Intensive Text Processing with MapReduce(数据强化文本处理)
作者:吉米·林和克里斯·戴尔。 本书专注于MapReduce算法设计,重点放在自然语言处理,信息检索和机器学习中常用的 书籍链接:http://lintool.github.io/MapReduceAlgorithms/
Reinforcement Learning: - An Introduction(增强学习)
作者:理查德·萨顿和安德鲁·巴托 本书主要介绍深度学习中非常重要的一个方向“强化学习”,适合于刚学习这方面知识的人群。 书籍链接:http://webdocs.cs.ualberta.ca/%7Esutton/book/ebook/the-book.html
Mining of Massive Datasets(数据集挖掘规模化)
作者:Jure Leskovec Anand Rajaraman effrey D. Ullman 本书适合研究数据挖掘的人群 书籍链接:http://infolab.stanford.edu/%7Eullman/mmds/book.pdf
A First Encounter with Machine Learning(机器学习的第一次邂逅)
本书用浅显的语言描述了机器学习知识,适合入门人群。 书籍链接:https://www.ics.uci.edu/%7Ewelling/teaching/273ASpring10/IntroMLBook.pdf
Pattern Recognition and Machine Learning(模式识别和机器学习)
本书阐述了模式识别的各种方法,同时在其基础上讨论了机器学习方法,非常适合模式识别领域人群。 书籍链接:http://users.isr.ist.utl.pt/%7Ewurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf
Machine Learning & Bayesian Reasoning(机器学习与贝叶斯推理)
本书了统计学于机器学习的关系,需要一定的数学基础的人群 书籍链接:http://web4.cs.ucl.ac.uk/staff/D.Barber/textbook/090310.pdf
Introduction to Machine Learning(机器学习简介)
本书适合研究机器学习入门的人群 书籍链接:http://alex.smola.org/drafts/thebook.pdf
A Probabilistic Theory of Pattern Recognition(模式识别的概率理论)
本书从模式识别问题实际出发,结合概率理论,并用概率理论知识解决模式识别问题,适合机器学习人群 书籍链接:http://www.szit.bme.hu/%7Egyorfi/pbook.pdf
ntroduction to Information Retrieval(信息检索简介)
本书介绍机器学习中信息的运用过程,适合具有一定基础的机器学习人群 书籍链接:http://nlp.stanford.edu/IR-book/pdf/irbookprint.pdf
Forecasting: principles and practice(预测:原则和实践)
本教材旨在提供预测方法的全面介绍,并为每个方法提供足够的信息,以便读者能够明智地使用它们。 书籍链接:https://www.otexts.org/fpp/
Introduction to Machine Learning(机器学习简介)
本书用实例的方法介绍了机器学习方法,适合一定基础的人群 书籍链接:https://arxiv.org/pdf/0904.3664v1.pdf
Reinforcement Learning(强化学习)
本书主要介绍深度学习中非常重要的一个方向“强化学习”,适用于一定深度学习知识的人群 书籍链接:http://www.intechopen.com/books/reinforcement_learning
Machine Learning(机器学习)
本书介绍机器学习方法,适用于机器学习一定基础的人群 书籍链接: http://www.intechopen.com/books/machine_learning
A Quest for AI(AI的任务)
本书介绍人工智能可以做到的事情,适合研究人工智能技术的人群 书籍链接:http://ai.stanford.edu/%7Enilsson/QAI/qai.pdf
Introduction to Applied Bayesian Statistics and Estimation for Social Scientists(应用贝叶斯统计学概论和社会科学家的估计)
本书介绍了利用统计学知识来应用到实际生活中,适合工程学者人群 书籍链接:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.177.857&rep=rep1&type=pdf
Bayesian Modeling, Inference and Prediction(贝叶斯建模,推理和预测)
本书介绍了贝叶斯建模原理,适合一定基础的机器学习、统计学学者人群 书籍链接:https://users.soe.ucsc.edu/%7Edraper/draper-BMIP-dec2005.pdf
A Course in Machine Learning(机器学习课程)
本书是一门机器学习教程,适合初学者 书籍链接:http://ciml.info/
Machine Learning, Neural and Statistical Classification(机器学习,神经和统计分类)
本书介绍了机器学习、神经网络、统计学分类的知识,适合初学者 书籍链接:http://www1.maths.leeds.ac.uk/%7Echarles/statlog/
Bayesian Reasoning and Machine Learning(贝叶斯推理和机器学习)
本书介绍了机器学习、贝叶斯推理相关知识,适合一定统计学基础的人群 书籍链接:http://web4.cs.ucl.ac.uk/staff/D.Barber/pmwiki/pmwiki.php?n=Brml.HomePage
R Programming for Data Science(R语言数据科学)
本书介绍了r语言在数据科学中使用,适合运用r语言研究机器学习的人群 书籍链接:https://leanpub.com/rprogramming
Data Mining - Practical Machine Learning Tools and Techniques(数据挖掘 - 实用机器学习工具和技术)
作者:Ian H. 本书介绍了数据挖掘知识,适合文本处理、数据挖方面的人群 书籍链接:http://muchong.com/bbs/logging.php?action=login
2016 CCF大数据与计算智能大赛 开源资料整理
2016 CCF 大数据与计算智能大赛已经落下帷幕,11个赛题由众多大神包揽奖项,其中有些还在赛后开源了比赛资料,现将目前已知的资料整理如下,供各位同学一起参考学习。若有意公开自己的比赛资料或者发现整理的列表中有遗漏的,可以联系我(金陵书生, netivs@qq.com )补充修订。有问题也可在群里讨论。部分比赛PPT已经放到大数据比赛交流群,请在群文件里查看。
1)O2O 赛题 wepon、天音和charles提供的CCF O2O比赛第一名的全套代码和资料: https://github.com/wepe/O2O-Coupon-Usage-Forecast
2)农产品价格预测赛题 CCF农产品价格预测线上rank2代码,感谢 xing89qs https://github.com/xing89qs/CCF_Product
线上第5,决赛答辩逆袭为第1名的团队,只有代码没有任何说明。 https://github.com/ziminghuang/futuredata-ccf2016
复赛第35名的团队: https://github.com/wqlin/ccf-price-prediction
- 客户用电异常行为分析 线上第4名的代码。这个队伍非常强悍,只提交很少的几次,而且最后3天都没提交,还一直前5名。同时,他们还是搜狗比赛的二等奖。 https://github.com/AbnerYang/2016CCF-StateGrid
4)搜狗的用户画像比赛 线上第3名的TNT_000,同时也是上面客户用电异常行为分析比赛的二等奖。目前代码库是空的,但是我跟他们联系确认过了,元旦后他们会开源,因此先放上地址。 https://github.com/AbnerYang/2016CCF-SouGou
线上第5名的The Right队伍的代码和决赛答辩PPT,而且他们还给出了数据下载地址,大赞。同一个团队的几个人分别开源了,链接如下: https://github.com/dhdsjy/2016_CCFsougou2 https://github.com/dhdsjy/2016_CCFsougou https://github.com/prozhuchen/2016CCF-sougou https://github.com/coderSkyChen/2016CCF_BDCI_Sougou
复赛第14名的团队: https://github.com/admu/CCF_sougou
5)联通的用户轨迹赛题
不确定名次: https://github.com/xuguanggen/2016CCF-unicom
6)Human or Robot
决赛第6名,很可惜的团队 https://github.com/pickou/ccf_human_or_robot
pca 降维学些
http://sebastianraschka.com/Articles/2015_pca_in_3_steps.html
http://blog.csdn.net/xiaojidan2011/article/details/11595869
https://www.kaggle.com/arthurtok/principal-component-analysis-with-kmeans-visuals