challenger.ai 国内数据挑战赛

机器学习/数据挖掘

Real World Machine Learning(现实世界中的机器学习)

作者:Henrik Brink,Joseph W.Richards和Mark Fetherolf 本书介绍了现实世界中机器学习的应用,旨在教会工作开发者ML项目执行的艺术。 书籍链接:https://www.manning.com/books/real-world-machine-learning

An Introduction To Statistical Learning(统计学习介绍)

作者:加雷思詹姆斯,丹尼尔·维滕,特雷弗·哈斯蒂和罗伯特·蒂布拉尼 本书提供了统计学习方法的介绍。适合于高年级本科生,硕士研究生和博士学位。非数学科学中的学生。 书籍链接:http://www-bcf.usc.edu/%7Egareth/ISL/

An Introduction To Statistical Learning(统计学习的要素)

作者:TrevorHastie Robert Tibshirani Jerome Friedman 简介:这本书的覆盖面广泛,从监督学习到无监督学习。涵盖了神经网络,支持向量机,分类树等经典算法。 书籍链接:http://statweb.stanford.edu/%7Etibs/ElemStatLearn/

Probabilistic Programming & Bayesian Methods for Hackers (概率编程与黑客的贝叶斯方法)

本书综合的从数学和概率编程的角度介绍了贝叶斯方法。 书籍链接:http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/

Think Bayes(贝叶斯方法)

作者:Allen B.Downey 本书从计算的角度介绍贝叶斯统计。 书籍链接:http://greenteapress.com/wp/think-bayes/

Information Theory, Inference, and Learning Algorithms(信息理论,推理和学习算法)

本书主要阐述了信息理论知识,以及其中的推理过程、学习算法,适合于机器学习辅助知识阅读。 书籍链接:http://www.inference.phy.cam.ac.uk/mackay/itila/book.html

Gaussian Processes for Machine Learning(机器学习的高斯过程)

作者:Carl Edward Rasmussen和ChristopherK. I. Williams 书籍简介:在这本书中,我们将关注监督学习,并根据输出的特性,讨论了回归,分类等问题。 书籍链接:http://www.gaussianprocess.org/gpml/chapters/

Data-Intensive Text Processing with MapReduce(数据强化文本处理)

作者:吉米·林和克里斯·戴尔。 本书专注于MapReduce算法设计,重点放在自然语言处理,信息检索和机器学习中常用的 书籍链接:http://lintool.github.io/MapReduceAlgorithms/

Reinforcement Learning: - An Introduction(增强学习)

作者:理查德·萨顿和安德鲁·巴托 本书主要介绍深度学习中非常重要的一个方向“强化学习”,适合于刚学习这方面知识的人群。 书籍链接:http://webdocs.cs.ualberta.ca/%7Esutton/book/ebook/the-book.html

Mining of Massive Datasets(数据集挖掘规模化)

作者:Jure Leskovec Anand Rajaraman effrey D. Ullman 本书适合研究数据挖掘的人群 书籍链接:http://infolab.stanford.edu/%7Eullman/mmds/book.pdf

A First Encounter with Machine Learning(机器学习的第一次邂逅)

本书用浅显的语言描述了机器学习知识,适合入门人群。 书籍链接:https://www.ics.uci.edu/%7Ewelling/teaching/273ASpring10/IntroMLBook.pdf

Pattern Recognition and Machine Learning(模式识别和机器学习)

本书阐述了模式识别的各种方法,同时在其基础上讨论了机器学习方法,非常适合模式识别领域人群。 书籍链接:http://users.isr.ist.utl.pt/%7Ewurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf

Machine Learning & Bayesian Reasoning(机器学习与贝叶斯推理)

本书了统计学于机器学习的关系,需要一定的数学基础的人群 书籍链接:http://web4.cs.ucl.ac.uk/staff/D.Barber/textbook/090310.pdf

Introduction to Machine Learning(机器学习简介)

本书适合研究机器学习入门的人群 书籍链接:http://alex.smola.org/drafts/thebook.pdf

A Probabilistic Theory of Pattern Recognition(模式识别的概率理论)

本书从模式识别问题实际出发,结合概率理论,并用概率理论知识解决模式识别问题,适合机器学习人群 书籍链接:http://www.szit.bme.hu/%7Egyorfi/pbook.pdf

ntroduction to Information Retrieval(信息检索简介)

本书介绍机器学习中信息的运用过程,适合具有一定基础的机器学习人群 书籍链接:http://nlp.stanford.edu/IR-book/pdf/irbookprint.pdf

Forecasting: principles and practice(预测:原则和实践)

本教材旨在提供预测方法的全面介绍,并为每个方法提供足够的信息,以便读者能够明智地使用它们。 书籍链接:https://www.otexts.org/fpp/

Introduction to Machine Learning(机器学习简介)

本书用实例的方法介绍了机器学习方法,适合一定基础的人群 书籍链接:https://arxiv.org/pdf/0904.3664v1.pdf

Reinforcement Learning(强化学习)

本书主要介绍深度学习中非常重要的一个方向“强化学习”,适用于一定深度学习知识的人群 书籍链接:http://www.intechopen.com/books/reinforcement_learning

Machine Learning(机器学习)

本书介绍机器学习方法,适用于机器学习一定基础的人群 书籍链接: http://www.intechopen.com/books/machine_learning

A Quest for AI(AI的任务)

本书介绍人工智能可以做到的事情,适合研究人工智能技术的人群 书籍链接:http://ai.stanford.edu/%7Enilsson/QAI/qai.pdf

Introduction to Applied Bayesian Statistics and Estimation for Social Scientists(应用贝叶斯统计学概论和社会科学家的估计)

本书介绍了利用统计学知识来应用到实际生活中,适合工程学者人群 书籍链接:http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.177.857&rep=rep1&type=pdf

Bayesian Modeling, Inference and Prediction(贝叶斯建模,推理和预测)

本书介绍了贝叶斯建模原理,适合一定基础的机器学习、统计学学者人群 书籍链接:https://users.soe.ucsc.edu/%7Edraper/draper-BMIP-dec2005.pdf

A Course in Machine Learning(机器学习课程)

本书是一门机器学习教程,适合初学者 书籍链接:http://ciml.info/

Machine Learning, Neural and Statistical Classification(机器学习,神经和统计分类)

本书介绍了机器学习、神经网络、统计学分类的知识,适合初学者 书籍链接:http://www1.maths.leeds.ac.uk/%7Echarles/statlog/

Bayesian Reasoning and Machine Learning(贝叶斯推理和机器学习)

本书介绍了机器学习、贝叶斯推理相关知识,适合一定统计学基础的人群 书籍链接:http://web4.cs.ucl.ac.uk/staff/D.Barber/pmwiki/pmwiki.php?n=Brml.HomePage

R Programming for Data Science(R语言数据科学)

本书介绍了r语言在数据科学中使用,适合运用r语言研究机器学习的人群 书籍链接:https://leanpub.com/rprogramming

Data Mining - Practical Machine Learning Tools and Techniques(数据挖掘 - 实用机器学习工具和技术)

作者:Ian H. 本书介绍了数据挖掘知识,适合文本处理、数据挖方面的人群 书籍链接:http://muchong.com/bbs/logging.php?action=login

2016 CCF大数据与计算智能大赛 开源资料整理

2016 CCF 大数据与计算智能大赛已经落下帷幕,11个赛题由众多大神包揽奖项,其中有些还在赛后开源了比赛资料,现将目前已知的资料整理如下,供各位同学一起参考学习。若有意公开自己的比赛资料或者发现整理的列表中有遗漏的,可以联系我(金陵书生, netivs@qq.com )补充修订。有问题也可在群里讨论。部分比赛PPT已经放到大数据比赛交流群,请在群文件里查看。

1)O2O 赛题 wepon、天音和charles提供的CCF O2O比赛第一名的全套代码和资料: https://github.com/wepe/O2O-Coupon-Usage-Forecast

2)农产品价格预测赛题 CCF农产品价格预测线上rank2代码,感谢 xing89qs https://github.com/xing89qs/CCF_Product

线上第5,决赛答辩逆袭为第1名的团队,只有代码没有任何说明。 https://github.com/ziminghuang/futuredata-ccf2016

复赛第35名的团队: https://github.com/wqlin/ccf-price-prediction

  1. 客户用电异常行为分析 线上第4名的代码。这个队伍非常强悍,只提交很少的几次,而且最后3天都没提交,还一直前5名。同时,他们还是搜狗比赛的二等奖。 https://github.com/AbnerYang/2016CCF-StateGrid

4)搜狗的用户画像比赛 线上第3名的TNT_000,同时也是上面客户用电异常行为分析比赛的二等奖。目前代码库是空的,但是我跟他们联系确认过了,元旦后他们会开源,因此先放上地址。 https://github.com/AbnerYang/2016CCF-SouGou

线上第5名的The Right队伍的代码和决赛答辩PPT,而且他们还给出了数据下载地址,大赞。同一个团队的几个人分别开源了,链接如下: https://github.com/dhdsjy/2016_CCFsougou2 https://github.com/dhdsjy/2016_CCFsougou https://github.com/prozhuchen/2016CCF-sougou https://github.com/coderSkyChen/2016CCF_BDCI_Sougou

复赛第14名的团队: https://github.com/admu/CCF_sougou

5)联通的用户轨迹赛题

不确定名次: https://github.com/xuguanggen/2016CCF-unicom

6)Human or Robot

决赛第6名,很可惜的团队 https://github.com/pickou/ccf_human_or_robot

pca 降维学些

http://sebastianraschka.com/Articles/2015_pca_in_3_steps.html

http://blog.csdn.net/xiaojidan2011/article/details/11595869

https://www.kaggle.com/arthurtok/principal-component-analysis-with-kmeans-visuals