/Machine-learning

欢迎来到机器学习理论与方法课程

面向生物医学学科专业本科生的机器学习理论与方法课程

授课教师: 刘琦 教授
同济大学 生命科学与技术学院 生物信息系

1. 课程简介

机器学习是一门多学科交叉课程,涵盖概率论,统计学,信息论和复杂算法等相关领域知识,使用计算机作为工具并致力于使得计算机器具备人工智能。现有的机器学习课程一般开设在计算机相关专业,但是人工智能和机器学习等数据分析技术在生命科学、医学领域及神经科学等领域具有广泛的应用,故生物医学领域对于人工智能和机器学习技术具有迫切的需求。本课程响应国家大力发展 "人工智能+"“医工结合” 的政策,依托于同济大学生命科学与技术学院生物信息学本科专业相关的课程设置,进行了系统的课程建设。该课程面向生命科学和医学相关专业的本科生,一般在本科大三阶段进行讲授,目前共设34个课时,分17周讲授。课程重点进行机器学习基本算法和模型的讲解,并精选一批文献阅读材料和网课供学生进行课外学习和知识拓展,其目的是进一步帮助学生理解其在生命科学和生物医学领域的应用。该课程一般要求本科生具备最基本的概率统计知识和基本的编程技能(Python, Perl, Matlab, R等)。

本课程目前采用的PPT教案为全英文,讲授为双语教学。PPT教案主要来自于原斯坦福大学Andrew Ng教授开设的Machine Learning课程,以及香港科技大学计算机学院张连文教授的若干本科教学PPT,在此向两位教授表示感谢,该课程内容将严禁进行其他商用活动。PPT教案内容考虑到生物医学专业本科生的接受程度进行了系统的梳理,在讲解过程中注重突出算法和模型的核心**,兼顾一些数学公式的推导,并突出各种模型算法之间的联系以及说明其具体的应用场景,最后课程中精选了一批生物医学领域的相关阅读材料供学生进行拓展学习。机器学习这门学科发展迅速,博大精深,由于课程时间有限,本课程对于一些高阶的学习范式仅做一些简单介绍,并精选领域内相关综述供感兴趣的学生进行进阶学习。

后续将上传本课程的教学视频,敬请期待。

2. 课程教材

中文教材

英文教材

补充数学基础辅助阅读教材

3. 教学大纲

课时安排 内容 课件 阅读材料 作业
课时-1 绪论 课件1 斯坦福Andrew ng课程-阅读材料
Nature-Reviews-Genetics-阅读材料
美国医学学会杂志-阅读资料
机器学习学术人物关系
其他阅读材料
课时-2 线性代数与概率论一堂课总结 课件2 斯坦福Andrew ng课程-阅读材料
NBT Primer阅读材料
Nature Methods阅读材料
其他阅读材料
一个awesome统计可视化网站
课时-3 线性回归 课件3 斯坦福Andrew ng课程-阅读材料 课程3-作业
课时-4 逻辑回归与正则化 课件4 斯坦福Andrew ng课程-阅读材料 课程4-作业
课时-5 模型评估 课件5 斯坦福Andrew ng课程-阅读材料
BIC Scores
课时-6 贝叶斯原理 课件6 斯坦福Andrew ng课程-阅读材料
NBT Primer阅读材料
Nature Review阅读材料
香港科技大学课程相关阅读材料
课时-7 决策树 课件7 NBT Primer阅读材料
神经支持决策树:可解释性和深度学习的折中
课时-8 基于实例的学习 课件8 香港科技大学课程相关阅读材料
课时-9 支持向量机(SVM) 课件9 斯坦福Andrew ng课程-阅读材料
NBT Primer阅读材料
其他阅读材料
课程9-作业
课时-10 深度学习 课件10 斯坦福Andrew ng课程-阅读材料
Nature Review阅读材料
Nature Genetics阅读材料
NBT Primer阅读材料
知乎好文:Hinton胶囊网络研究史
其他阅读材料
Github深度学习在生物医学领域应用的review
课程10-作业
课时-11 聚类算法 课件11 斯坦福Andrew ng课程-阅读材料
NBT Primer阅读材料
Nature Methods阅读材料
谱聚类
其他阅读材料
课时-12 降维算法 课件12 斯坦福Andrew ng课程-阅读材料
NBT Primer阅读材料
Nature Neuroscience阅读材料
课程12-作业
课时-13 异常检测与推荐系统 课件13 张量简介 课程13-作业
课时-14 机器学习的应用
机器学习系统设计
大规模机器学习
集成学习
课件14 Boosting历史
课时-15 高阶学习范式介绍
及生物信息学研究的思考
课件15 半监督学习
对抗生成
多标签学习
多任务学习
多示例学习
多视图学习
强化学习
迁移学习
主动学习
图神经网络
元学习
因果推断
联邦学习
课时-16 课程总结
答疑
课程汇报

4. 机器学习竞赛网站

Dream Challenge: http://dreamchallenges.org/
kaggle: https://www.kaggle.com/competitions

5. 推荐网课链接

课程名称 课程链接
斯坦福Andrew ng机器学习课程 https://www.coursera.org/learn/machine-learning
斯坦福图机器学习 http://web.stanford.edu/class/cs224w/
Grokking Deep Learning https://livebook.manning.com/#!/book/grokking-deep-learning
https://github.com/iamtrask/Grokking-Deep-Learning
Machine Learning Yearning https://deeplearning-ai.github.io/machine-learning-yearning-cn/
MIT面向生命科学的深度学习课程 https://mit6874.github.io/
**大学MOOC-北京理工大学机器学习课程 http://www.icourse163.org/course/BIT-1449601164
多伦多大学机器学习 https://amfarahmand.github.io/csc311/
**李宏毅机器学习 https://github.com/datawhalechina/leeml-notes
复旦大学邱锡鹏深度学习 https://nndl.github.io/
普林斯顿大学NLP课程 https://www.cs.princeton.edu/courses/archive/spring20/cos598C/
佐治亚理工大学交互式线性代数 http://textbooks.math.gatech.edu/ila/index.html

6. 主讲人科普链接

人工智能应用于新药研发的范式转变, 知识分子公众号科普, 2018.

化学界诞生了一个“AlphaGO", 知识分子公众号科普, 2018.

生物信息学研究的思考, **计算机学会通讯(CCCF), 12(10), 2016.

琦言药语 微信公众号

image

7. 联系方式

刘琦 email:qiliu@tongji.edu.cn