/cama_summer_class_2017

杭电 CAMA-LAB 机器学习暑期研讨班

Primary LanguageHTML

CAMA-LAB 机器学习暑期研讨班(2017)

研讨班技术报告总安排

介绍

  • 面向对象:准研一学生 + 大一、大二本科生
  • 场地:杭电东校区
  • 时间:7月17号-9月15号 (工作日:8:00-17:30)
  • 内容
    • 机器学习/深度学习 + 计算机视觉应用
    • 课题/项目:选择部分学生,参与老师的研究课题/项目
  • 形式
    • 每周
      • 老师指定学习内容,并进行部分讲解
      • 学生自学为主,鼓励自由讨论
      • 定期开会讨论
      • 提交技术报告(算法**、编程实现、实验结果及分析)
    • 暑期结束
      • 提交大报告、项目总结
      • 选择部分学生,在 2017-18 学年持续参与老师课题
  • 讨论方式
    • 线下:东区和老师、研究生学长交流
    • 线上:Twist 为主,QQ 群为辅
  • 高强度、严要求、安全第一
  • 关于作业
    • 每周一会对上周的作业进行讲解
      • 讲解幻灯片和相关资料会上传到 Github
    • 每周三会发布一份上周作业的标准答案

整体内容安排

机器学习

第一周:热身 (7 月 17 日 - 7 月 22 日)

  • Python 编程基础
  • 图像表示:
    • 矩阵、颜色空间
    • 图像特征:像素值、颜色直方图、梯度直方图、LBP
    • 作业:图像读写、特征提取
  • 回归:
    • 算法:线性回归,线性回归+正则项(L1, L2)
    • 优化:梯度下降法
    • 测度:欧式距离、街区距离、范数、Loss
    • 作业:波士顿房价预测

第二周:分类 (7 月 24 日 - 7 月 29 日)

  • 算法:k-NN, Logistic Regression, 决策树
  • 作业:
    • MNIST 手写数字识别、CIFAR-10 图像分类
    • 采用第一周的特征 + 第二周的方法(多种组合,对比结果)
    • 井字棋胜负判断 (需动手实现 ID3 决策树算法)

第三周:经典算法 (8 月 1 日 - 8 月 5 日)

  • 支撑向量机
    • 推荐博文:SVM《理解SVM的三层境界》
  • 图像特征:SIFT, Visual BoW
  • 作业:井字棋胜负判断 (允许使用 scikit-learn 等 Package)
  • Andrew Ng 论文
  • 聚类:K-means, K-means++
  • 降维:PCA, ICA, ZCA, LLE, AE
  • 作业:客户聚类
  • 推荐阅读:pluskid 博客

扩展:

  • 经典方法:谱聚类、朴素贝叶斯、EM算法、稀疏编码 Sparse Coding
  • 集成学习:Adaboost, Random Forest, gdbt (XGBoost)
  • 结构化学习 Structured Learning
  • 排序学习 Learning to Rank
  • 强化学习 Reinforcement Learning
  • 模仿学习 Imitation Learning

深度学习

第六周:神经网络 DNN&CNN (8 月 21 日 - 8 月 26 日)

  • 概念:卷积, Pooling, Stride, Padding, Data Augmentation, Learning Rate, Momentum, Softmax, ReLU, BP, SGD, Cross-Entropy Loss
  • 网络:LeNet, AlexNet, VGGnet, GoogLeNet, ResNet
  • 框架:Keras
  • 作业:mnist 数字序列识别

第七周:神经网络提升 (8 月 28 日 - 9 月 2 日)

第八周:递归神经网络(9 月 4 日 - 9 月 8 日)

  • 网络:RNN, LSTM
  • 作业:Image Captioning,使用框架实现

扩展:

主要人员

教师 - - - - -
俞俊 高飞 谭敏 余宙 朱素果 匡振中
助教
罗宇矗 钱哲琦 朱朝阳 项晨钞 施圣洁 张海超
孟宣彤 郑光剑 吴炜晨