NJU-CS-Advanced_Machine_Learning

作业 2

作业 2 主页:https://cs.nju.edu.cn/liyf/aml21/assignment2.htm

  • 训练样本:135,000 条,首行是列名
  • 测试样本:57,544 条,首行是列名

注意:

  • 可以使用开源模型处理字符串属性,例如文本嵌入
  • 数据集被处理过,不必尝试在网络上找到原数据集

报告要求

  • 对问题的理解和分析
  • 算法的动机和算法背景介绍
  • 完整的算法技术细节,包括算法的伪代码
  • 对模型所获表现的描述或分析
  • 结论和可选的讨论

思路参考:https://www.kaggle.com/agrawaladitya/step-by-step-data-preprocessing-eda

提交

  • 报告
  • 预测结果文件
  • 算法源文件

作业评分

  • 预测结果:将根据 F1 被评估
  • 报告
  • 源代码

资源