作业 2 主页:https://cs.nju.edu.cn/liyf/aml21/assignment2.htm
- 训练样本:135,000 条,首行是列名
- 测试样本:57,544 条,首行是列名
注意:
- 可以使用开源模型处理字符串属性,例如文本嵌入
- 数据集被处理过,不必尝试在网络上找到原数据集
- 对问题的理解和分析
- 算法的动机和算法背景介绍
- 完整的算法技术细节,包括算法的伪代码
- 对模型所获表现的描述或分析
- 结论和可选的讨论
思路参考:https://www.kaggle.com/agrawaladitya/step-by-step-data-preprocessing-eda
- 报告
- 预测结果文件
- 算法源文件
- 预测结果:将根据 F1 被评估
- 报告
- 源代码