迷你项目有两个独立的组成部分:
- 基础组件 [6分]:使用genki4k数据集,构建一个机器学习流程,该流程以图像作为输入,并预测1)图像中的人是否在微笑 2)估计图像中的3D头部姿态标签。
- 高级组件 [10分]:提出你自己的机器学习问题,并使用genki4k数据集(https://inc.ucsd.edu/mplab/398/)构建一个机器学习解决方案。
你的提交将包括两个Jupyter笔记本,一个用于基础组件,另一个用于高级组件。请为每个笔记本命名:
- CBU5201_miniproject_basic.ipynb
- CBU5201_miniproject_advanced.ipynb
然后压缩并一起提交它们。
每个上传的笔记本应包括:
- 文本单元格,简洁地描述每个步骤和结果。
- 代码单元格,实现每个步骤。
- 输出单元格,即每个代码单元格的输出。
并且应具有下面指示的结构。笔记本可能不会运行,请确保保存了输出单元格。
我们将如何评估你的提交?
- 你的写作简洁性(10%)。
- 你的方法正确性(30%)。
- 你的分析和结论的正确性(30%)。
- 完整性(10%)。
- 原创性(10%)。
- 尝试新事物的努力(10%)。
建议:为什么不使用GitHub来管理你的项目?GitHub可以作为一张展示卡,展示你所做的事情,并证明你的数据科学技能、知识和经验。
每个笔记本应分为以下9个部分:
学生姓名:
学生ID:
描述你想解决的机器学习问题,并解释它的有趣之处。
描述你的ML流程。清楚地识别其输入和输出,任何中间阶段(例如,转换 -> 模型),以及从一个阶段到下一个阶段的中间数据。你可以自由决定在你的流程中包含哪些阶段。
描述任何转换,如特征提取。识别输入和输出。解释你为什么选择这个转换阶段。
描述你将构建的ML模型。解释你为什么选择它们。
描述你将如何训练和验证你的模型,如何评估模型性能(例如,准确性,混淆矩阵等)
描述你将用来创建和验证你的模型的数据集。如果你需要对它进行预处理,请在这里进行。也包括可视化。你可以可视化原始数据样本或提取的特征。
在这里进行你的实验,解释你的结果。
你的结论,改进等应放在这里