CV-Final

Repository of final project of Computer Vision in Fudan

Open the folder to see detailed information.

Requirements:

使用在Cityscapes数据集上开源的任意一个语义分割模型，网络下载一段驾驶视频（类似行车记录仪视频），对视频每一帧进行测试并可视化，结果视频上传至网盘；
对Faster R-CNN模型，分别进行以下训练：a) 随机初始化训练VOC；b) ImageNet预训练backbone网络，然后使用VOC进行fine tune；c)使用coco训练的Mask R-CNN的backbone网络参数，初始化Faster R-CNN的backbone网络，然后使用VOC进行fine tune；
设计与期中作业1模型相同参数量的Transformer网络模型，进行CIFAR-100的训练，并与期中作业1的模型结果进行比较，可使用data aug

chx7514/CV-Final