/DSFinal

It is the final project for DataScience class.

Primary LanguagePython

DSFinal

这是数据科学大作业的实现代码。大作业为kaggle上的一个inclass的比赛。赛题链接:https://www.kaggle.com/c/datascience2018

Highlight

  • 单模型 performance比较好

Requirements

  • python3
  • pytorch 0.4.0

Data Distribution

types daisy dandelion rose sunflower tulip
num 692 949 714 666 878

测试集一共424张图片。

Run This Code

分割数据集

将数据放在data目录下,运行以下代码

python split_train_val.py

训练

CUDA_VISIBLE_DEVICES="0" sh train.sh

你可以根据需要使用训练的同时val或不val的代码。

测试

CUDA_VISIBLE_DEVICES="0" sh test.sh

Improvement

受到 Few-Example Object Detection with Model Communication启发,不再区分验证集和训练集,并将测试集中score大于0.9的数据附上fake label,构成新的训练集进行训练。

Model Zoo

All the files canbe downloaded in BaiduYun, including train.log, test.log, checkpoint, submit file.

Version Acc(Pub)
model1 0.95754
model2 0.96698