knowledge-distillation

Knowledge Distillation

    python run.py train --model [model]

    python run.py train_selfkd --model [model] --custom_loss [self-kd name]

    python run.py train_offkd --model [model] --pretrained_model [teacher model]

    python run.py train_offkd --model [model] --pretrained_model [teacher model]

Type	Teacher	Student	Best Eval Accuracy(%)
Baseline	None	ConvNet	56.31
SoftTarget(KL)	ResNet20	ConvNet	61.21
DeepMutualLearning	None	ConvNet	56.52

Type	Teacher	Student	Best Eval Accuracy(%)
Baseline	None	ConvNet	83.52
Baseline	None	ResNet20	90.86
DeepMutualLearning	None	ConvNet	83.30
DeepMutualLearning	None	ResNet20	91.14

Type	Teacher	Student	Best Eval Accuracy(%)
Baseline	None	LeNet5	90.49
DeepMutualLearning	None	LeNet5	90.61
CS-KD	None	LeNet5	91.45

3neutronstar/knowledge-distillation