LeReNet

Something-something training records

Models: I3D 32 frames input non-local and mask non-local. Use I3D non-local affine 32 frames inputs as pre-training model.

Conclusion: I3D experiment in paper(41.6) should be repeated and achieved.

Models: I3D 8 input. Baseline == drop rate 0.8, resize 256*320, crop 224, sample rate 4.

_Model	_{Final Val}	_{Final Train}	_{Test Acc}
_{Base line}	_28.64	_77.86	_31.62
_{drop rate 0.6}	_29.43	_82.82	_32.23
_{Resize 224*224}	_31.55	_91.17	_30.10
_{Resize 224*280}	_31.11	_85.77	_31.74
_{Resize 240*300}	_30.17	_81.82	_30.45
_{Sample rate 3}	_31.83	_72.80	_35.71
_{Sample rate 3 Resize 224*280}	_34.12	_33.72	_35.31

Conclusion:

Models: I3D 8 input. Baseline == drop rate 0.7, resize 232*290, sample rate 3, Res5 stride 1.

_Model	_{Best Val}	_{Final Val}	_{Final Train}	_{Test Acc}	_{Early Model Acc}
_{Base line}	_32.17	_31.14	_88.78	_33.75	_{34.62(115000)}
_{drop rate 0.5}	_32.92	_32.23	_91.62	_33.67	_34.12
_{Resize 256*320}	_31.32	_30.116	_82.48	_34.37	_34.59
_{Resize 232*348}	_30.95	_30.64	_80.35	_34.84	_35.29

Models: I3D 32 input.

_model	_len	_drop	_bestval	_finalval	_finaltrain	_finaltest
_256*320	₃₂	_0.75	_37.42	_37.34	_78.57	_43.47
_256*376	₃₂	_0.75	_35.88	_35.52	_72.86	_43.37
_232*290	₂₈	_0.75	_39.40	_38.91	_85.12	_42.74
_232*290	₃₂	_0.7	_39.23	_39.23	_85.70	_42.94
_232*290	₃₂	_0.85	_39.08	_39.08	_81.88	_42.79
_232*348	₃₂	_0.75	_38.14	_37.88	_76.88	_44.44
_224*360	₃₂	_0.75	_38.18	_37.37	_85.86	_44.51