/4T4R

Primary LanguagePython

操作介绍:

1.docker 下载链接: https://pan.baidu.com/s/1yZ902vOm3p0CHuxc1mOw5Q 密码: mad0
2.基础环境说明cuda:10.0;pytorch 1.4;torchvision 0.5;
3.竞赛页面:https://www.datafountain.cn/competitions/494

代码层面执行说明:

具体的操作可以参考run.sh
1.训练数据行的排序
2.训练排序后的数据压缩;
3.利用混合bitFinetune模型;
4.结合排序模型与正常数据压缩模型进行Finetune\

方法说明:

本赛题主要解决方法是为平方值较大的行(24162 ,24是总行数)提供更多的bit来进行压缩;本题的主要解决方法分为两块,第一块是 用 153个bit预测24行数据的平方值排序;第二块是将数据按照行的平方值排序,平方值最大的行用143个bit预测;然后依次减少,后面的12行不分配bit(12行带来的误差在0.01左右);当然,在预测时候,也会将所有的bit合在一起,作为一个全局特征,除了这个全局特征,基本就是每一行是相互独立。

##解决方法特色: 1.将赛题解耦成两部分,一个是排序模块,另一个是排序后的数据,安装平方值大小分配bit,可以实现bit的合理分配; 2.比赛只采用了全连接,没有使用卷积操作,其中设计了DeepSplit模块,使得模型可以在一定程度上即宽又深。