Multimodal-Automated-Feature-construction

这是一个针对多模态数据的高效自动化特征构造系统,该系统可以对图片数据、文本数据、以及表格型数据(包括连续性特征、离散型特征、时间戳特征)进行自动特征构造,而且使用多核CPU并行操作技术提高了系统的运行效率。另外本系统也设计了一种过滤器,其是从其它数据集中构造特征生成数据进行训练分类模型,该过滤器可以过滤掉一些候选特征,减少需要评估的特征数量。 本系统内设计了27个图片特征提取范式,20个文本特征提取范式以及14个特征构造范式,并且系统留有扩展接口,用户可以自定义三种构造范式。 使用C++高效编译的版本见:https://github.com/zzy728772024/MAFC_C-