jieyingyoung/sentiment_analysis2018_baseline_py36

python 3.6 baseline of the sentiment analysis in AI competition 2018

Python

AI Challenger Sentiment Analysis Baseline

功能描述

本工程主要用于为参赛者提供一个baseline，方便参赛者快速上手比赛，主要功能涵盖完成比赛的全流程，如数据读取、分词、特征提取、模型定义以及封装、模型训练、模型验证、模型存储以及模型预测等。baseline仅是一个简单的参考，希望参赛者能够充分发挥自己的想象，构建在该任务上更加强大的模型。

开发环境

主要依赖工具包以及版本，详情见requirements.txt

项目结构

src/config.py 项目配置信息模块，主要包括文件读取或存储路径信息
src/data_process.py 数据处理模块，主要包括数据的读取以及处理等功能
src/model.py 模型定义模块，主要包括模型的定义以及使用封装
src/main_train.py 模型训练模块，模型训练流程包括数据读取、分词、特征提取、模型训练、模型验证、模型存储等步骤
src/main_predict.py 模型预测模块，模型预测流程包括数据和模型的读取、分词、模型预测、预测结果存储等步骤

使用方法

配置在config.py中配置好文件存储路径
训练运行nohup python main_train.py -mn your_model_name & 训练模型并保存，同时通过日志可以得到验证集的F1_score指标
预测运行nohup python main_predict.py -mn your_model_name $ 通过加载上一步的模型，在测试集上做预测

"# sentiment_analysis2018_baseline_py36"