#目录说明:

##source:

  • CheckTrainData.py:查看原始数据
  • DealTrainData.py:处理交易数据
  • DealWeatherData.py:处理天气数据
  • error.py:误差函数
  • ExploreTrainData.py:交易数据探索绘图
  • ExploreTrainWeather.py:交易数据关联天气数据探索绘图
  • predict.py:预测20141225-20141231的客流
  • TestDataResult.py:测试集生成
  • TrainDataResult.py:训练集生成
  • TrainModel.py:训练模型

##data: 由于大赛已经结束,咱们就把20141225-20141231的交易数据拿出来当作未知

  • date_holiday.txt:日期节假日、工作日数据
  • gd_line_desc.txt:比赛提供的公交线路信息数据
  • gd_train_data.txt:比赛提供的原始交易数据
  • gd_weather_report.txt:比赛提供的天气状况
  • line6_passenger_hour_test.csv:20141225-20141231线路6的客流
  • line11_passenger_hour_test.csv:20141225-20141231线路11的客流
  • train_data.csv:去掉20141225-20141231的交易数据
  • train_data_test.csv:20141225-20141231的交易数据,作为测试集

由于github对单个文件大小有限制,我把数据上传到了百度云盘 链接:https://pan.baidu.com/s/1vRsr_ur7fgtSz7GHzlALSw 密码:x1r4

##model: 存放训练好的模型

具体细节移步https://blog.csdn.net/u010606321/article/details/82501341