15504350076/computer_room_temperature

浙江大学控制科学与工程学院本科生课程“人工智能与机器学习”大作业——机房温度遥测

PythonMIT

computer_room_temperature

浙江大学控制科学与工程学院本科生课程“人工智能与机器学习”大作业——机房温度遥测

实验背景

机房温湿度在一定程度上决定了机房设备运行的可靠性。
利用当前的温湿度状态预测未来一段时间内的温度变化，以提前采取应对措施将机房温度调整至最佳状态可以保证机房设备的可靠运行。
我们采集了 2019 年某段时间某机房遥测的数据信息，其中数据特征包括：

机房周边室外温度（outdoor_temperature）
室外湿度（outdoor_humidity）
室内湿度（indoor_humidity）
新风风机开关状态（fan_status）
机房总用电量（power_consumption）
室内温度（indoor_temperature）

需要预测的量为：

未来某一时刻的室内温度（indoor_temperature）

数据集包含约一个月内的机房遥测数据，采样间隔为 1 分钟。

实验要求

本实验需要利用的机房遥测信息数据集，实现一个由前一段时间内的遥测数据信息，对未来一段时间内的室内温度进行预测的算法。
具体要求为：

根据过去 360 分钟内的机房遥测数据，预测未来第 60 分钟的机房温度信息。
建立深度神经网络模型，并尽可能将其调到最佳状态。
绘制深度神经网络模型图、绘制并分析学习曲线。
用 RMSE、MAE 等指标对模型进行评估。

整体思路

将整个监督学习问题包装到强化学习的框架下，状态为经过处理后的特征，动作为预测的值，采用双延迟深度确定性策略梯度算法（TD3）实现。

文件说明

rl_train.py：训练所用主函数
rl_test.py：对results中存储的模型进行评估
rl_predict.py：Mo平台测试接口
./results/rl：存放各种结果
- evaluations.npy：学习过程中的奖励曲线
- models：模型
- pics：在训练集和测试集上评估的结果
./utils：数据处理以及强化学习用的各种工具
- env.py：环境接口
- process.py：数据处理
- replayer.py：经验回放池
- TD3：TD3算法

整体效果

不太理想，平滑性较差，振荡过多。