/hpc_monitor

slurm集群监测:包含温度过高、磁盘占有、节点掉线等预警;同时支持独立服务器CPU内存使用情况监测;仅python,可独立打包pip,其他依赖少,方便部署

Primary LanguagePython

Stargazers