/UserManagerBackend

通过ssh+gpustat来监控多个服务器状态

Primary LanguagePython

2022.3.15
一个资源展示界面,显示三台服务器的资源占用情况和用户连续占用时长。

文件:
- gpustatweb.py
    通过asyncssh登录三台服务器(预先在服务器中添加秘钥进行验证),每五秒进行一次查询,更新 host status 和 user use time两个字典。
    前端通过WebSocket进行连接,每5秒进行一次请求,返回 host status(string) 和 user use time(json)
- template/gpustat.html
    简单的html网页,加入了每5秒进行 /status 和 /time 的两次请求,根据请求结果更新展示信息

给老师提出了管理规则的建议,按照以下通知到了所有老师:

两台服务器的使用Tips:
为了有序管理,服务器把用户分为管理员账号(各讨论班指定一名同学负责,用户名为***tlb)、普通用户(用户名为姓名全拼),暂定下以下规则:
http://10.112.45.236/ 资源展示页面

对于普通用户:
1. 请勿重启!请勿重启!请勿重启!重启会导致服务器直接宕掉!
2. 申请账号请向各自讨论班管理员申请,用户名为自己姓名全拼,账号无sudo权限。(为有序管理,请大家理解) 如果发现私自创建的账号,直接删除。 如果需要安装软件,请向管理员申请。
3. 软件、数据尽量放在在自己的用户目录
4. Anaconda 环境已经装好,如果需要请创建自己的python环境
5. 两台3090服务器IP:10.126.239.153、10.126.196.102
6. 禁止用 ***tlb 账号占用GPU资源,如果需要,请用自己的账号。

对于管理员:
1. 新申请的用户不要添加sudo权限,用户名以姓名全称命名,用户目录放在 /home/***tlb 下。(adduser <姓名全拼> -d /home/***tlb/<姓名全拼> 即可)保持两台服务器申请的用户一致。
2. 关于软件安装位置,如果是apt安装,无法改变;如果是手动安装,则安装在/opt目录中。
3. 各自管理的 "***tlb" 默认密码和账号相同,密码可以自己改下,以防被意外登录。
4. 关于文件权限,请管理员自己安排,可以参考如下:所管理的用户加入 ***tlb 组中,/home/***tlb 及其子目录权限设置为751。