PKUHPC/CraneSched
A High Performance HPC and Cloud Computing Fused Job Scheduling System
C++NOASSERTION
Issues
- 0
增加作业展示信息
#295 opened by Ashlee1994 - 0
增加节点展示信息
#296 opened by Ashlee1994 - 0
calloc默认分配的内存大小与CPU成正比
#139 opened by Ashlee1994 - 2
普通用户不能修改自己作业的timelimit
#169 opened by Ashlee1994 - 1
添加作业运行生命周期内发送邮箱功能
#250 opened by Ashlee1994 - 1
新增cqueue -self 功能,直接显示用户自己所有作业信息
#309 opened by Ashlee1994 - 1
实现LSF wrapper
#225 opened by Ashlee1994 - 0
修改默认的内存大小单位,将以B为单位的内存全部改为MB为单位
#140 opened by Ashlee1994 - 10
作业添加priority属性,并对多因素综合调度算法进行测试
#158 opened by Ashlee1994 - 0
实现slurm wrapper
#224 opened by Ashlee1994 - 0
修改作业优先级,将某个作业设置为最高优先级
#251 opened by Ashlee1994 - 5
Craned运行出错
#257 opened by Aurora211 - 3
动态调整节点分区
#249 opened by Ashlee1994 - 0
节点独占和抢占等模式
#247 opened by Ashlee1994 - 19
针对EL8家族系统更新安装配置文档
#237 opened by MidsummerNight - 1
demo无法正常使用
#243 opened by KaranocaVe - 3
Question about scheduling performance
#220 opened by riccck - 0
对华为NPU芯片的支持
#241 opened by Ashlee1994 - 0
添加license管理功能
#233 opened by Ashlee1994 - 0
申请CPU数量是浮点数,存在运行过程中浮点数错误累积导致系统对节点资源状态错误判断问题
#149 opened by Ashlee1994 - 0
添加windows指令和资源使用支持
#234 opened by Ashlee1994 - 0
与k8s融合调度
#232 opened by Ashlee1994 - 0
添加ceff查看作业资源使用状况的命令
#231 opened by Ashlee1994 - 0
cgroups创建时就要限制资源,否则非执行节点的cgroup无资源限制
#151 opened by RileyWen - 0
修改任务描述方式,将前后端所有的task改成job
#142 opened by Ashlee1994 - 0
获取用户的环境变量--get-user-env(CBATCH_GET_USER_ENV)
#141 opened by Ashlee1994 - 1
修改前端命令的超时问题的输出
#180 opened by Ashlee1994 - 0
cranectld主控备份
#228 opened by Ashlee1994 - 1
Job suspend 和resume功能
#223 opened by Ashlee1994 - 0
作业监控功能,提供作业运行状态的内存、CPU资源使用情况和利用率
#227 opened by Ashlee1994 - 0
作业弹性上云,本地资源不够自动在云上进行计算,并回传结果
#226 opened by Ashlee1994 - 0
拆分现有数据库为database.yaml和config.yaml两个文件,cranectld读取两个文件,craned只读取config.yaml文件
#192 opened by Ashlee1994 - 1
cqueue cacct等前端命令输出字段间距不一致问题
#147 opened by Ashlee1994 - 1
添加对节点状态的变更的一个事件处理流程
#191 opened by Ashlee1994 - 3
craned启动失败
#184 opened by s1015693563 - 0
用户有好几个账号,但是cacctmgr show account只显示默认账号
#148 opened by Ashlee1994 - 1
作业结束时间 EndTime,改成作业运行时间加上作业运行时长
#143 opened by Ashlee1994 - 0
增加根据作业结束时间段查询作业的GRPC和前端接口
#138 opened by Ashlee1994 - 0
cbatch提交作业节点不够导致无限pending
#164 opened by June19980 - 0
指定/tmp目录作业一种资源,用户需要时可以申请资源
#175 opened by Ashlee1994 - 0
定义集群网络拓扑,跨节点任务优先提交到在同一个交换机下的节点组里,没有选择的情况下才考虑跨交换机情况
#174 opened by Ashlee1994 - 0
作业运行一段时间之后可以修改作业资源数量
#173 opened by Ashlee1994 - 1
增加作业dependency的功能
#172 opened by Ashlee1994 - 0
增加QOS的资源限制条目
#171 opened by Ashlee1994 - 0
需要修改树状结构,针对每一个普通用户,还有最大提交作业数、作业最长运行时间、优先级、最大作业数等限制
#170 opened by Ashlee1994 - 1
任务队列恢复机制存在漏洞
#150 opened by RileyWen - 0
集群打包安装方案,只需要一个配置文件(指定哪个节点是cranectld节点,哪些节点是计算节点,以及集群配置文件)和一个脚本,就可以完成整个集群的部署
#137 opened by Ashlee1994 - 0
集群yum安装,各个组件通过yum可以直接安装,不需要编译部署
#136 opened by Ashlee1994 - 0
- 0
两级调度,在crane上面搭建一个xcrane,对跨集群的crane进行跨域调度
#134 opened by Ashlee1994