FlagOpen/FlagPerf

环境变量LOCAL_RANK被start_pytorch_task.py改变

xiaohan4420 opened this issue · 1 comments

描述:
使用training/run_benchmarks/pytorch/start_pytorch_task.py启动训练时,单机单卡场景默认LOCAL_RANK=-1会被

current_env["LOCAL_RANK"] = str(local_rank)
修改,导致后续错误。
process = subprocess.Popen(start_cmd, shell=True, env=current_env)

比如调用accelerate时会导致https://github.com/huggingface/accelerate/blob/80da9cfb09bb3cc9f1b385cb55d6b90d025a5fd9/src/accelerate/state.py#L195 处分布式类型判断出错。

目前FlagPerf尚不支持采用huggingface accelerate的API进行评测