那些现实中不曾发出的声音,请把它留在这里...
登录后可使用完整功能
被自己蠢哭了。。。刚刚debug自己写的启动分布式任务的脚本,发现自己写了个killall把前面启动的程序给干掉了,导致所有worker傻等一堆不存在的节点响应NCCL通讯建立
推荐阅读
发表评论