参考:https://blog.csdn.net/liangdong2014/article/details/78860661

当用shh连接服务器的时候,用GPU训练模型,在终端端口用ctrl+z终止训练,此时GPU资源可能未立即释放,这时候需要人工来杀死占用GPU显存的进程。
fuser 显示使用指定文件或者文件系统的进程的PID。
在centos系统下,输入以下指令安装

yum install psmisc

然后,查看占用GPU资源的进程及ID

fuser -v /dev/nvidia*

找到仍然在占用GPU的进程PID

kill -9 pid  # 表示强迫进程立即停止
kill pid # 也可以终止进程

查看进程的命令top和ps区别

ps看到的是命令执行瞬间的进程信息,而top可以持续的监视
ps只是查看进程,而top还可以监视系统性能,如平均负载,cpu和内存的消耗

top查看进程信息一个例子

 Tasks:  113 total     进程总数  
 1 running             正在运行的进程数  
 112sleeping           睡眠的进程数   
 0 stopped             停止的进程数  
 0 zombie              僵尸进程数 # 即需要我们找到,并强制终止的进程
Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐