查看服务器的GPU使用情况

查看服务器的GPU使用情况#

登录服务器终端执行以下命令

nvidia-smi

执行成功返回的界面

image-20250815190317049

红色箭头指向代表GPU的型号,这里是Tesla V100-16GB版本

红线所划代表GPU的[已使用显存/总显存],当[已使用显存]接近[总显存]的时候,表示该GPU已经满负荷,大概率无法再加入新的任务

......

这里再放一波更详细的示意图

image-20250929201555233