머신러닝 & AI 개발자 Tip & 강좌 게시판

Data Scientist와 개발자를 위한 머신러닝, AI 등 개발 Tip과 강좌 게시판 입니다. 일반적인 머신러닝은 물론 딥러닝(Tensorflow, Keras, PyTorch 등), 인공지능 관련 업무를 진행하면서 얻은 Tip이나 강좌, 새로운 소식을 적어 주시면 다른 개발자 분들에게 큰 도움이 됩니다.

Deep Learning 개발 중 현재 GPU를 점유하는 pid 및 GPU 사용량 확인하는 방법

 

머신러닝 프로젝트나 개발을 하면서 GPU 작업을 시작하면, Iteration이 올라가지 않거나 GPU 작업만 멈춘 경우를 볼 수 있다.

또는 GPU 작업간 현재 사용량 정보를 확인할 필요가 있을 경우 htop 등과 다르게 GPU 유관 정보가 필요할때 유용하다.

 

Ubuntu의 기본적인 nvidia-smi 설치 경로

Ubuntu에 nvidia driver를 설치했다면, 기본적으로 link 되어 있다. /etc/bin 쪽에 연결되어 있다. 

Cloud 기반의 GPU가 pre-setup된 VM을 이용한다면, 일반적으로 걱정할 필요 없이 즉시 실행 가능하다.

 

실행 / bash 또는 윈도우 cmd에서 연속실행

nvidia-smi_1.jpg

 

이렇게 실행하고 결과를 확인 가능.

 

윈도우에서 연속 실행

아래와 같이 anyname.bat로 bat 파일을 만들고, 실행

 

:LOOP
nvidia-smi
ping 127.0.0.1 -n 3 >NUL
goto :LOOP

 

 

만약, path에 없다면, 적당히 시스템 환경 변수에 path를 걸어주자.

 

bash에서 연속 실행

간결하게 가능하다

 

while :; do clear; nvidia-smi; sleep 3; done

 

 

참고링크 

How do I run nvidia-smi on Windows? - Stack Overflow

Where can I find nvidia-smi.exe utility - CUDA / CUDA Programming and Performance - NVIDIA Developer Forums

Useful nvidia-smi commands - Learn CUDA Programming (packtpub.com)

 

 






XE Login