개발자/인공지능과 인간

고성능 인공지능 서버 시스템 구성 참고 NVIDIA Tesla GPU Computing

지구빵집 2020. 7. 27. 22:27
반응형

 

 

NVIDIA Tesla GPU Computing 

Revolution High Performance Computing 

Graphic Computing using GPU Virtualization 

 

 

- LSF Master 서버에 접속 하여 LSF Scheduler를 통해 GPU 노드(5대)에 job할당
- 각 GPU 노드에는 Docker로 구성, docker private registry를 통해 모든 노드가 같은 이미지 공유
- PowerAI toolkit 무료 제공 (LMS, DDL 기능 포함)
- 병렬파일시스템(Spectrum Scale, a.k.a. GPFS) 서버 2대를 별도 구성
- GPU 서버간 통신 및 스토리지를 모두 100Gb EDR InfiniBand로 연결
- 사용자가 원하는 환경의 docker images 제공(내부 Hub저장소 운용)
- 사용자 관리 용이성을 위한 다양한 스크립트 제공  

 

각 부분 기능과 구성 - 도커 설명 등 추가

 

 

 

 

 

반응형