본문 바로가기
AI Server

NVIDIA MIG(멀티-인스턴스 GPU) — 개념만 쏙쏙 이해하기

by UpDream- 2025. 11. 4.

MIG가 뭐죠?

Introduction — NVIDIA Multi-Instance GPU User Guide

MIG Overview

 

MIG(Multi-Instance GPU)는 한 장의 데이터센터용 NVIDIA GPU를 여러 개의 ‘작은 GPU’로 하드웨어 수준에서 나눠 쓰는 기술이에요.
각 인스턴스는 자기만의 연산 코어, 캐시, 메모리를 갖고 있어서 서로 간섭이 적고 성능이 예측 가능합니다.

Multi-Instance GPU (MIG) | NVIDIA

  • 한 장의 A100/H100 등 → 최대 7개(모델별 상이)까지 독립 인스턴스로 분할 가능
  • 각 인스턴스는 고정된 자원 슬라이스를 보장(메모리/SM/캐시)
  • 목표: 다중 사용자/서비스안정적인 QoS로 동시에 돌리기
  • Multi-Instance GPU (MIG) | NVIDIA

왜 필요한가?

  1. 낭비 줄이기
    큰 GPU를 작은 작업이 단독 점유하면 자원이 놀아요. MIG로 쪼개면 알맞은 크기만큼 배정해 활용률을 끌어올릴 수 있습니다.
    Multi-Instance GPU (MIG) | NVIDIA
  2. 간섭 줄이기
    여러 작업을 한 GPU에 그냥 섞어 돌리면 지연이 들쑥날쑥합니다. MIG는 칩 내부 하드 파티션이라 테넌트 간 간섭이 크게 줄어요.
    nvidia-ampere-architecture-whitepaper.pdf
  3. 예측 가능한 성능(QoS)
    각 인스턴스의 자원이 고정이라 SLA 잡기가 쉬워집니다. 클라우드·플랫폼 운영에 특히 좋아요.
    Maximizing GPU utilization with NVIDIA’s Multi-Instance GPU (MIG) on Amazon EKS: Running more pods per GPU for enhanced performance | Containers

기본 용어만 알면 끝


다른 기술과 뭐가 달라요? (헷갈리는 포인트)

  • MIG vs. MPS
    • MIG: 칩을 물리적으로 방 쪼개기(하드 파티션).
    • MPS: 같은 방에서 순서 잘 정해 쓰기(스케줄링). 목적과 격리 강도가 다릅니다.
      nvidia-ampere-architecture-whitepaper.pdf
  • MIG vs. SR-IOV
    • MIG: GPU 칩 내부 자원을 나눔 → QoS 강함.
    • SR-IOV: PCIe 장치를 여러 **VF(가상 함수)**로 나눠 VM에 붙임 → 가상화/패스스루 친화. (목적은 비슷하지만 동작 층위가 달라 대체 관계가 아닙니다.)
      MIG User Guide — NVIDIA Multi-Instance GPU User Guide

언제 MIG를 쓰면 좋을까?


개념 한눈에 보기 (이미지·자료)

- NVIDIA 공식 소개(개요 및 다이어그램):
https://www.nvidia.com/en-us/technologies/multi-instance-gpu/

-  A100 아키텍처 화이트페이퍼(MIG 개념 그림 포함, Figure 예시):
https://images.nvidia.com/aem-dam/en-zz/Solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf

-  사용자 가이드(개념/프로파일/지원 하드웨어 정리):
웹 버전 https://docs.nvidia.com/datacenter/tesla/mig-user-guide/index.html
PDF 버전 https://docs.nvidia.com/datacenter/tesla/pdf/NVIDIA_MIG_User_Guide.pdf

-  운영 관점(쿠버네티스 사례 글):
AWS 블로그 — EKS에서 MIG 활용: https://aws.amazon.com/blogs/containers/maximizing-gpu-utilization-with-nvidias-multi-instance-gpu-mig-on-amazon-eks-running-more-pods-per-gpu-for-enhanced-performance/

-  모니터링(DCGM / dcgm-exporter):
https://docs.nvidia.com/datacenter/dcgm/latest/user-guide/
https://docs.nvidia.com/datacenter/dcgm/latest/gpu-telemetry/dcgm-exporter.html

 


마지막 한 줄 요약

MIG = 한 장의 대형 GPU를 여러 개의 ‘작은, 서로 간섭 적은 GPU’로 하드하게 쪼개는 기술.
멀티 테넌트 추론에 성능 예측성활용률을 동시에 챙기려면, MIG 개념을 이해하는 것만으로도 큰 이득입니다.

Multi-Instance GPU (MIG) | NVIDIA

 

 


 

 

⚙️ AI PC·서버 맞춤 견적 상담

전화/이메일 문의 → 스펙 구성/견적 → 결제 → 제작/테스트 → 출고/방문 설치

 

제이씨현시스템(주) AI연구소
server@jchyun.com
Tel. +82-2-6715-2161