NVIDIA MIG(멀티-인스턴스 GPU) — 개념만 쏙쏙 이해하기

MIG가 뭐죠?

Introduction — NVIDIA Multi-Instance GPU User Guide

MIG(Multi-Instance GPU)는 한 장의 데이터센터용 NVIDIA GPU를 여러 개의 ‘작은 GPU’로 하드웨어 수준에서 나눠 쓰는 기술이에요.
각 인스턴스는 자기만의 연산 코어, 캐시, 메모리를 갖고 있어서 서로 간섭이 적고 성능이 예측 가능합니다.

Multi-Instance GPU (MIG) | NVIDIA

한 장의 A100/H100 등 → 최대 7개(모델별 상이)까지 독립 인스턴스로 분할 가능
각 인스턴스는 고정된 자원 슬라이스를 보장(메모리/SM/캐시)
목표: 다중 사용자/서비스를 안정적인 QoS로 동시에 돌리기
Multi-Instance GPU (MIG) | NVIDIA

왜 필요한가?

낭비 줄이기
큰 GPU를 작은 작업이 단독 점유하면 자원이 놀아요. MIG로 쪼개면 알맞은 크기만큼 배정해 활용률을 끌어올릴 수 있습니다.
Multi-Instance GPU (MIG) | NVIDIA
간섭 줄이기
여러 작업을 한 GPU에 그냥 섞어 돌리면 지연이 들쑥날쑥합니다. MIG는 칩 내부 하드 파티션이라 테넌트 간 간섭이 크게 줄어요.
nvidia-ampere-architecture-whitepaper.pdf
예측 가능한 성능(QoS)
각 인스턴스의 자원이 고정이라 SLA 잡기가 쉬워집니다. 클라우드·플랫폼 운영에 특히 좋아요.
Maximizing GPU utilization with NVIDIA’s Multi-Instance GPU (MIG) on Amazon EKS: Running more pods per GPU for enhanced performance | Containers

기본 용어만 알면 끝

MIG 인스턴스(GPU Instance): ‘작은 GPU’ 하나라고 생각하면 됩니다(독립 연산·메모리).
MIG User Guide — NVIDIA Multi-Instance GPU User Guide
프로파일(예: 1g.5gb, 2g.10gb): “얼마나 큰 인스턴스를 만들지”를 정하는 템플릿. g는 연산 슬라이스, gb는 메모리 용량의 관념적 표시입니다(실제 가능한 조합은 GPU 모델별 상이).
MIG User Guide — NVIDIA Multi-Instance GPU User Guide
DCGM 모니터링: MIG 인스턴스 단위로 사용량을 관찰할 수 있는 NVIDIA 공식 모니터링 스택.
Overview — NVIDIA DCGM Documentation latest documentation

다른 기술과 뭐가 달라요? (헷갈리는 포인트)

MIG vs. MPS
- MIG: 칩을 물리적으로 방 쪼개기(하드 파티션).
- MPS: 같은 방에서 순서 잘 정해 쓰기(스케줄링). 목적과 격리 강도가 다릅니다.
  nvidia-ampere-architecture-whitepaper.pdf
MIG vs. SR-IOV
- MIG: GPU 칩 내부 자원을 나눔 → QoS 강함.
- SR-IOV: PCIe 장치를 여러 **VF(가상 함수)**로 나눠 VM에 붙임 → 가상화/패스스루 친화. (목적은 비슷하지만 동작 층위가 달라 대체 관계가 아닙니다.)
  MIG User Guide — NVIDIA Multi-Instance GPU User Guide

언제 MIG를 쓰면 좋을까?

여러 팀/고객이 동시에 추론을 돌리는 멀티 테넌트 환경
지연/스루풋의 예측 가능성이 중요한 SaaS/플랫폼
클러스터 활용률을 올리되 각 작업의 성능 흔들림을 최소화하고 싶을 때
Maximizing GPU utilization with NVIDIA’s Multi-Instance GPU (MIG) on Amazon EKS: Running more pods per GPU for enhanced performance | Containers

개념 한눈에 보기 (이미지·자료)

- NVIDIA 공식 소개(개요 및 다이어그램):
https://www.nvidia.com/en-us/technologies/multi-instance-gpu/

- A100 아키텍처 화이트페이퍼(MIG 개념 그림 포함, Figure 예시):
https://images.nvidia.com/aem-dam/en-zz/Solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf

- 사용자 가이드(개념/프로파일/지원 하드웨어 정리):
웹 버전 https://docs.nvidia.com/datacenter/tesla/mig-user-guide/index.html
PDF 버전 https://docs.nvidia.com/datacenter/tesla/pdf/NVIDIA_MIG_User_Guide.pdf

- 운영 관점(쿠버네티스 사례 글):
AWS 블로그 — EKS에서 MIG 활용: https://aws.amazon.com/blogs/containers/maximizing-gpu-utilization-with-nvidias-multi-instance-gpu-mig-on-amazon-eks-running-more-pods-per-gpu-for-enhanced-performance/

- 모니터링(DCGM / dcgm-exporter):
https://docs.nvidia.com/datacenter/dcgm/latest/user-guide/
https://docs.nvidia.com/datacenter/dcgm/latest/gpu-telemetry/dcgm-exporter.html

마지막 한 줄 요약

MIG = 한 장의 대형 GPU를 여러 개의 ‘작은, 서로 간섭 적은 GPU’로 하드하게 쪼개는 기술.
멀티 테넌트 추론에 성능 예측성과 활용률을 동시에 챙기려면, MIG 개념을 이해하는 것만으로도 큰 이득입니다.

Multi-Instance GPU (MIG) | NVIDIA

⚙️ AI PC·서버 맞춤 견적 상담

전화/이메일 문의 → 스펙 구성/견적 → 결제 → 제작/테스트 → 출고/방문 설치

제이씨현시스템(주) AI연구소
server@jchyun.com
Tel. +82-2-6715-2161

'AI Server' 카테고리의 다른 글

NVIDIA MIG vs AMD SR-IOV — 목적은 같아도 방식은 다르다 (0)	2025.11.04
SR-IOV 한 장 요약 — “하나의 PCIe 장치를 여러 개처럼 쓰는 법” (0)	2025.11.04
AI 챗봇 캐릭터 스타트업, RTX 5090 4장 구성의 Deepsilent X4 AI 수냉 서버 구축 완료 (0)	2025.11.04
RTX 5090과 함께, 차세대 드론 매핑의 미래를 열다: PIX4Dmapper vs PIX4Dmatic (1)	2025.09.22
미래를 손에 쥐다: RTX 5090 4장 - 압도적인 컴퓨팅의 신세계 (0)	2025.09.22

잡다한이야기

NVIDIA MIG(멀티-인스턴스 GPU) — 개념만 쏙쏙 이해하기

MIG가 뭐죠?

왜 필요한가?

기본 용어만 알면 끝

다른 기술과 뭐가 달라요? (헷갈리는 포인트)

언제 MIG를 쓰면 좋을까?

개념 한눈에 보기 (이미지·자료)

마지막 한 줄 요약

⚙️ AI PC·서버 맞춤 견적 상담

'AI Server' 카테고리의 다른 글

티스토리툴바

NVIDIA MIG(멀티-인스턴스 GPU) — 개념만 쏙쏙 이해하기

MIG가 뭐죠?

왜 필요한가?

기본 용어만 알면 끝

다른 기술과 뭐가 달라요? (헷갈리는 포인트)

언제 MIG를 쓰면 좋을까?

개념 한눈에 보기 (이미지·자료)

마지막 한 줄 요약

⚙️ AI PC·서버 맞춤 견적 상담

'AI Server' 카테고리의 다른 글

관련글

티스토리툴바