MIG가 뭐죠?
Introduction — NVIDIA Multi-Instance GPU User Guide

MIG(Multi-Instance GPU)는 한 장의 데이터센터용 NVIDIA GPU를 여러 개의 ‘작은 GPU’로 하드웨어 수준에서 나눠 쓰는 기술이에요.
각 인스턴스는 자기만의 연산 코어, 캐시, 메모리를 갖고 있어서 서로 간섭이 적고 성능이 예측 가능합니다.
Multi-Instance GPU (MIG) | NVIDIA
- 한 장의 A100/H100 등 → 최대 7개(모델별 상이)까지 독립 인스턴스로 분할 가능
- 각 인스턴스는 고정된 자원 슬라이스를 보장(메모리/SM/캐시)
- 목표: 다중 사용자/서비스를 안정적인 QoS로 동시에 돌리기
- Multi-Instance GPU (MIG) | NVIDIA
왜 필요한가?
- 낭비 줄이기
큰 GPU를 작은 작업이 단독 점유하면 자원이 놀아요. MIG로 쪼개면 알맞은 크기만큼 배정해 활용률을 끌어올릴 수 있습니다.
Multi-Instance GPU (MIG) | NVIDIA - 간섭 줄이기
여러 작업을 한 GPU에 그냥 섞어 돌리면 지연이 들쑥날쑥합니다. MIG는 칩 내부 하드 파티션이라 테넌트 간 간섭이 크게 줄어요.
nvidia-ampere-architecture-whitepaper.pdf - 예측 가능한 성능(QoS)
각 인스턴스의 자원이 고정이라 SLA 잡기가 쉬워집니다. 클라우드·플랫폼 운영에 특히 좋아요.
Maximizing GPU utilization with NVIDIA’s Multi-Instance GPU (MIG) on Amazon EKS: Running more pods per GPU for enhanced performance | Containers
기본 용어만 알면 끝
- MIG 인스턴스(GPU Instance): ‘작은 GPU’ 하나라고 생각하면 됩니다(독립 연산·메모리).
MIG User Guide — NVIDIA Multi-Instance GPU User Guide - 프로파일(예: 1g.5gb, 2g.10gb): “얼마나 큰 인스턴스를 만들지”를 정하는 템플릿. g는 연산 슬라이스, gb는 메모리 용량의 관념적 표시입니다(실제 가능한 조합은 GPU 모델별 상이).
MIG User Guide — NVIDIA Multi-Instance GPU User Guide - DCGM 모니터링: MIG 인스턴스 단위로 사용량을 관찰할 수 있는 NVIDIA 공식 모니터링 스택.
Overview — NVIDIA DCGM Documentation latest documentation
다른 기술과 뭐가 달라요? (헷갈리는 포인트)
- MIG vs. MPS
- MIG: 칩을 물리적으로 방 쪼개기(하드 파티션).
- MPS: 같은 방에서 순서 잘 정해 쓰기(스케줄링). 목적과 격리 강도가 다릅니다.
nvidia-ampere-architecture-whitepaper.pdf
- MIG vs. SR-IOV
- MIG: GPU 칩 내부 자원을 나눔 → QoS 강함.
- SR-IOV: PCIe 장치를 여러 **VF(가상 함수)**로 나눠 VM에 붙임 → 가상화/패스스루 친화. (목적은 비슷하지만 동작 층위가 달라 대체 관계가 아닙니다.)
MIG User Guide — NVIDIA Multi-Instance GPU User Guide
언제 MIG를 쓰면 좋을까?
- 여러 팀/고객이 동시에 추론을 돌리는 멀티 테넌트 환경
- 지연/스루풋의 예측 가능성이 중요한 SaaS/플랫폼
- 클러스터 활용률을 올리되 각 작업의 성능 흔들림을 최소화하고 싶을 때
Maximizing GPU utilization with NVIDIA’s Multi-Instance GPU (MIG) on Amazon EKS: Running more pods per GPU for enhanced performance | Containers
개념 한눈에 보기 (이미지·자료)
- NVIDIA 공식 소개(개요 및 다이어그램):
https://www.nvidia.com/en-us/technologies/multi-instance-gpu/
- A100 아키텍처 화이트페이퍼(MIG 개념 그림 포함, Figure 예시):
https://images.nvidia.com/aem-dam/en-zz/Solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf
- 사용자 가이드(개념/프로파일/지원 하드웨어 정리):
웹 버전 https://docs.nvidia.com/datacenter/tesla/mig-user-guide/index.html
PDF 버전 https://docs.nvidia.com/datacenter/tesla/pdf/NVIDIA_MIG_User_Guide.pdf
- 운영 관점(쿠버네티스 사례 글):
AWS 블로그 — EKS에서 MIG 활용: https://aws.amazon.com/blogs/containers/maximizing-gpu-utilization-with-nvidias-multi-instance-gpu-mig-on-amazon-eks-running-more-pods-per-gpu-for-enhanced-performance/
- 모니터링(DCGM / dcgm-exporter):
https://docs.nvidia.com/datacenter/dcgm/latest/user-guide/
https://docs.nvidia.com/datacenter/dcgm/latest/gpu-telemetry/dcgm-exporter.html
마지막 한 줄 요약
MIG = 한 장의 대형 GPU를 여러 개의 ‘작은, 서로 간섭 적은 GPU’로 하드하게 쪼개는 기술.
멀티 테넌트 추론에 성능 예측성과 활용률을 동시에 챙기려면, MIG 개념을 이해하는 것만으로도 큰 이득입니다.
Multi-Instance GPU (MIG) | NVIDIA

⚙️ AI PC·서버 맞춤 견적 상담
전화/이메일 문의 → 스펙 구성/견적 → 결제 → 제작/테스트 → 출고/방문 설치
제이씨현시스템(주) AI연구소
server@jchyun.com
Tel. +82-2-6715-2161
'AI Server' 카테고리의 다른 글
| NVIDIA MIG vs AMD SR-IOV — 목적은 같아도 방식은 다르다 (0) | 2025.11.04 |
|---|---|
| SR-IOV 한 장 요약 — “하나의 PCIe 장치를 여러 개처럼 쓰는 법” (0) | 2025.11.04 |
| AI 챗봇 캐릭터 스타트업, RTX 5090 4장 구성의 Deepsilent X4 AI 수냉 서버 구축 완료 (0) | 2025.11.04 |
| RTX 5090과 함께, 차세대 드론 매핑의 미래를 열다: PIX4Dmapper vs PIX4Dmatic (1) | 2025.09.22 |
| 미래를 손에 쥐다: RTX 5090 4장 - 압도적인 컴퓨팅의 신세계 (0) | 2025.09.22 |