스위치 이중화를 위한 핵심 네트워크 개념 정리 — VLAN·SVI·LACP·MLAG/VLT·VRRP/VIP·IPMI·PXE
Arista·25G 구축/검증 시리즈(관리 IP·25G 링크·트랜시버·netplan)를 읽다 보면 VLAN, SVI, LACP, MLAG/VLT, VRRP, VIP, IPMI, PXE 같은 용어가 계속 나온다. 이 글은 그 개념들을, 특히 스위치 이중화(고가용성) 관점에서 계층별로 정리한다.
대상: 네트워크 구성/이중화 용어를 처음 정리하는 서버·인프라 엔지니어
[00] 왜 “이중화”인가 — 단일 장애점 제거
서버 한 대가 스위치 한 대에 케이블 한 가닥으로 붙어 있으면, 스위치·케이블·포트 중 어느 하나만 죽어도 통신이 끊긴다. 이중화(redundancy, 고가용성/HA)는 이 단일 장애점(SPOF, Single Point of Failure) 을 없애기 위해 경로·장비·게이트웨이를 둘 이상으로 만드는 것이다.
이중화는 계층별로 따로 설계한다.
| 계층 | 무엇을 이중화 | 핵심 기술 |
|---|---|---|
| 물리/링크 (L1~L2) | 케이블·포트·스위치 섀시 | LACP, Port-Channel, MLAG/VLT, STP |
| 네트워크 (L2/L3 경계) | 브로드캐스트 도메인·게이트웨이 | VLAN, SVI, VRRP/VIP, FHRP |
| L3 라우팅 (코어/스파인) | 상위 경로 | ECMP, OSPF/BGP |
| 서버 측 | NIC·업링크 | bonding(본딩) |
| 운영/관리 | 장비 접근 경로·부팅 | IPMI/BMC, PXE |
아래에서 하나씩 본다.
[01] L2 기반 — VLAN과 SVI
[01-1] VLAN — 하나의 스위치를 여러 개로 쪼개기
VLAN(Virtual LAN) 은 물리적으로 같은 스위치를 논리적으로 분리된 여러 브로드캐스트 도메인으로 나누는 기술이다. VLAN 10(서버망)과 VLAN 20(관리망)은 같은 스위치에 있어도 서로 직접 통신하지 못한다(라우팅을 거쳐야 한다).
| 포트 모드 | 의미 |
|---|---|
| Access | 한 VLAN에만 속하는 포트 (보통 서버·PC 연결). 태그 없음 |
| Trunk | 여러 VLAN을 한 링크로 실어 나르는 포트 (스위치 간 연결). 802.1Q 태그로 VLAN 구분 |
1
2
3
4
5
6
7
8
9
10
11
! Arista EOS 예시
vlan 10
name SERVER
vlan 20
name MGMT
interface Ethernet1
switchport mode access
switchport access vlan 10
interface Ethernet48
switchport mode trunk
switchport trunk allowed vlan 10,20
이중화 관점: VLAN 자체는 이중화 기술이 아니라 분할 기술이다. 하지만 뒤의 SVI·VRRP·MLAG가 모두 VLAN 위에서 동작하므로 출발점이 된다.
[01-2] SVI — VLAN에 IP를 주는 L3 인터페이스
스위치 포트는 기본적으로 L2(스위칭)만 한다. VLAN 간 라우팅을 하려면 그 VLAN에 게이트웨이 IP가 있어야 한다. 그 IP를 갖는 가상 인터페이스가 SVI(Switched Virtual Interface) 다. Arista/Cisco에서는 interface Vlan10 형태로 만든다.
1
2
3
4
interface Vlan10
ip address 10.0.10.1/24 ! VLAN 10 서버들의 게이트웨이
interface Vlan20
ip address 10.0.20.1/24 ! VLAN 20 관리망의 게이트웨이
- VLAN 10에 속한 서버는 게이트웨이를
10.0.10.1(SVI)로 설정한다. - SVI는 물리 포트가 아니라 VLAN에 묶인 논리 L3 인터페이스다. 그 VLAN에 멤버 포트가 하나라도 up이면 SVI도 up 된다.
참고: 앞선 Arista 관리 IP 글의
Management1은 SVI가 아니라 전용 관리 포트다. SVI는 데이터 VLAN의 게이트웨이, Management 인터페이스는 OOB(out-of-band) 관리용으로 역할이 다르다.
[02] 링크·섀시 이중화 — LACP, Port-Channel, MLAG/VLT
[02-1] LACP와 Port-Channel — 여러 링크를 하나로 묶기
Port-Channel(=LAG, Link Aggregation Group) 은 여러 물리 링크를 하나의 논리 링크로 묶는 것이다. 효과는 두 가지.
- 대역폭 합산 — 25G × 2 = 약 50G
- 이중화 — 한 링크가 끊겨도 나머지로 계속 통신
LACP(Link Aggregation Control Protocol, 802.3ad) 는 이 묶음을 자동 협상·관리하는 프로토콜이다. 양쪽이 LACP 패킷(LACPDU)을 주고받아 묶음을 형성하고, 죽은 링크를 자동으로 뺀다.
| 모드 | 동작 |
|---|---|
active |
먼저 LACP 협상을 시작 |
passive |
상대가 시작하면 응답 |
static(on) |
협상 없이 강제 묶음 (권장하지 않음 — 장애 감지 약함) |
1
2
3
4
5
! Arista: Et1, Et2를 Port-Channel 1로 LACP 묶음
interface Ethernet1-2
channel-group 1 mode active
interface Port-Channel1
switchport mode trunk
[02-2] MLAG / VLT — “두 대의 스위치를 한 대처럼”
LACP 묶음은 보통 한 대의 스위치에 묶인다. 그러면 그 스위치가 통째로 죽으면 끝이다. 이를 해결하는 것이 MLAG/VLT — 서로 다른 두 대의 물리 스위치를 논리적으로 한 대처럼 보이게 해서, 서버가 두 스위치에 각각 한 가닥씩 연결하고도 하나의 LACP 묶음으로 동작하게 한다.
| 벤더 | 명칭 |
|---|---|
| Arista | MLAG (Multi-chassis Link Aggregation) |
| Dell | VLT (Virtual Link Trunking) |
| Cisco | vPC (virtual Port Channel) |
즉 VLT는 Dell, MLAG는 Arista의 같은 개념이다. 이름만 다르고 목적은 동일하다: 섀시(스위치 본체) 단위 이중화.
graph TD
SRV["서버 A
bond0 (802.3ad LACP)"]
SW1["스위치1
MLAG peer"]
SW2["스위치2
MLAG peer"]
SRV -->|eth0| SW1
SRV -->|eth1| SW2
SW1 <-->|"Peer-Link + Keepalive"| SW2
style SRV fill:#e8f5e9,stroke:#2e7d32
style SW1 fill:#e3f2fd,stroke:#1565c0
style SW2 fill:#e3f2fd,stroke:#1565c0
서버는 두 스위치에 한 가닥씩 연결하지만 하나의 LACP 본딩(bond0) 으로 동작하고, 스위치1·2는 MLAG 피어로 묶여 한 대처럼 보인다. 스위치1이 죽어도 서버는 eth1(스위치2)로 무중단 통신한다.
MLAG 내부 — 두 스위치를 묶는 두 개의 채널
MLAG가 두 스위치를 한 대처럼 보이게 하려면 둘 사이에 두 종류의 채널이 필요하다.
- Peer-Link: 데이터·상태(MAC 테이블, ARP) 동기화 경로. 보통 고대역 Port-Channel로 구성.
- Peer-Keepalive: 상대 생존 확인용 별도 경로. 보통 관리망을 통해 구성.
- Split-brain(스플릿 브레인): Peer-Link가 끊겨 두 스위치가 서로 죽은 줄 알고 둘 다 Master로 행동하는 위험 상태. Keepalive 경로로 이를 감지·방지한다.
[02-3] STP — 루프 방지(보조 개념)
이중 경로를 만들면 L2 루프(브로드캐스트 폭주) 위험이 생긴다. STP(Spanning Tree Protocol) 는 중복 경로 중 하나를 논리적으로 차단해 루프를 막는다. 단, MLAG 환경에서는 두 업링크를 둘 다 active로 쓰므로(STP가 막지 않음) 대역폭을 온전히 활용한다 — 이것이 MLAG의 장점 중 하나다.
[03] 게이트웨이 이중화 — VRRP와 VIP
스위치/링크를 이중화해도, 서버가 바라보는 게이트웨이 IP가 한 장비에만 있으면 그 장비가 죽을 때 외부 통신이 끊긴다. 게이트웨이 자체를 이중화하는 것이 VRRP다.
[03-1] VIP — 떠다니는 가상 IP
VIP(Virtual IP) 는 특정 물리 장비에 고정되지 않고 현재 활성(Master) 장비가 떠안는 가상의 IP 주소다. 서버는 실제 스위치 IP가 아니라 이 VIP를 게이트웨이로 바라본다.
[03-2] VRRP — VIP를 누가 들고 있을지 자동 선출
VRRP(Virtual Router Redundancy Protocol) 는 여러 라우터/L3 스위치가 하나의 VIP와 가상 MAC을 공유하고, 그중 Master 하나만 VIP를 응답하게 한다. Master가 죽으면 Backup이 즉시 VIP를 넘겨받아(failover) 서버는 게이트웨이가 바뀐 줄도 모르고 계속 통신한다.
1
2
3
4
5
6
7
8
9
10
11
! 스위치1 (Master 우선)
interface Vlan10
ip address 10.0.10.2/24
vrrp 10 ip 10.0.10.1 ! ← VIP (서버의 게이트웨이)
vrrp 10 priority 200 ! 높을수록 Master
! 스위치2 (Backup)
interface Vlan10
ip address 10.0.10.3/24
vrrp 10 ip 10.0.10.1 ! ← 같은 VIP 공유
vrrp 10 priority 100
| 항목 | 값 | 의미 |
|---|---|---|
| VIP | 10.0.10.1 |
서버가 보는 게이트웨이 (떠다님) |
| 스위치1 실 IP | 10.0.10.2 |
priority 200 → Master |
| 스위치2 실 IP | 10.0.10.3 |
priority 100 → Backup |
graph TD
SRV["서버
gateway = 10.0.10.1 (VIP)"]
VIP{{"VIP 10.0.10.1
가상 IP/MAC"}}
M["스위치1 (Master)
10.0.10.2 · priority 200"]
B["스위치2 (Backup)
10.0.10.3 · priority 100"]
SRV --> VIP
VIP -->|"평상시 응답"| M
VIP -.->|"Master 장애 시 인수 (failover)"| B
M <-->|"VRRP advertisement"| B
style SRV fill:#e8f5e9,stroke:#2e7d32
style VIP fill:#f3e5f5,stroke:#6a1b9a
style M fill:#e3f2fd,stroke:#1565c0
style B fill:#fff3e0,stroke:#e65100
MLAG(L2 섀시 이중화) + VRRP(L3 게이트웨이 이중화)를 함께 쓰면 링크·스위치·게이트웨이가 모두 이중화된다. 이것이 일반적인 이중화 토폴로지다.
[03-3] FHRP 가족 — VRRP만 있는 게 아니다
게이트웨이 이중화 프로토콜을 통칭 FHRP(First Hop Redundancy Protocol) 라 한다. VRRP는 그중 하나다.
| 프로토콜 | 벤더 | 특징 |
|---|---|---|
| VRRP | 표준(개방) | 가장 범용. Master 1 + Backup N |
| HSRP | Cisco 전용 | VRRP와 유사, Active/Standby 용어 사용 |
| GLBP | Cisco 전용 | 여러 게이트웨이가 동시에 트래픽 분담(로드밸런싱) |
Arista는 표준 VRRP를 쓴다. 멀티벤더 환경에선 표준 VRRP가 무난하다.
[04] 서버 측 이중화 — 본딩(bonding)
스위치 쪽 MLAG에 대응해, 서버도 NIC 두 장을 하나로 묶어야 한다. 리눅스에서는 이를 본딩(bonding) / 팀밍(teaming) 이라 한다. 스위치 MLAG와 짝을 이루려면 802.3ad(LACP) 모드를 쓴다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# netplan 예시 (LACP 본딩) — 두 NIC를 bond0으로
network:
version: 2
ethernets:
ens801f0np0: {}
ens801f1np1: {}
bonds:
bond0:
interfaces: [ens801f0np0, ens801f1np1]
parameters:
mode: 802.3ad # LACP
lacp-rate: fast
mii-monitor-interval: 100
addresses: [10.0.10.50/24]
routes:
- to: default
via: 10.0.10.1 # ← VRRP VIP
netplan으로 NIC를 직접 설정하는 방법은 netplan 수동 설정 글을 참고한다. 본딩 모드는 반드시 스위치 측 LACP/MLAG 설정과 일치해야 링크가 정상적으로 묶인다.
| bonding 모드 | 특징 | 스위치 요구 |
|---|---|---|
802.3ad (LACP) |
표준 LACP, 대역폭+이중화 | 스위치 Port-Channel/MLAG 필요 |
active-backup |
한 NIC만 사용, 죽으면 전환 | 스위치 설정 불필요 (가장 단순한 이중화) |
balance-xor 등 |
정적 해시 분산 | static LAG |
[05] 운영·관리 이중화 — IPMI/BMC와 PXE
[05-1] IPMI / BMC — OS와 무관한 별도 관리 경로
IPMI(Intelligent Platform Management Interface) 는 서버의 BMC(Baseboard Management Controller) 칩이 제공하는 대역 외(out-of-band) 관리 표준이다. 핵심은 OS·메인 NIC와 완전히 분리되어 있다는 점이다.
- 전용 관리 LAN 포트와 자체 IP를 가진다 (서버 OS가 꺼져 있어도 동작).
- 원격 전원 on/off/리셋, 하드웨어 센서(온도·팬·전압), 원격 콘솔(SOL/KVM) 제공.
- 벤더 구현: Dell iDRAC, HPE iLO, Supermicro IPMI, Lenovo XCC 등.
이중화 관점: 데이터망/OS가 다운돼도 IPMI 경로로 서버를 진단·복구할 수 있다 — 관리 경로의 이중화다. 앞선 관리 IP/SSH 글의 “관리망”이 바로 이런 OOB 관리 트래픽이 흐르는 망이다.
1
2
3
4
관리망 (VLAN 20 / OOB)
├── 스위치 Management1 (장비 관리 SSH)
├── 서버1 IPMI/BMC (전원·콘솔, OS와 별개 IP)
└── 서버2 IPMI/BMC
[05-2] PXE — 네트워크로 OS를 부팅
PXE(Preboot eXecution Environment) 는 서버가 로컬 디스크가 아니라 네트워크에서 부팅 이미지를 받아 부팅하게 하는 표준이다. 대량 서버 프로비저닝·무디스크 노드·자동 OS 설치에 쓴다.
동작 흐름:
1
2
3
1. NIC가 PXE로 부팅 → DHCP 요청 (IP + next-server + 부트파일명 수신)
2. TFTP/HTTP로 부트로더(예: iPXE, GRUB) 다운로드
3. 부트로더가 커널·initrd·킥스타트/프리시드 받아 OS 설치·부팅
PXE를 위한 DHCP Relay
PXE 클라이언트와 DHCP 서버가 다른 VLAN에 있으면, 브로드캐스트인 DHCP가 라우터를 못 넘는다. SVI에 DHCP relay(ip helper-address) 를 걸어 DHCP 요청을 서버로 중계한다.
1
2
3
interface Vlan30
ip address 10.0.30.1/24
ip helper-address 10.0.99.10 ! DHCP/PXE 서버 주소
이중화 관점: PXE 인프라(DHCP·TFTP) 자체를 이중화하면 프로비저닝 경로의 단일 장애점을 없앤다. PXE는 VLAN·SVI(게이트웨이) 위에서 동작하므로, 부팅용 VLAN과 DHCP relay 설계가 함께 필요하다.
[06] 전체 그림 — 개념이 어떻게 한 토폴로지로 엮이는가
graph TD
CORE["외부망 / 코어"]
VIP{{"VRRP VIP 10.0.10.1
게이트웨이 이중화"}}
SW1["스위치1
SVI Vlan10 · MLAG"]
SW2["스위치2
SVI Vlan10 · MLAG"]
S1["서버1
bond0 (802.3ad)"]
S2["서버2
bond0 (802.3ad)"]
MGMT["관리망 VLAN 20 (OOB)
IPMI/BMC · Management1"]
CORE --> VIP
VIP --> SW1
VIP --> SW2
SW1 <-->|"Peer-Link"| SW2
SW1 ---|LACP| S1
SW2 ---|LACP| S1
SW1 ---|LACP| S2
SW2 ---|LACP| S2
S1 -.->|OOB| MGMT
S2 -.->|OOB| MGMT
style CORE fill:#eceff1,stroke:#455a64
style VIP fill:#f3e5f5,stroke:#6a1b9a
style SW1 fill:#e3f2fd,stroke:#1565c0
style SW2 fill:#e3f2fd,stroke:#1565c0
style S1 fill:#e8f5e9,stroke:#2e7d32
style S2 fill:#e8f5e9,stroke:#2e7d32
style MGMT fill:#fff3e0,stroke:#e65100
| 이중화 대상 | 담당 개념 |
|---|---|
| 케이블·포트 | LACP / Port-Channel |
| 스위치 섀시 | MLAG(Arista) / VLT(Dell) |
| L2 루프 방지 | STP (MLAG에선 보조) |
| 게이트웨이(L3) | VRRP + VIP (FHRP) |
| 서버 업링크 | bonding(802.3ad) |
| 관리 경로 | IPMI/BMC + 관리 VLAN |
| 프로비저닝 | PXE (DHCP/TFTP 이중화) |
[07] L3 라우팅 이중화 — ECMP와 BGP/OSPF
게이트웨이까지는 VRRP로 이중화했다면, 그 위(코어/스파인) 구간은 동적 라우팅으로 이중화한다. VRRP가 “게이트웨이 한 홉”의 이중화라면, 이쪽은 “그 너머 경로”의 이중화다.
- ECMP(Equal-Cost Multi-Path): 비용이 같은 경로 여러 개로 트래픽을 분산하고, 한 경로가 죽으면 자동 우회한다. 대역폭과 이중화를 동시에 얻는다.
- OSPF / BGP: 경로를 동적으로 학습하고 장애 시 재수렴(reconverge)한다. 현대 데이터센터(leaf-spine fabric)는 L2 MLAG 대신 L3 + BGP/EVPN으로 가는 추세다.
graph TD
LEAF["Leaf 스위치"]
SP1["Spine 1"]
SP2["Spine 2"]
DST["목적지 대역"]
LEAF -->|"경로 A · cost 10"| SP1
LEAF -->|"경로 B · cost 10"| SP2
SP1 --> DST
SP2 --> DST
style LEAF fill:#e8f5e9,stroke:#2e7d32
style SP1 fill:#e3f2fd,stroke:#1565c0
style SP2 fill:#e3f2fd,stroke:#1565c0
style DST fill:#eceff1,stroke:#455a64
비용이 같은 두 경로를 동시에 쓰며(ECMP 부하분산), 한 경로(Spine)가 죽으면 라우팅이 재수렴해 나머지 경로로 자동 우회한다.
소규모는 MLAG+VRRP(L2 중심), 대규모는 L3 라우팅(ECMP+BGP) 중심으로 설계가 갈린다.
[08] 물리계층에서 함께 맞춰야 할 값 — MTU/Jumbo·FEC·트랜시버
이중화 자체는 아니지만, 25G 링크를 정상 동작시키려면 물리·링크 계층에서 양단이 맞아야 하는 값들이다. 이 값이 어긋나면 이중화 이전에 링크 품질·연결 자체가 깨진다.
- Jumbo Frame (MTU 9000+): 대용량 전송 효율을 높인다. 경로 전체(서버 NIC·본딩·스위치 포트·SVI)가 동일 MTU여야 한다. 한 곳만 다르면 단편화·블랙홀이 발생한다.
- FEC(RS-FEC): 25G 이상 고속 링크의 비트 오류를 정정한다. 양단 FEC 모드가 일치해야 링크가 안정적으로 올라온다 → 25G 검증 글 참조.
-
트랜시버 호환성: 스위치가 모듈을
xcvr-unsupported로 차단하면 링크 자체가 안 온다 → GBIC 테스트 글 참조.
[09] 대규모 환경의 현대적 대안 — VXLAN/EVPN과 Anycast Gateway
대규모 환경에선 VLAN의 한계(ID 4094개, L2 도메인 확장의 어려움)를 넘기 위해 VXLAN(L3 위에 L2를 터널링)과 EVPN(그 컨트롤 플레인)을 쓴다.
이때 게이트웨이는 VRRP 대신 Anycast Gateway — 모든 leaf 스위치가 동일한 게이트웨이 IP/MAC을 동시에 보유해, 서버가 어디에 붙어도 가장 가까운 스위치가 게이트웨이가 되는 방식 — 로 이중화한다.
본 글의 주제(소~중규모 스위치 이중화)에서는 MLAG+VRRP로 충분하다. VXLAN/EVPN은 “더 큰 그림”으로 개념만 알아두면 된다.
[10] 용어 빠른 정리표
| 용어 | 한 줄 정의 | 계층 | 이중화 역할 |
|---|---|---|---|
| VLAN | 스위치를 논리적으로 분할한 브로드캐스트 도메인 | L2 | 분할(기반) |
| SVI | VLAN에 IP를 부여하는 가상 L3 인터페이스(게이트웨이) | L3 | VRRP의 토대 |
| LACP | 여러 링크를 자동 협상해 하나로 묶는 프로토콜(802.3ad) | L2 | 링크 이중화 |
| Port-Channel/LAG | LACP로 묶인 논리 링크 | L2 | 대역폭+이중화 |
| MLAG / VLT | 두 스위치를 한 대처럼 — 섀시 단위 이중화 (Arista/Dell) | L2 | 스위치 이중화 |
| Peer-Link/Keepalive | MLAG 두 스위치의 상태 동기화·생존 확인 경로 | L2 | MLAG 안정 |
| STP | L2 루프 차단 | L2 | 루프 방지 |
| VRRP | VIP를 Master/Backup이 자동 인수인계하는 프로토콜 | L3 | 게이트웨이 이중화 |
| VIP | 활성 장비가 떠안는 가상 게이트웨이 IP | L3 | 게이트웨이 이중화 |
| FHRP (HSRP/GLBP) | 게이트웨이 이중화 프로토콜 통칭 (VRRP 포함) | L3 | 게이트웨이 이중화 |
| bonding | 서버 NIC 여러 장을 묶기(LACP/active-backup) | 서버 | 서버 업링크 이중화 |
| ECMP | 동일 비용 다중경로 분산·우회 | L3 | 경로 이중화 |
| OSPF/BGP | 동적 라우팅 학습·재수렴 | L3 | 경로 이중화 |
| IPMI/BMC | OS와 분리된 OOB 하드웨어 관리(전원·콘솔) | 관리 | 관리 경로 이중화 |
| PXE | 네트워크 부팅(DHCP+TFTP) | 부팅 | 프로비저닝 |
| DHCP relay | 다른 VLAN의 DHCP로 중계(ip helper-address) |
L3 | PXE 지원 |
| Jumbo/MTU | 큰 프레임; 경로 전체 동일해야 함 | L2/L3 | (성능) |
| FEC(RS-FEC) | 고속 링크 비트오류 정정, 양단 일치 | L1 | (링크 안정) |
| VXLAN/EVPN | L2 over L3 + Anycast Gateway | overlay | 대규모 이중화 |
[11] 정리
스위치 이중화는 한 가지 기술이 아니라 계층별 기술의 조합이다.
- VLAN/SVI 로 망을 나누고 게이트웨이를 만든다.
- LACP/Port-Channel 로 링크를, MLAG/VLT 로 스위치 섀시를 이중화한다(Peer-Link/Keepalive로 동기화·Split-brain 방지).
- VRRP/VIP(FHRP) 로 게이트웨이를, ECMP/BGP 로 상위 경로를 이중화한다.
- 서버는 bonding(802.3ad) 으로 두 스위치에 동시에 붙는다.
- IPMI/BMC 로 OS와 무관한 관리 경로를, PXE 로 프로비저닝 경로를 갖춘다.
물리계층에서는 MTU·FEC·트랜시버 호환성을 양단에 맞춰야 링크가 정상 동작하고, 대규모로 가면 VXLAN/EVPN + Anycast Gateway 가 대안이 된다. 이 개념들을 머리에 넣고 보면, Arista 관리 IP·25G 링크·트랜시버·netplan 글에서 등장하는 Management1, Port-Channel, VLAN, 게이트웨이, 본딩 같은 용어가 하나의 이중화 그림 안에서 어디에 위치하는지 보이게 된다.