CXL이 데이터센터 메모리 경제학을 통째로 바꾸는 방식
📝 데이터센터에서 DRAM은 가장 비싼데 가장 놀고 있는 자원이에요. CXL이 그 메모리를 '풀(pool)'로 묶어 공유하게 만들면서 메모리 단가가 56%까지 떨어지는 구조가 만들어지고 있어요. 누가 수혜자고, 누가 위험에 처하는지를 정리했습니다
📋 목차
- 1. 데이터센터 DRAM이 왜 그렇게 비효율적인가
- 2. CXL이 푸는 세 가지 문제, 확장·풀링·공유
- 3. 숫자로 본 메모리 경제학의 변화
- 4. CXL이 진짜 답이긴 한가, 회의론도 본다
- 5. CXL 채택을 끌어가는 진짜 동력은 AI
- 6. 수혜자와 위험에 처한 쪽 정리
- 7. 투자자가 봐야 할 시그널과 시점
데이터센터를 운영하는 하이퍼스케일러 입장에서 가장 골치 아픈 자원이 뭘까요? GPU? 아니에요. DRAM(메모리)이에요. 가장 비싸게 사놓고 평균 가동률이 40~60%밖에 안 되거든요.
SemiAnalysis가 올해 추정한 바에 따르면, 메모리는 2026년 하이퍼스케일러 자본지출의 약 30%를 차지할 전망이에요. 자본지출의 1/3이 메모리에 쏟아부어지는데, 그 메모리가 절반 가까이 놀고 있다는 게 지금의 현실이에요.
이 비효율을 풀려고 등장한 게 CXL(Compute Express Link)이에요. 단순히 "새로운 메모리 인터페이스" 정도가 아니라 데이터센터 메모리 경제학 자체를 바꾸는 표준이에요. 그래서 메모리 회사·서버 회사·하이퍼스케일러가 모두 주시하고 있어요.
데이터센터 DRAM이 왜 그렇게 비효율적인가
기존 서버 구조에서 DRAM은 한 CPU에 단단히 묶여 있어요. 서버 A의 DRAM은 서버 A의 CPU만 쓸 수 있고, 서버 B가 메모리가 부족해도 빌려 쓸 방법이 없어요. 풀어 말하면 옆 책상에 빈 의자가 있어도, 내 책상 의자가 아니라 못 앉는 구조예요.
그래서 하이퍼스케일러는 워크로드 피크에 맞춰서 DRAM을 충분히 박아둬야 해요. 평소엔 60% 정도만 쓰지만, 가끔 90%까지 치솟는 순간을 대비해 100% 용량을 깔아두는 거죠. 이게 'stranded memory' 문제예요.
📊 실제 데이터
CXL 컨소시엄의 자료에 따르면, CXL AIC(Add-In Card)를 추가해 메모리를 확장하면 GB당 메모리 비용이 약 56%까지 감소할 수 있어요. 같은 총 용량을 기존 방식으로 확보하려면 더 비싼 고용량 DIMM을 사야 하지만, CXL을 쓰면 저렴한 중용량 DIMM에 CXL 모듈을 조합해서 비슷한 성능을 낼 수 있어요.
또 하나 큰 문제는 DRAM이 CPU 패키지의 메모리 채널 수에 묶여 있다는 점이에요. CPU 한 개당 8채널, 12채널 같은 식으로 정해져 있어서, 더 많은 메모리를 달려면 새 서버를 통째로 사야 해요. 메모리만 더 사고 싶어도 그게 안 되는 거예요.
결국 데이터센터 메모리는 '비싼데, 놀고, 확장도 어려운' 세 가지 비효율을 동시에 안고 있어요. CXL이 노리는 게 정확히 이 세 가지예요.
CXL이 푸는 세 가지 문제, 확장·풀링·공유
CXL은 PCIe(Peripheral Component Interconnect Express) 위에서 동작하는 프로토콜이에요. 즉, 별도의 비싼 인프라 없이 기존 PCIe 슬롯·케이블·스위치를 그대로 활용해요. 진입 장벽이 낮다는 게 핵심이에요.
| 기능 | 의미 | 해결하는 문제 |
|---|---|---|
| 메모리 확장 | PCIe 슬롯에 메모리 카드 추가 | CPU 채널 한계 |
| 메모리 풀링 | 여러 서버가 메모리 풀 공유 | stranded memory |
| 메모리 공유 | 동일 데이터를 여러 노드가 동시 접근 | 중복 적재 비효율 |
메모리 확장(CXL 1.1·2.0)부터 풀어볼게요. 가장 단순한 형태예요. PCIe 슬롯에 CXL 메모리 카드를 꽂으면, 그 서버의 CPU가 추가 DRAM을 쓸 수 있어요. CPU 메모리 채널 한계를 우회하는 거죠.
다음은 메모리 풀링(CXL 2.0)이에요. 여러 서버가 하나의 메모리 풀을 공유해요. 서버 A가 메모리 80% 쓰고 있고 서버 B가 30% 쓰고 있으면, 풀에서 빌려주는 방식이에요. 가동률이 평균 40% → 70%까지 올라가는 효과가 가능해요.
마지막은 메모리 공유(CXL 3.0·3.1)예요. 여러 노드가 동시에 같은 데이터에 접근해요. 예를 들어 100GB짜리 AI 모델 가중치를 4대 서버가 각자 복사해서 갖고 있는 대신, 풀 안에 한 번만 올려두고 다 같이 읽는 거예요. 메모리 사용량이 1/4로 줄어요.
💬 직접 살펴본 경험
CXL 2.0 풀링이 실제 서버에 배포된 사례를 마이크론·AMD가 공동으로 공개한 자료에서 봤는데, 진짜 흥미로웠어요. 5세대 EPYC에 CXL 메모리 카드를 붙여서 멀티테넌트 환경에서 가동률이 의미 있게 올라간 결과가 나오더라고요. "표준만 좋고 제품은 언제 나오나"라는 의심을 했던 게 머쓱해질 정도였어요.
숫자로 본 메모리 경제학의 변화
"좋은 기술인 건 알겠는데 진짜 돈이 되냐"가 결국 핵심이에요. 숫자로 보면 답이 나와요.
인텔 모델링에 따르면, 4TB 메모리를 갖춘 서버에서 16x 256GB DIMM 대신 16x 128GB DIMM + 16x 128GB CXL 메모리를 조합하면 TCO(총소유비용)가 약 16% 절감돼요. 그 이유는 단순해요. 고용량 DIMM은 비선형적으로 비싸지지만, CXL 카드는 표준 DDR 모듈을 활용하기 때문에 GB당 단가가 낮아요.
| 시장 | 2025년 | 전망 시점·규모 |
|---|---|---|
| CXL 컴포넌트(GMI) | $0.71B | 2035년 CAGR 27.5% |
| CXL 메모리 확장 | $1.3B | 2034년 $11.8B (28.7%) |
| CXL 4.0 메모리 패브릭 스위치 | $1.8B | 2034년 $9.7B (20.6%) |
| CXL 컨트롤러 | $2.8B | 2033년 $5.4B |
| Introl 추정 CXL 시장 | - | 2028년 $15B (DRAM $12B+) |
전망 기관마다 숫자가 갈리지만, 공통 메시지는 분명해요. CXL 관련 시장이 향후 5~10년 동안 두 자릿수 CAGR로 성장한다는 거예요. 작년 $0.7~2B 수준에서 2030년대 초중반엔 $10B를 넘기는 그림이에요.
특히 흥미로운 건 Introl Blog 추정이에요. 2028년까지 CXL 전체 시장이 $15B에 도달하고, 그중 $12B 이상이 'CXL 뒤에 붙은 DRAM'이라고 봐요. 풀어 말하면 단순 컨트롤러 시장보다 'CXL 인프라 위에 깔리는 DRAM'의 규모가 훨씬 크다는 뜻이에요. 메모리 3사에게도 새로운 매출 채널이 열리는 거예요.
⚡ 근데 진짜 다들 CXL 좋다고만 할까요?
의외로 'CXL은 끝났다'는 주장도 있어요
그 회의론까지 정리해드릴게요 👇
CXL이 진짜 답이긴 한가, 회의론도 본다
균형 잡힌 시각을 위해 회의론도 짚을게요. 가장 강력한 회의론은 SemiAnalysis의 "CXL Is Dead In The AI Era" 분석이에요. 풀어 말하면 "CXL은 일반 서버 환경에는 맞지만, AI 시대에는 다른 솔루션이 더 빠르게 자리 잡고 있다"는 주장이에요.
근거는 세 가지예요. 첫째, AI 워크로드는 메모리 대역폭이 GB당 단가보다 더 중요한데 CXL은 대역폭 측면에서 HBM·로컬 DDR보다 떨어져요. 둘째, AI는 GPU 중심이지 CPU 중심이 아닌데 CXL은 본래 CPU-주변기기 연결 표준에 가까워요. 셋째, 엔비디아 NVLink 같은 GPU 전용 패브릭이 더 빨리 진화하고 있어요.
⚠️ 주의
"CXL 끝났다" 주장은 GPU 학습(Training) 영역에 한정해서 보면 일리가 있어요. 그러나 추론(Inference)과 일반 클라우드 서버 영역에선 여전히 강력한 솔루션이에요. AI 추론은 KV 캐시·모델 가중치 같은 거대한 데이터를 메모리에 두고 빠르게 액세스해야 하는데, 이게 CXL의 사용처와 잘 맞아요. 시장이 좁아진 게 아니라 정확히 어디서 빛나는지가 분명해졌다고 보는 게 더 정확해요.
실제로 일부 연구에서는 CXL 기반 KV 캐시가 21.9배 처리량 향상, 60배 낮은 에너지 효율을 보여줬다는 결과도 있어요. AI 추론에서 CXL이 죽기는커녕 핵심 인프라가 될 수 있다는 신호예요.
결국 CXL의 운명은 "어디서 쓰이느냐"에 달려 있어요. 학습용 GPU 클러스터 안에선 제한적이고, 추론·일반 클라우드 환경에선 빠르게 확산 중이에요.
CXL 채택을 끌어가는 진짜 동력은 AI
아이러니하게도 회의론이 등장하는 와중에도 CXL 채택을 가장 빨리 끌어올리는 건 AI예요. 이유는 단순해요. AI 추론에서 KV 캐시·모델 가중치가 GPU 메모리(HBM)를 넘어버리는 일이 일상이거든요.
HBM은 비싸고 용량이 작아요. GPU 한 장에 80GB, 192GB 정도가 한계예요. 그런데 4050B 같은 거대 모델, 또는 100K 토큰을 처리하는 긴 컨텍스트 추론은 한 GPU의 HBM을 가볍게 넘겨요.
이때 CXL 풀에서 메모리를 빌려 쓰는 게 의미가 커져요. HBM보다 느리지만 SSD보다는 훨씬 빨라요. 'HBM ↔ CXL ↔ SSD'라는 새로운 메모리 계층(tier)이 생기는 거예요.
| 계층 | 대역폭 | GB당 단가 |
|---|---|---|
| HBM | 매우 높음 | 매우 비쌈 |
| 로컬 DDR(DIMM) | 높음 | 중간 |
| CXL 메모리 | 중간 | 낮음~중간 |
| NVMe SSD | 낮음 | 매우 낮음 |
표를 보면 CXL의 자리가 명확해요. 'HBM에 다 넣기엔 너무 비싸고, SSD에 두기엔 너무 느린' 데이터의 집이 되는 거예요. 추론용 KV 캐시, 자주 쓰이는 모델 가중치, 임베딩 벡터 등이 이 자리에 딱 맞아요.
수혜자와 위험에 처한 쪽 정리
CXL이 본격 자리 잡으면 데이터센터 메모리 생태계의 승자와 패자가 갈려요.
수혜자는 크게 세 부류예요. 첫째, CXL 컨트롤러·스위치 제조사예요. Marvell(Structera·XConn), Microchip, Astera Labs가 대표적이에요. 둘째, CXL 메모리 모듈을 만드는 메모리 3사예요. 삼성·SK하이닉스·마이크론이 모두 CXL DRAM 모듈 제품 라인업을 확보하고 있어요. 셋째, CXL 친화적인 CPU·플랫폼 회사예요. AMD가 EPYC 라인에서 CXL을 적극 지원하면서 인텔보다 앞서가는 모습이 보여요.
| 분류 | 주요 회사 | CXL과의 관계 |
|---|---|---|
| 컨트롤러·스위치 | Marvell, Astera Labs, Microchip | 직접 수혜 |
| 메모리 모듈 | 삼성, SK하이닉스, 마이크론 | 신규 매출 채널 |
| CPU·플랫폼 | AMD, 인텔 | 생태계 확장 |
| 하이퍼스케일러 | AWS, Azure, GCP, Meta | TCO 절감 수혜 |
| 위험 부류 | 고용량 DIMM 위주 제조사 | 단가 압박 가능 |
위험에 처한 쪽도 있어요. 고용량(256GB·512GB) RDIMM처럼 프리미엄 가격을 받던 메모리 모듈 사업이 압박을 받을 수 있어요. CXL로 중용량 DIMM을 여러 개 묶어서 같은 효과를 내면, 굳이 고가의 단일 모듈을 살 이유가 줄어들거든요.
또 하나 흥미로운 변수는 중국의 CXMT예요. 작년 보도에 따르면 CXMT가 CXL DRAM 모듈을 개발 중이고, 향후 삼성·SK하이닉스와의 경쟁 구도에 영향을 줄 수 있어요. CXL이 표준이라는 게 새로운 진입자에게도 길을 열어주는 양날의 검이 되는 거예요.
투자자가 봐야 할 시그널과 시점
CXL 사이클을 따라가려면 다음 신호를 분기마다 체크하는 게 도움이 돼요.
첫 번째는 'CXL 2.0 풀링 양산 채택 발표'예요. 표준은 이미 안정화됐고, 이제 하이퍼스케일러가 실제 데이터센터에 양산 배포를 시작하는 시점이 가까웠어요. AWS, MS, 구글 중 어디가 먼저 공식 채택을 선언하느냐가 큰 신호예요.
두 번째는 'Marvell·Astera Labs 분기 매출 중 CXL 비중'이에요. 두 회사 모두 CXL 매출을 별도 공시하지 않지만, 컨퍼런스 콜에서 Structera·Leo CXL Smart Memory 같은 키워드의 언급 빈도와 톤이 의미 있는 신호예요.
세 번째는 '삼성·SK하이닉스·마이크론의 CXL DRAM 모듈 출하 규모'예요. 메모리 3사가 CXL 모듈을 본격 양산해 매출이 분기 단위로 의미 있게 잡히기 시작하면, CXL이 '실험'에서 '본격 상품'으로 넘어가는 신호로 볼 수 있어요.
네 번째는 'CXL 3.0·4.0 표준 기반 제품 출하 시점'이에요. 메모리 공유(3.0)와 패브릭 스위치(4.0)는 아직 상용 제품이 적어요. 이게 양산 사이클에 진입하는 2027~2028년이 진짜 CXL이 데이터센터를 바꾸는 변곡점일 가능성이 커요.
다섯 번째는 'AI 추론용 KV 캐시 솔루션에서의 CXL 채택'이에요. 학계·산업계에서 CXL 기반 KV 캐시 솔루션이 늘어나는지가 회의론 vs 낙관론의 분기점이에요. 채택 사례가 빠르게 늘면 CXL은 AI 인프라의 핵심 계층으로 자리 잡고, 그렇지 않으면 CPU 중심 서버에만 머무는 한정된 시장이 될 거예요.
❓ 자주 묻는 질문
Q1. CXL이 SSD나 NVMe를 대체하나요?
대체보다는 그 사이의 새로운 계층을 만든다고 봐야 해요. CXL 메모리는 SSD보다 100배 이상 빠르고, 로컬 DDR보다는 약간 느린 위치예요. 자주 쓰지만 HBM에 다 넣기엔 양이 많은 데이터가 자연스럽게 CXL 계층으로 옮겨가요.
Q2. CXL 도입에 따른 지연(latency) 문제는 없나요?
로컬 DDR 대비 100~300ns 정도의 추가 지연이 있어요. 이게 모든 워크로드에 괜찮은 건 아니지만, KV 캐시·모델 가중치 같은 대용량·순차 접근형 데이터에는 충분히 견딜 만한 수준이에요. 워크로드 특성에 따라 적합도가 갈려요.
Q3. 작은 기업도 CXL의 수혜를 볼 수 있나요?
단기에는 어려워요. CXL 메모리 풀링은 대규모 데이터센터에서 의미가 큰 기술이라, 하이퍼스케일러와 대형 엔터프라이즈가 먼저 채택해요. 다만 클라우드 서비스를 통해 간접적으로는 모든 사용자가 TCO 절감 효과의 일부를 누리게 될 거예요.
Q4. Astera Labs와 Marvell의 CXL 사업은 어떻게 다른가요?
Astera Labs는 CXL 중심으로 특화된 신생 회사로, Leo CXL Smart Memory 컨트롤러가 주력 제품이에요. Marvell은 CXL이 데이터센터 인프라 라인업의 일부고, Structera 시리즈 외에도 광 연결·커스텀 ASIC을 함께 제공해요. 순수 CXL 베타가 크면 Astera, 풀스택 안정성이 좋으면 Marvell이라고 단순화할 수 있어요.
Q5. CXL은 인텔이 주도한 표준인데 AMD에 더 유리하다는 게 무슨 뜻인가요?
CXL 표준은 인텔이 시작했지만, 실제 CPU 제품에서 CXL을 적극 지원한 건 AMD EPYC 9004·9005 라인이 먼저예요. 인텔도 Granite Rapids에서 CXL을 지원하지만, AMD가 채널 수·CXL 레인 수에서 우위를 보이는 시점이 있었어요. 표준의 시작과 실행이 다른 회사라는 흥미로운 케이스예요.
👉 함께 읽으면 좋은 글
· 엔비디아 다음 병목은 '연결'이다, Marvell을 사야 하는 이유
· HBM 다음 사이클의 진짜 수혜자는 컨트롤러인 이유
· Broadcom vs Marvell, 커스텀 AI ASIC 양강 구도 정리
CXL은 단순한 메모리 인터페이스 표준이 아니라 데이터센터 메모리 경제학을 통째로 바꾸는 변곡점이에요. GB당 단가 56% 절감, TCO 16% 감소라는 숫자가 진짜 양산 배포로 이어지면, 메모리·서버·하이퍼스케일러 모두가 영향을 받아요.
투자 측면에서는 CXL 컨트롤러·스위치 회사, 그리고 CXL 친화적인 메모리 3사가 1차 수혜군이에요. 다만 회의론도 분명히 존재하고, 학습용 GPU 영역에서는 CXL의 자리가 좁다는 점도 고려해야 해요. 본인이 보는 시나리오가 어느 쪽이냐에 따라 포지션의 크기가 달라져야 합니다.
이 글이 도움이 되셨다면 댓글로 의견 남겨주시고, AI 인프라 투자에 관심 있는 분들과 공유해주세요. 다음 글에서는 엔비디아 NVLink 개방 전략의 진짜 속내를 다뤄볼게요.
댓글 쓰기