엔비디아 다음 병목은 '연결'이다, Marvell을 사야 하는 이유
📝 AI 추론 시대의 진짜 병목은 GPU 연산이 아니라 메모리, 그리고 그 메모리를 잇는 '연결'이에요. Marvell이 CXL·실리콘 포토닉스·커스텀 ASIC을 풀스택으로 보유한 유일한 상장사인 이유와 FY28 매출 $15B 가이던스의 근거를 정리했어요.
📋 목차
- 1. AI 추론에서 진짜 병목은 어디서 생기나
- 2. KV 캐시가 GPU를 놀게 만드는 구조
- 3. 메모리 분산(Disaggregation)이라는 해법
- 4. Marvell이 가진 연결 풀스택의 정체
- 5. 엔비디아 $2B 투자가 의미하는 것
- 6. 숫자로 본 Marvell의 현재와 미래
- 7. 투자 관점에서 봐야 할 리스크
AI 서버의 원가가 GPU에서 메모리·연결로 옮겨가는 구조에서, 그 '연결 통로'를 상장사 중 유일하게 풀스택으로 파는 회사가 Marvell이에요. 메모리 셀(HBM/낸드) 가격 사이클은 피하면서, 계층이 복잡해질수록 가치가 커지는 위치에 서 있는 거예요.
사실 저도 처음엔 그냥 "엔비디아 옆에 붙어있는 회사 중 하나" 정도로만 봤거든요. 근데 작년 가을부터 Celestial AI 인수 뉴스, 그리고 11월에 터진 엔비디아 $2B 투자 소식까지 이어지면서 다시 들여다봤어요. 결론부터 말하면, 이 회사는 'GPU 옆 부품주'가 아니라 'AI 인프라가 진화할수록 무조건 거쳐가야 하는 길목'에 서 있는 회사예요.
왜 그렇게 말할 수 있는지, 추론 시대의 진짜 병목이 어디서 생기는지부터 차근차근 풀어볼게요.
AI 추론에서 진짜 병목은 어디서 생기나
AI가 학습(Training)에서 추론(Inference)으로 무게중심이 옮겨가면서 병목 지점도 바뀌었어요. 학습은 한 번 무겁게 돌리는 작업이라 연산력(FLOPS)이 핵심이지만, 추론은 챗봇·에이전트가 실시간으로 답을 쏟아내는 작업이에요.
실시간 추론은 메모리를 끊임없이 읽고 쓰는 일이라, GPU의 연산력보다 메모리 대역폭과 용량이 먼저 한계에 부딪혀요. 비싸게 산 H100, B200이 멀쩡히 있어도 메모리가 모자라서 일을 못 하는 황당한 상황이 벌어지는 거예요.
📊 실제 데이터
최근 발표된 'Comparative Characterization of KV Cache Management Strategies' 논문에 따르면, KV 캐시 최적화 기법으로 GPU 메모리 소비를 최대 70%까지 줄일 수 있다고 해요. 바꿔 말하면 지금까지 그만큼의 메모리가 KV 캐시 하나에 잡혀있었다는 뜻이에요.
엔비디아 개발자 블로그에서도 "긴 컨텍스트와 큰 배치 사이즈에서 KV 캐시가 추론 비용의 주요 요인"이라고 명시하고 있어요. 즉, 이건 일부 연구자만의 이슈가 아니라 GPU를 만드는 회사가 직접 인정한 구조적 문제인 거예요.
그래서 하이퍼스케일러(아마존, 구글, 메타, MS)는 GPU를 더 사는 것만으로는 답이 안 나온다는 걸 이미 알고 있어요. 옆에서 메모리 병목을 풀어줄 누군가가 필요한 상황이에요.
KV 캐시가 GPU를 놀게 만드는 구조
KV 캐시(Key-Value Cache)는 트랜스포머 모델이 이전 토큰들의 어텐션 계산값을 임시 저장하는 공간이에요. 매번 처음부터 다시 계산하지 않으려고 만든 일종의 메모이고요.
문제는 이 캐시가 시퀀스 길이와 배치 사이즈에 선형 비례해서 부풀어 오른다는 거예요. 사용자가 긴 문서를 붙여넣거나, 에이전트가 멀티턴 대화를 이어가면 KV 캐시가 폭증해서 GPU 한 장의 HBM(고대역폭 메모리)을 그냥 넘어버려요.
결과는? 비싼 GPU가 메모리 부족으로 제 성능을 못 내고 놀게 돼요. 토큰 처리 속도는 떨어지고, 처리당 비용은 올라가고, 사용자 경험은 느려지고요.
| 구분 | 학습(Training) | 추론(Inference) |
|---|---|---|
| 병목 지점 | 연산력(FLOPS) | 메모리 대역폭·용량 |
| 핵심 부품 | GPU 코어 | HBM, KV 캐시 저장소 |
| 비용 구조 | GPU 비중 절대적 | 메모리·연결 비중 급증 |
| 확장 방향 | GPU 추가 | 메모리 분산·풀링 |
표를 보면 명확해요. 추론 시대의 자금 흐름은 GPU 코어가 아니라 메모리와 그 메모리를 잇는 길로 옮겨가고 있어요. 그리고 이 길을 만드는 회사가 바로 우리가 주목해야 할 대상이에요.
전문가들 사이에서 회자되는 '추론 비용의 약 70%가 메모리에서 발생한다'는 추정이 있는데, 이건 일부 워크로드 기준의 추정치라 절대값으로 받아들이긴 어려워요. 다만 방향성, 그러니까 "메모리 비중이 압도적으로 커지고 있다"는 사실은 부정하기 어려워요.
메모리 분산이라는 해법, CXL과 광 연결
GPU 안에 메모리를 무한정 욱여넣을 수는 없어요. HBM 자체도 가격이 비싸고, 패키지 안에 들어갈 수 있는 양에 물리적 한계가 있거든요.
그래서 업계가 찾은 해법이 '메모리 분산(Memory Disaggregation)'이에요. 메모리를 GPU 칩 밖으로 빼내, 여러 GPU가 공유 풀(pool)로 나눠 쓰는 방식이에요. 같은 랙 안에서는 CXL(Compute Express Link)이라는 표준 프로토콜로, 랙과 랙 사이에서는 광(光) 연결로 잇는 거예요.
💬 직접 살펴본 경험
제가 작년에 처음 CXL을 공부했을 때만 해도 "이거 표준만 거창하고 실제 제품은 언제 나오나" 싶었어요. 근데 작년 가을 OCP 글로벌 서밋에서 Marvell이 Structera S 30260이라는 260레인 CXL 스위치를 공개했더라고요. 랙 단위 메모리 풀링을 실제로 가능하게 만드는 칩인데, 이걸 보고 "아, 이제 진짜 시작이구나" 싶었어요.
CXL은 PCIe 위에서 동작하는 프로토콜이라, 별도의 비싼 인프라 없이 기존 서버 보드에서 메모리 풀링이 가능해요. 여러 GPU가 하나의 큰 메모리 풀을 공유해서 KV 캐시를 분산 저장하는 거예요.
근데 랙 안에서는 CXL로 풀 수 있어도, 랙과 랙 사이 거리는 전기 신호로 처리하기엔 너무 멀어요. 신호 감쇠와 지연이 심해지거든요. 그래서 이 구간은 빛, 그러니까 광 신호로 잇는 PMA(Photonic Memory Appliance)가 등장해요.
즉 문제 해결의 핵심은 '메모리 칩 자체'가 아니라 '그 메모리를 빠르게 잇는 연결'에 있다는 게 핵심이에요. 셀(HBM, DRAM)을 만드는 메모리 회사들이 아니라, 연결을 만드는 회사가 다음 라운드의 수혜자가 될 가능성이 큰 이유예요.
⚡ 더 깊이 들어가기 전에 잠깐!
Marvell이 어떻게 이 모든 연결을 한 회사가 다 가지게 됐는지
지금부터가 진짜예요 👇
Marvell이 가진 연결 풀스택의 정체
Marvell이 특별한 이유는 단순해요. 추론 시대에 필요한 모든 연결 계층을, 상장사 중에서 유일하게 한 회사가 다 가지고 있어요.
랙 안의 연결은 Structera 시리즈(CXL 컨트롤러·스위치)와 XConn이 담당해요. Structera S는 메모리 풀링을 위한 CXL 스위치, Structera A는 메모리 근접 가속(near-memory acceleration)을 위한 칩이에요. PCIe 5.0/6.0 세대를 지원하고, 공유 DRAM 환경에서 짧은 지연으로 동작해요.
랙과 랙 사이는 작년에 Celestial AI를 $3.25B에 인수하면서 확보한 Photonic Fabric이 맡아요. SEC 공시에 따르면, Marvell은 이 광 패브릭 칩렛을 커스텀 XPU와 스케일업 스위치에 코패키징(co-packaging)으로 붙일 계획이에요. 풀어 말하면, 광 모듈을 별도로 다는 게 아니라 칩 패키지 안에 같이 넣어버리는 방식이에요.
광 신호로 변환하는 핵심 소자는 작년에 인수한 Polariton Technologies가 보유한 '플라즈모닉스(plasmonics)' 기반 실리콘 포토닉스예요. 3.2T(테라비트) 이상의 광 성능을 목표로 하는 차세대 기술이에요.
| 계층 | 기술 | Marvell 솔루션 |
|---|---|---|
| 랙 안 연결 | CXL 스위치·풀링 | Structera S/A, XConn |
| 랙 간 광 연결 | Photonic Fabric (PMA) | Celestial AI 인수 |
| 광 변환 엔진 | 실리콘 포토닉스 | Polariton 인수, 3.2T+ |
| 커스텀 AI 칩 | 하이퍼스케일러 ASIC | 업계 2강 위치 |
| 스케일업 네트워킹 | NVLink Fusion 호환 | 엔비디아 제휴 |
이 표를 정리해놓고 보면, 한 회사가 이 정도 풀스택을 가진 게 정상인가 싶을 정도예요. 실제로 경쟁사들은 한두 계층만 가지고 있어요. Broadcom은 커스텀 ASIC·이더넷 강자지만 CXL 메모리 풀링과 광 통합은 약하고, Astera Labs는 CXL은 잘하지만 광은 없어요.
물론 풀스택이라고 해서 모든 계층에서 1등이라는 뜻은 아니에요. Broadcom은 커스텀 ASIC에서 여전히 1강이고, Marvell은 2강 위치예요. 다만 '연결 전 계층을 한 회사에서 끊김 없이 받을 수 있다'는 가치가 갈수록 중요해진다는 게 시장의 판단이에요.
엔비디아 $2B 투자가 의미하는 것
엔비디아가 작년 말 Marvell에 $2B를 투자했다는 발표는 단순한 지분 매입이 아니었어요. NVLink Fusion 생태계로 Marvell을 정식 편입한 거예요.
NVLink Fusion은 엔비디아가 자체 GPU를 쓰지 않는 커스텀 XPU 환경에서도 NVLink 패브릭을 쓸 수 있게 개방한 플랫폼이에요. 풀어 말하면, "우리 GPU 안 사도 좋아, 대신 우리 연결망은 써줘"라는 전략이에요.
엔비디아 공식 발표에 따르면, Marvell은 NVLink Fusion 호환 커스텀 XPU와 스케일업 네트워킹을 공급하고, 엔비디아는 Vera CPU 같은 보완 기술을 제공해요. 두 회사가 서로 다른 영역을 맡으면서 한 생태계로 묶이는 구조예요.
⚠️ 주의
엔비디아의 투자는 '독점 계약'이 아니에요. Marvell은 여전히 AMD, AWS Trainium, 구글 TPU 등 다른 커스텀 칩 프로젝트에도 참여하고 있어요. 다만 엔비디아 생태계와의 호환성을 공식적으로 확보했다는 점에서, 하이퍼스케일러 입장에선 'Marvell을 안 끼우기가 더 어려워진' 셈이에요.
이 그림에서 흥미로운 건, 엔비디아 입장에서 보면 Marvell은 경쟁자이자 동맹이라는 거예요. 커스텀 ASIC을 잘 만들면 엔비디아 GPU의 자리를 일부 잠식할 수 있지만, 동시에 NVLink Fusion 생태계를 키워주는 우군이기도 해요. 그래서 $2B를 들여서라도 묶어두려는 거예요.
숫자가 스토리를 증명한다, FY28 매출 $15B
스토리만 좋고 숫자가 안 나오면 의미가 없죠. Marvell의 FY26(2026년 회계연도) 실적은 매출 $8.195B, 사상 최대치를 기록했어요. 전년 대비 42% 성장이에요.
데이터센터 부문이 전체 매출의 70%를 넘었고, GAAP 순이익은 $2.67B로 주당 $3.07이에요. 비통신·차량용 부문이 부진한 와중에도 AI 데이터센터가 전체를 끌어올린 구조예요.
| 항목 | FY26 실적 | FY27 가이던스 | FY28 가이던스 |
|---|---|---|---|
| 매출 | $8.2B | $11B (+34%) | ~$15B (+36%) |
| YoY 성장률 | +42% | +34% | +36% (예상) |
| 데이터센터 비중 | 70%+ | 상승 예상 | 상승 예상 |
| Non-GAAP EPS | +81% YoY | 두 자릿수 성장 | 레버리지 확대 |
표를 보면 회사가 직접 제시한 FY28 매출 $15B는 현재의 거의 2배예요. 시장 컨센서스($12.92B)를 큰 폭으로 상회하는 숫자고요. CEO Matt Murphy는 컨퍼런스 콜에서 주문이 '기록적 속도(record pace)'로 들어오고 있다고 표현했어요.
물론 회사 가이던스는 그대로 받아들이면 안 돼요. 일부 분석가들은 "커스텀 실리콘 부문 가이던스가 작년 100% 성장 후에 20%로 떨어진 건 보수적이거나 둔화 신호일 수 있다"고 지적해요. 그만큼 검증이 필요한 숫자라는 뜻이에요.
다만 분명한 건, 데이터센터 비중이 70%를 넘은 이상 이제 Marvell은 '반도체 멀티유스 회사'가 아니라 '데이터센터·AI 인프라 순수 베팅(pure play)'에 가까워졌다는 점이에요. 호황이면 빠르게 올라가고, AI 자본지출이 식으면 빠르게 내려갈 수 있는 구조예요.
📊 숫자만 보면 매력적인데
그래도 투자하기 전에 꼭 봐야 할 리스크가 있어요
아래 정리해드릴게요 👇
투자 관점에서 봐야 할 리스크와 체크포인트
아무리 스토리가 좋아도 리스크를 봐야 해요. 솔직히 말하면 Marvell도 만만한 종목은 아니에요. 데이터센터 매출 비중이 70%를 넘었다는 건, AI 자본지출 사이클이 흔들리면 가장 먼저 영향을 받는다는 뜻이기도 해요.
첫 번째 리스크는 고객 집중도예요. Marvell의 커스텀 ASIC 매출은 소수 하이퍼스케일러(주로 AWS, 구글 추정)에 의존해요. 한 고객이 자체 칩 설계 역량을 키워서 Marvell 의존도를 줄이거나, 다른 파트너로 갈아타면 한 분기에 큰 타격을 받을 수 있어요.
두 번째는 경쟁이에요. Broadcom은 여전히 커스텀 ASIC 1강이고, 광 연결에서는 Coherent, Lumentum, Ayar Labs 같은 회사들이 다른 접근법으로 진입하고 있어요. CXL 분야에서는 Astera Labs가 강력한 경쟁자고요.
세 번째는 인수 통합 리스크예요. Celestial AI($3.25B), Polariton(비공개) 두 건의 연속 인수는 풀스택을 완성하기 위한 필수 선택이었지만, 통합 과정에서 인력 이탈이나 기술 지연이 발생하면 가이던스 달성이 늦어질 수 있어요.
네 번째는 밸류에이션이에요. 엔비디아 투자 발표 이후 주가가 단기에 18% 가까이 급등한 적이 있는데, AI 모멘텀주 특성상 변동성이 크다는 점을 늘 염두에 둬야 해요. 같은 스토리로 2024년 한 차례 큰 조정도 있었어요.
체크포인트는 분기별 데이터센터 매출 성장률, 커스텀 실리콘 부문 가이던스, 그리고 Celestial 기반 PMA 제품의 실제 출하 시점 세 가지예요. 이 세 가지가 회사가 말한 궤도를 유지하는지를 확인하면서 포지션을 조절하는 게 합리적이에요.
❓ 자주 묻는 질문
Q1. Marvell은 엔비디아의 경쟁자인가요, 협력자인가요?
둘 다예요. 커스텀 ASIC 영역에서는 엔비디아 GPU의 일부 수요를 대체할 수 있어 경쟁자고, 동시에 NVLink Fusion 호환 네트워킹을 공급하는 협력자예요. 엔비디아의 $2B 투자는 "어차피 커스텀 칩 시장은 열리니, Marvell을 우리 생태계 안에 묶어두자"는 전략적 판단이에요.
Q2. CXL이 진짜로 데이터센터에 자리 잡고 있나요?
표준은 이미 PCIe 5.0/6.0 위에서 안정화됐고, Marvell·Astera·삼성·SK하이닉스 모두 제품을 내고 있어요. 다만 대규모 상용 배포는 이제 막 시작 단계예요. FY27~FY28이 진짜 양산 사이클이 시작되는 시점으로 보는 시각이 많아요.
Q3. Photonic Fabric은 언제부터 실제 매출이 나오나요?
Celestial AI 인수가 작년에 완료됐고, Marvell은 광 패브릭 칩렛을 커스텀 XPU·스케일업 스위치와 코패키징한다고 밝혔어요. 본격 매출 기여는 FY28 이후로 보는 게 합리적이에요. FY28 매출 $15B 가이던스에는 일부 기여가 반영되어 있을 가능성이 있어요.
Q4. 메모리 회사(삼성·SK하이닉스)와 Marvell 중 어느 쪽이 더 유리한가요?
단순 비교는 어려워요. 메모리 셀(HBM)은 사이클 산업이라 가격 변동에 노출되고, Marvell은 연결 IP 비즈니스라 마진과 가격 결정력이 다르게 움직여요. 같은 AI 메모리 테마지만 사이클 민감도와 마진 구조가 달라 포트폴리오 안에서 역할이 다르다고 보는 게 맞아요.
Q5. 지금 진입하기에 늦은 건 아닌가요?
FY28 매출 $15B 가이던스의 일정 부분은 이미 주가에 반영됐다고 봐야 해요. 다만 가이던스가 실제 분기 실적으로 검증되는 시점마다 재평가 기회가 있고, 단기 변동성도 큰 종목이라 분할 매수 전략이 일반적으로 거론돼요. 본인의 투자 기간과 위험 감내도에 맞춰 판단하는 게 가장 중요해요.
👉 함께 읽으면 좋은 글
· HBM 다음 사이클, 메모리 셀이 아닌 컨트롤러가 답인 이유
· Broadcom vs Marvell, 커스텀 AI ASIC 양강 구도 정리
· CXL이 데이터센터 메모리 경제학을 바꾸는 방식
결론은 단순해요. AI 서버 원가가 GPU에서 메모리로 번지는 그 다음 단계는 '메모리를 잇는 연결'이고, 그 연결을 풀스택으로 파는 거의 유일한 상장사가 Marvell이에요. 메모리 셀 사이클의 변동성은 피하면서 계층이 복잡해질수록 가치가 커지는 자리에 서 있는 게 핵심이에요.
AI 인프라 테마를 포트폴리오에 담고 있는데 GPU 단일 종목 비중이 부담스러우신 분이라면, 연결 계층의 대표주를 한 번쯤 검토해볼 만한 시점이에요. 다만 데이터센터 매출 의존도가 높은 만큼 변동성도 크다는 점, 그리고 회사 가이던스가 실제 분기 실적으로 검증되는 과정을 꾸준히 지켜봐야 한다는 점은 잊지 말아야 해요.
이 글이 도움이 되셨다면 댓글로 의견 남겨주시고, 주변 투자에 관심 있는 분들과 공유해주세요. 다른 AI 인프라 종목 분석이 궁금하시면 댓글로 종목명을 남겨주시면 다음 글에서 다뤄볼게요.
댓글 쓰기