[이지기획] GPU 선두주자에서 AI 시대 미다스로...‘엔비디아’의 과거와 현재 그리고 미래 ② - 데이터센터
GPU 활용처 찾기 위한 도전이 AI 시장 선점 기회로
‘쿠다’ 기반 템플릿, AI 시스템 구성의 ‘레퍼런스’로
‘성능 중심’ 하드웨어 개발...우려도 있지만 수요 확실

엔비디아의 하드웨어 생산 원칙은 성능이 1순위이기에 출시 당시에는 여러 부정적인 평가를 매번 받아왔다. 하지만 성능이 서비스의 질로 이어지는 AI 시장의 특성상 최종적으로는 엔비디아의 하드웨어를 사용할 수밖에 없다는 평가다. 사진=엔비디아
엔비디아의 하드웨어 생산 원칙은 성능이 1순위이기에 출시 당시에는 여러 부정적인 평가를 매번 받아왔다. 하지만 성능이 서비스의 질로 이어지는 AI 시장의 특성상 최종적으로는 엔비디아의 하드웨어를 사용할 수밖에 없다는 평가다. 사진=엔비디아

[이지경제=김용석 기자] 최근 전 세계적인 주가 하락이 이어진 가운데 ‘AI 황제주’로 평가받는 엔비디아 역시 6%가 넘는 하락세를 기록하며 주가 하락 종목의 주인공이 됐다. 특히 엔비디아의 경우 시장 자체의 하락세와 함께 올해 4분기 출시를 예정하고 있던 AI 가속기 ‘블랙웰’의 설계 결함이 알려지면서 주가 하락 움직임에 기름을 끼얹었다는 평가도 나왔다.

하지만 정작 IT업계 관계자들은 외부 이슈에 해당하는 증권가의 지속적인 하락세를 걱정하면 걱정했지, 엔비디아 내부 이슈는 크게 신경 쓰지 않는 모습이다. 엔비디아가 과거부터 꾸준히 이어오고 있는 ‘성능 중심의 설계 및 하드웨어 공급’에는 별다른 변수가 없으며, AI 시장의 확대와 성장이 지속될 것이라는 전망이 지배적인 상황에서 엔비디아의 영향력 역시 확고하다는 분석이다.

이렇듯 AI 칩셋 및 연산 산업으로 대표되는 엔비디아의 데이터센터 부문은 외부 이슈에도 굳건한 모습이다. 이런 압도적인 시장 영향력과 내실은 어떻게 마련할 수 있었을까. 업계에서는 자사의 VGA가 활용될 수 있는 곳을 꾸준히 찾아 나선 엔비디아의 노력과 시장 확인 후 성장을 도모할 수 있도록 생태계를 형성한 것이 현재의 성과로 이어졌다고 평가하고 있다.

◆ 시작은 GPU의 활용처 탐색...선택과 집중 더해져

데이터센터 사업 부문의 시작은 ‘지포스’로 대표되는 게임 그래픽 연산용 칩셋을 다른 부분에서도 활용할 수 있지 않을까에 대한 생각에서 비롯됐다. 병렬연결 및 연산 처리에 있어 강력한 성능을 보여주던 엔비디아의 GPU를 게임뿐만 아니라 당시 ‘슈퍼컴퓨터’로 대표되던 연산 전문 하드웨어에서도 활용할 수 있지 않겠냐는 아이디어가 해당 분야 연구와 하드웨어 사업 확대로 이어진 것이다.

물론 이런 도전이 초반에는 부정적인 시장 반응이 많았다. 초기형 AI 기반 칩셋들이 발열을 제대로 잡지 못한다는 단점을 보여줬기 때문이다. 물론 지금 시점에서 다시 보면 막대한 분량의 데이터 연산 처리를 하기 위해서는 발열이 발생할 수밖에 없는데, 이 발열 제어를 포기하면서도 성능을 끌어올리는 선택을 했기에 따라올 수밖에 없는 성능 이슈였던 셈이다.

이런 상황에서 엔비디아가 사업 방향성을 확고히 하게 된 계기는 역시 자체 개발 CPU 부문을 정리하고 데이터 연산 항목에 집중하기로 하면서부터다. 모바일 환경에서 엔비디아가 자체 생산한 CPU를 공급하겠다는 계획으로 ‘테그라’ 칩셋 등을 공개했지만, 시장에서 큰 반응을 끌어내지 못했다. 이는 자연스럽게 사업 정리 수순으로 이어졌고, 해당 인력을 AI 연산 시장에 집중하면서 회사 차원의 선택과 집중을 했다는 평가다.

엔비디아는 AI 연산 전용 칩셋을 공개할 때마다 칩셋을 활용할 수 있는 플랫폼 등 기초 설비에 대한 가이드와 디자인을 같이 공개하며 AI 사업에 도전하는 업체에게 튜토리얼을 제공하고 있다. 사진=엔비디아
엔비디아는 AI 연산 전용 칩셋을 공개할 때마다 칩셋을 활용할 수 있는 플랫폼 등 기초 설비에 대한 가이드와 디자인을 같이 공개하며 AI 사업에 도전하는 업체에게 튜토리얼을 제공하고 있다. 사진=엔비디아

◆ 쿠다 기반의 ‘AI 연산’ 템플릿 역시 주효

엔비디아 데이터산업 부문의 큰 줄기는 AI 연산 데이터를 효과적으로 처리하는 하드웨어 공급과 함께 이를 소프트웨어적으로 구성하고 작동할 수 있게 하는 생태계를 ‘쿠다(CUDA)’를 통해 이미 조성해놨다는 것이다. 현재 엔비디아의 AI 연산 하드웨어는 돈이 있어도 구하기 어려울 정도의 품귀현상에 고가의 가격 정책을 유지하고 있지만, 소프트웨어 단계에서의 쿠다는 무료로 이용할 수 있어 대다수 AI 연산 설계 개발자들은 엔비디아를 제1 생태계로 놓고 작업을 이어가고 있다.

쿠다 기반 생태계의 가장 큰 특징은 엔비디아의 연산용 칩셋을 최적의 환경에서 활용할 수 있게 해주는 기본 기능과 AI 프로그램을 구성할 수 있도록 해주는 소프트웨어가 전체적인 시스템 설계 기반의 역할을 한다는 점이다. 이를 통해 AI 연산 프로그램을 구축하거나 활용하는 사용자는 쿠다를 기반으로 시스템을 설계하고, 다른 연산 프로젝트 및 하드웨어에 이를 접목해 새로운 연산값을 도출해 낼 수 있는 환경을 만들 수 있다.

엔비디아의 AI 연산 기반 사업에서 AI가 산업적인 단계로 올라오기 전인 학술적 단계에서부터 쿠다 중심의 생태계가 활용되면서 지금의 시장이 조성될 수 있는 배경이 됐다. 이는 지난 2009년 제프리 힌튼 토론토대 교수가 AI 기반 플랫폼을 설계해 인간의 말을 인식할 수 있는 ‘신경망 훈련’을 위한 시스템을 조성하는 데 있어 엔비디아의 병렬연결 GPU와 쿠다 기반 설계가 더해지면서 성과를 냈기 때문이다. 당시 CPU로 설계한 환경보다 100배 이상 빠른 신경망 학습이 가능하다는 결과가 도출됐고, 이는 현재 AI 연산 처리 시스템의 기본 구성으로 자리 잡고 있다.

◆ ‘성능 중심’ 하드웨어 공급으로 AI 시장 선도 예고

물론 엔비디아의 이런 사업적인 행보에 부정적인 평가를 하는 관계자들 역시 적지 않은 상태다. 특히 GPU 병렬연결이 가능하고, GPU가 가지고 있는 성능 자체만을 가지고 결과값을 뽑아낸다는 점에서, 제품의 단점 개선보다는 성능 중심으로만 사업을 이어가고 있다는 지적이다. 실제로 VGA 시리즈인 ‘RTX 40’ 시리즈도 제대로 된 그래픽카드 설계 구성이 아니라 성능 하나만 보고 출시한 ‘반쪽짜리 제품’이라는 지적을 받고 있고, H100 등 AI 연산 칩 역시 크기와 가격, 발열 등이 이렇게까지 비례해서 커질 필요가 없다는 의견이 제기됐다.

하지만 이에 대한 엔비디아의 입장은 이렇다 할 변화가 없는 상태다. 오히려 자신들의 목표는 ‘빠르고 강력한 성능의 연산 처리 능력’이며, 이에 기반해서 계속해서 제품을 공급하고 있다는 입장이다. 실제로 최근 주가 하락 등에 이슈가 된 차세대 AI 가속기 블랙웰 시리즈의 설계 결함이 이슈가 되었지만, IT업계 관계자들은 크게 신경 쓰지 않는 모습을 보였다. 설계 결함이라고는 하지만 결국 병렬연결 등에 있어 결함이 예측돼 출시 지연 가능성이 생겼다는 것이며, 가속기 자체의 성능 등에는 문제가 없으므로 이슈가 되지 않는다는 평가다.

이에 대해 한 IT업계 관계자는 “수많은 AI 칩셋 설계 업체들이 엔비디아를 타깃으로 해 제품을 선보이고 있지만, 결과적으로는 오히려 엔비디아의 제품 수요만 증가하는 결과를 가져왔다”며 “신제품이 아직 출시되지 않은 상황에서도 엔비디아 제품의 수요를 따라가지 못하고 있는데, 출시 일정이 연기되는 정도의 이슈는 전체적인 엔비디아의 데이터센터 산업에 큰 영향은 끼치지 못할 것으로 본다”고 말했다.

저작권자 © 이지경제 무단전재 및 재배포 금지