알리바바, 엔비디아 필적 AI칩 개발 이슈
중국 컴퓨팅파워 기술 자립 현주소 진단
고성장 기대 '알리바바 AI칩 테마' 재평가
이 기사는 9월 19일 오후 4시42분 '해외 주식 투자의 도우미' GAM(Global Asset Management)에 출고된 프리미엄 기사입니다. GAM에서 회원 가입을 하면 9000여 해외 종목의 프리미엄 기사를 보실 수 있습니다.
[서울=뉴스핌] 배상희 기자 = 중국 본토 A주 시장에서 반도체 섹터가 미국 연방준비제도(연준∙Fed)의 금리인하로 상승모멘텀을 얻게 됐다.
미 금리인하 소식이 전해진 이후 9월 18일 오전장에서 '커촹50지수(科創50, 상하이증권거래소 산하의 과학기술주 전용 거래시장인 커촹반에 상장된 50대 우량주의 주가를 반영해 산출한 지수)'는 3년래 최고치를 기록했는데, 특히 반도체 섹터의 상승세가 두드러졌다.
최근 반도체 테마의 상승모멘텀을 키워주는 최대 핵심 키워드는 AI칩의 국산화다.
컴퓨팅파워(연산력) 수요가 확대되면서 중국의 AI 칩 개발 시급성이 커지는 가운데, 최근 중국 대표 빅테크(대형 IT기업) 알리바바(9988.HK)가 엔비디아에 대적할만한 AI칩을 개발했다는 소식이 반도체 섹터를 둘러싼 호재로 작용하고 있다.
투자자들은 알리바바의 AI칩 개발과 함께 점점 더 몸집이 확장될 중국 국산 AI칩 공급망 체인의 높은 성장성에 기대감을 드러내며, 연계 고성장 테마주 발굴에 주목하고 있다.
![]() |
[사진 = CCTV 동영상 캡처] 중국 관영매체 중국중앙TV(CCTV)의 저녁 메인 뉴스 프로그램인 신원롄보(新聞聯播) 9월 16일 방송에서 공개된 '알리바바 vs 엔비디아 AI칩 사양 비교' 자료 화면. |
◆ 알리바바 AI칩 PPU 성능 '객관적 분석'
AI시대 도래와 함께 컴퓨팅파워 수요가 급증하면서, 중국의 AI칩 국산화 시급성도 커지고 있다. 미국 엔비디아에 대한 의존도가 여전히 큰 상태이지만 최근 전해지는 중국 기업들의 기술력의 진화는 국산 기술력의 대체 속도가 점점 더 빨라지고 있음을 보여준다.
특히, 최근 전해진 알리바바 AI칩을 둘러싼 이슈는 중국 AI칩 개발의 현주소를 보여주는 대표적인 사례가 됐다. 동시에 화웨이(華為)가 개발한 AI 프로세서인 어센드(昇騰·성텅·Ascend)와 한무기(寒武紀∙Cambricon∙캠브리콘 688256.SH)'의 AI칩 '쓰위안(思元)' 등에 가려져 저평가됐던 알리바바의 존재를 각인시키는 계기를 마련했다는 평가가 나온다.
중국 관영매체 중국중앙TV(CCTV)의 저녁 메인 뉴스 프로그램인 신원롄보(新聞聯播) 9월 16일 방송에서 '국산 칩과 엔비디아 칩의 주요 파라미터 비교'라는 타이틀과 함께 알리바바 산하의 반도체 기업 핑터우거(平頭哥∙T-Head)가 자체 개발한 AI칩 '병렬처리장치(PPU)'와 엔비디아의 중국용 저사양 AI칩 'H20∙A800'의 성능을 비교하는 자료 화면이 공개됐다.
보도에 따르면 메모리·대역폭·소비전력 등 3대 핵심 파라미터를 비교해볼 때, PPU는 A800의 성능을 이미 넘어섰고 H20의 90%에 달하는 수준의 성능을 보유하고 있는 것으로 나타났다.
우선, '메모리' 측면에서 PPU에는 96GB(기가바이트) 고대역폭메모리(HBM)2e가 탑재돼 엔비디아의 A800(80GB, HBM2e) 성능을 넘어섰다. H20은 한 단계 업그레이드 된 HBM3 메모리를 채택했으나 용량은 96GB로 PPU와 동일하다.
메모리는 AI칩 성능을 판단함에 있어 매우 핵심적인 지표다. 메모리가 클수록 동시에 처리할 수 있는 데이터가 많아진다. 천억 매개변수 규모의 대규모 AI모델 처리 시 한꺼번에 많은 데이터를 불러올 수 있어, 빈번한 외부 메모리 접근이 필요 없으며 이를 통해 효율을 크게 끌어올릴 수 있다.
다중 칩 간 데이터의 전송 속도를 보여주는 지표인 '칩 간의 상호연결 대역폭' 측면에서 PPU는 초당 700GB의 성능으로, A800의 400GB/s를 크게 넘어섰고, H20의 900GB/s과 유사한 수준을 나타냈다.
가장 의외였다는 반응이 나온 지표는 소비전력이었다. PPU의 소비전력은 400와트(W)로 A800과 동일했고 상대적 고성능 칩으로 더 많은 전력을 필요로 하는 H20(550W)보다는 낮았다. 쉽게 말해 같은 속도로 달리면서도 연비가 더 좋은 자동차로 비유할 수 있다.
400W의 소비전력은 같은 연산력 대비 전기료를 30% 가까이 줄일 수 있음을 의미한다는 점에서 데이터센터 운영사들의 비용부담 측면에서도 효율적이라 할 수 있다. 이는 핑터우거가 중국과학원(CAS)과 스마트계량기기 및 에너지 디지털화 제품을 연구개발하는 베이징징이그룹(北京京儀集團) 등의 대형 고객을 확보하는 데도 큰 영향을 미쳤다는 평가가 나온다.
물론 아직까지는 엔비디아와의 기술력 격차는 분명하다. H20의 HBM3 메모리는 HBM2e보다 한 세대 앞서 있으며, 이는 SSD(솔리드스테이트드라이브)와 HDD(하드디스크드라이브)의 차이로 비유할 수 있다.
연산 성능은 공개되지 않았는데 이에 대해 현지 전문가들은 아직까지 PPU가 H20을 따라잡지 못했을 가능성이 크다고 진단했다. 다만, 3년 전까지만 해도 국산 칩이 엔비디아의 A100 조차 넘볼 수 없었지만, 이제는 메모리∙대역폭∙소비전력 등에서도 H20과 견줘볼 수 있는 수준까지 올라섰다는 점에서 분명 놀라운 발전이라는 평가를 내놓는다.
![]() |
[사진 = 핑터우거 공식 홈페이지] 2019년 9월 핑터우거가 출시한 첫 번째 고성능 인공지능 추론 칩 '한광(含光)800' |
◆ 알리바바 핑터우거 '4대 AI칩 제품라인'
핑터우거(平頭哥∙T-Head)는 알리바바가 100%의 지분을 보유한 반도체 칩 사업 전담 자회사다. 알리바바 산하의 신기술 글로벌 연구기관인 다모위안(達摩院∙DAMO)의 다모위안의 칩 연구개발 업무와 알리바바가 인수한 중톈웨이시스템유한공사(中天微系統有限公司)의 업무를 통합해 2018년 설립됐다.
엔드 투 클라우드(end-cloud) 일체형 풀스택 제품군을 보유하고 있다. 해당 제품군은 데이터센터 칩, 사물인터넷(IoT) 칩, 프로세서 IP 라이선스 등을 포괄하며, 칩의 엔드 투 엔드(end-to-end) 설계 체인을 전면적으로 커버하고 있다.
현재까지 핑터우거가 개발한 AI칩 제품라인은 크게 네 가지로 분류된다.
2019년 9월 첫 번째 고성능 인공지능 추론 칩인 '한광(含光)800'을 출시했다. 이는 12nm 공정과 자체 개발 아키텍처를 기반으로 하며, 170억 개의 트랜지스터를 집적했다. 해당 칩은 최대 820 TOPS(초당 820조회 연산)의 성능을 기록했으며, 업계 표준인 ResNet-50 모델학습 성능 시험에서 추론 성능 7만8563 IPS에 도달했고, 에너지 효율은 500 IPS/W에 달했다.
2021년 10월에는 클라우드 서버 CPU인 '이톈(倚天)710'을 공개했다. TSMC 5nm 공정, 600억 개의 트랜지스터, Arm v9 '명령어 집합 아키텍처(ISA)' 기반 128코어를 탑재했다. 클라우드 네이티브, 동영상 인코딩·디코딩, 데이터 분석 등의 환경에 적합하다.
'위전(羽陣) 600과 위전611'은 2021년 1월과 2022년 11월 출시된 저전력∙고성능 극초단파(UHF) 무선주파수식별(RFID) 전자 태그 칩이다. 소비재 유통, 스마트 물류, 공급망 관리 등 다양한 분야에서 활용된다.
2023년 11월 공개된 '전웨(鎮嶽)510'은 고성능 기업용 SSD 컨트롤러 칩으로, '쉬안톄(玄鐵)-R910' 리스크파이브(RISC-V) 코어를 탑재했다. 분산 스토리지, 데이터베이스, 온라인트랜잭션처리(OLTP)/온라인분석처리(OLAP) 등 시나리오에 적용 가능하다. 참고로, 쉬안톄는 핑터우거가 보유한 RISC-V 아키텍처 기반의 프로세서 전문 생산 브랜드다.
<中 반도체 독립 가속화 속 재평가② '알리바바 AI칩 테마주'>로 이어짐.
[본 기사는 정보를 제공하기 위한 것이며, 투자를 권유하거나 주식거래를 유도하지 않습니다. 해당 정보 이용에 따르는 책임은 이용자 본인에게 있습니다.]
pxx17@newspim.com