전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 ICT

속보

더보기

네이버, 국내 최초 '초대규모 AI' 하이퍼클로바 공개…"모두를 위한 AI시대"

기사입력 : 2021년05월25일 14:00

최종수정 : 2021년05월25일 14:00

오픈AI가 개발한 GPT-3보다 6500배 많은 한국어 데이터 학습
204B 규모의 세계 최대 한국어 언어모델로 AI 주권 확보
검색어 교정 시작으로 다양한 네이버 서비스에 상용화 계획

[서울=뉴스핌] 구윤모 기자 = 네이버는 25일 국내 기업 최초의 '초대규모 AI'인 '하이퍼클로바(HyperCLOVA)'를 공개했다. 국내 AI 퍼스트무버(first mover)를 넘어 글로벌 AI 기술 리더로 발돋움하겠다는 계획도 밝혔다. 기존 한국어 AI의 패러다임을 바꾸는 '하이퍼클로바'를 통해 사용자, 중소상공인(SME), 크리에이터에게 새롭고 차별화된 경험을 선보이며 '모두를 위한 AI' 시대를 이끌어가겠다는 계획이다.

네이버는 이날 온라인으로 열린 'NAVER AI NOW' 컨퍼런스에서 지난해 10월 슈퍼컴퓨터 도입 이후 네이버 AI 기술의 성과와 앞으로의 방향성을 공개했다.

[서울=뉴스핌] 구윤모 기자 = 네이버 하이퍼클로바 [사진=네이버] 2021.05.25 iamkym@newspim.com

◆ 국내 최초 초대규모 AI, 세계 최대 한국어 언어모델 '하이퍼클로바'

하이퍼클로바는 네이버가 국내 기업 최초로 자체 개발한 초대규모 AI다. 정석근 네이버 CLOVA CIC(Company-In-Company) 대표는 키노트에서 "글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다"며 "한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다"고 개발 배경을 밝혔다.

하이퍼클로바는 '오픈AI'의 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터(parameter, 매개변수) 규모로 개발됐다. AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록 AI는 더욱 많은 문제를 해결할 수 있게 된다.

하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 현재 전세계에서 가장 큰 한국어 초거대 언어모델이기도 하다. 영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리, 하이퍼클로바 학습 데이터는 한국어 비중이 97%에 달한다. 영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써 AI 주권을 확보한다는 의미도 있다.

◆ 네이버 "글로벌 수준의 인프라, 데이터, AI 전문성으로 기술 주도권 잡을 것"

네이버는 지난 10월 국내 기업 최초로 700 페타플롭(PF) 성능의 슈퍼컴퓨터를 도입하며 대용량 데이터 처리를 위한 인프라를 갖췄다.

국내 최대 인터넷 플랫폼을 운영하며 쌓아온 대규모 데이터 처리 능력도 하이퍼클로바만의 중요한 경쟁력이다. 네이버는 하이퍼클로바 개발을 위해 5600억개 토큰(token)의 한국어 대용량 데이터를 구축했다.

슈퍼컴퓨터 인프라와 한국어 데이터 외에 네이버가 보유한 전세계 최고 수준의 AI 연구 개발 역량 역시 하이퍼클로바 자체 개발의 중요한 요소다. 네이버는 작년 한해 동안 글로벌 Top AI 컨퍼런스에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표하며 기술력을 인정받았다. 

또한 서울대학교와 '서울대-네이버 초대규모(Hyperscale) AI 연구센터'를 설립하고, 카이스트 AI 대학원과는 '카이스트-네이버 초창의적(Hypercreative) AI 연구센터'를 설립하는 등 긴밀하고 강력한 산학협력을 통해 AI 공동 연구에 더욱 박차를 가하고 있다.

네이버는 앞으로 한국어 외 다른 언어로 언어 모델을 확장하고, 언어뿐만 아니라 영상이나 이미지 등도 이해하는 '멀티모달(Multimodal) AI'로 하이퍼클로바를 계속해서 발전시켜나갈 계획이다.​

◆ 네이버 서비스에 하이퍼클로바 상용화...사용자 경험 차별화

하이퍼클로바는 AI 개발과 적용의 패러다임을 완전히 바꿔 일상 속에서 AI가 더욱 많이, 널리 사용되도록 한다. 기존에는 해결하고자 하는 문제별로 데이터를 확보하고 정제해 모델을 개발했다면 하이퍼클로바는 하나의 'Big Model'에 방대한 데이터를 학습시켜 다양한 문제에 적용할 수 있다. 이를 통해 AI를 더욱 효율적으로 개발할 수 있을 뿐만 아니라 AI의 확장성이 대폭 높아진다.

네이버는 하이퍼클로바의 기술을 네이버 서비스에 적용해 사용자들에게 차별화된 경험을 제공할 예정이다. 첫번째 사례로 지난 6일 검색 서비스에 하이퍼클로바를 적용, 사용자가 검색어를 잘못 입력하는 경우 올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해주는 기능을 선보인 바 있다.​

 ◆ SME, 크리에이터, 스타트업 등 기술이 필요한 '모두의 능력'으로

네이버는 하이퍼클로바가 SME, 크리에이터, 스타트업 등 기술의 도움이 필요한 '모두의 능력'이 될 수 있도록 지원한다는 계획이다. 간단한 설명과 예시를 제시하는 소수학습(Few-shot learning) 방식으로 AI를 동작시킬 수 있기 때문에 AI 전문가가 아니어도 누구나 손쉽게 AI 서비스를 만들 수 있다.

예를 들어 상품 판매에 도움이 되는 적절한 마케팅 문구를 AI가 자동으로 작성해주는 일, 공부해야 할 내용을 AI가 빠르게 요약하거나 모르는 내용을 질문했을 때 자연스럽게 답변해주는 일 등이 가능해지게 된다. 네이버는 향후 적극적인 사업 및 연구 협력을 통해 다양한 방식의 기술 제공을 계획하고 있다.

​정석근 네이버 CLOVA CIC 대표는 "더 짧은 시간과 더 적은 리소스를 사용해서 이전에 우리가 상상만 헀던, 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다"며 "하이퍼클로바를 통해 SME와 크리에이터를 포함해 AI 기술이 필요한 모두에게 새로운 경험을 제공할 것"이라고 말했다.

 

iamkym@newspim.com

[뉴스핌 베스트 기사]

사진
尹 지지율 2.3%p↓, 38.1%…"與 총선참패 '용산 책임론' 영향" [서울=뉴스핌] 박성준 기자 = 윤석열 대통령의 지지율이 소폭 하락해 30%대 후반을 기록했다는 여론조사 결과가 18일 발표됐다. 종합뉴스통신 뉴스핌 의뢰로 여론조사 전문업체 미디어리서치가 지난 15~16일 전국 만 18세 이상 남녀 1001명에게 물은 결과 윤 대통령의 국정운영에 대한 긍정평가는 38.1%로 집계됐다. 부정평가는 59.3%로 나타났다. '잘 모름'에 답한 비율은 2.5%다. 긍정평가와 부정평가 간 격차는 21.2%포인트(p)다. 긍정평가는 지난 조사 대비 2.3%p 하락했고, 부정평가는 1.6%p 상승했다. 연령별로 보면 40대에서 긍·부정 평가 격차가 극명하게 드러났다. 만 18세~29세에서 '잘함'은 36.0% '잘 못함' 61.0%였고, 30대에서는 '잘함' 30.0% '잘 못함' 65.5%였다. 40대는 '잘함' 23.9% '잘 못함' 74.2%, 50대는 '잘함' 38.1% '잘 못함' 59.8%로 집계됐다. 60대는 '잘함' 51.6% '잘 못함' 45.9%였고, 70대 이상에서는 60대와 같이 '잘함'이 50.4%로 '잘 못함'(48.2%)보다 높게 나타났다. 지역별로는 서울 '잘함' 38.5%, '잘 못함'은 60.1%로 집계됐다. 경기·인천 '잘함' 31.4% '잘 못함' 65.2%, 대전·충청·세종 '잘함' 32.7% '잘 못함' 63.4%, 부산·울산·경남 '잘함' 47.1% '잘 못함' 50.6%로 나타났다. 대구·경북은 '잘함' 58.5% '잘 못함' 38.0%, 전남·광주·전북 '잘함' 31.8% '잘 못함' 68.2%로 나타났다. 강원·제주는 '잘함' 37.1% '잘 못함' 60.5%로 집계됐다. 성별로도 남녀 모두 부정평가가 우세했다. 남성은 '잘함' 34.7% '잘 못함' 63.4%, 여성은 '잘함' 41.6% '잘 못함' 55.3%였다. 김대은 미디어리서치 대표는 윤 대통령 지지율 하락 배경에 대해 "108석에 그친 국민의힘의 총선 참패가 '윤 대통령의 일방적·독선적인 국정 운영 스타일로 일관한 탓이 크다'라는 '용산 책임론'이 대두되며 지지율이 하락했다"고 평가했다. 이준한 인천대 정치외교학과 교수도 "선거 결과에 대해 실망한 여론이 반영됐을 것"이라며 "최근 국무회의 발언 등을 국민들이 긍정적으로 생각하는 것도 아니고 경제 상황도 나아지고 있지 않아 추후 지지율은 더 낮아질 수 있다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.9%, 표본오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. parksj@newspim.com 2024-04-18 06:00
사진
이재명 "다 접어두고 尹대통령 만나겠다" [서울=뉴스핌] 윤채영 김윤희 기자 = 이재명 더불어민주당 대표가 26일 윤석열 대통령과의 영수회담과 관련해 "의제도 정리하고 미리 사전조율도 해야하는데 그조차도 녹록지가 않은 것 같다"며 "다 접어두고 먼저 윤석열 대통령을 만나겠다"고 밝혔다. 이 대표는 이날 오전 국회에서 열린 최고위원회의에서 "복잡한 의제들이 미리 정리됐으면 좋았을 텐데 쉽지 않은 것 같다. 그거 정리하느라 시간 보내기 아쉽기 때문에 신속하게 만날 일정을 잡도록 하겠다"며 이같이 말했다. [서울=뉴스핌] 윤창빈 기자 = 이재명 더불어민주당 대표가 26일 오전 서울 여의도 국회에서 열린 최고위원회의에서 모두발언을 하고 있다. 2024.04.26 pangbin@newspim.com 이 대표는 "윤석열 대통령을 만나서 총선에서 드러난 우리 국민들의 민심을 가감없이 전달하도록 하겠다. 그리고 민생 현장의 참혹한 현실을 제대로 전달하고 또 필요한 조치들을 할 수 있도록 요청드리도록 하겠다"고 했다. 그는 이어 "윤석열 대통령께서도 우리 국민들의 이런 어려운 상황, 총선 민의를 잘 들어주시고 절박한 심정으로 어떻게하면 이 난국을 타개할 수 있을지 함께 고민해주시길 부탁드린다"고 촉구했다. 그러면서 "지금 이 위기를 벗어나지 못하면 몰락한다는 각오로 이번 회담에서 반드시 국민이 기대하는 성과, 가능한 조치들을 만들어내도록 노력하겠다"고 약속했다. 윤 대통령과 이 대표의 영수회담 실무회담은 전날에도 이어졌지만, 민주당은 "대통령실이 의제에 대해 구체적인 검토 결과를 제시하지 않았다"며 아쉬움을 표했다. 이에 대통령실은 "의제 제한을 두지 않고 사전 합의가 필요 없는 자유로운 형식의 회담을 가능한 빠른 시일 내에 개최하자"고 제안했다. 이 대표가 의제 조율이 지지부진하자 이를 접어두고 일단 윤 대통령을 만나겠다며 전향적인 입장을 밝힘에 따라 윤 대통령과 이 대표 간 만남은 금명간 성사될 것으로 전망된다.  ycy1486@newspim.com 2024-04-26 09:38
안다쇼핑
Top으로 이동