과기정통부, 4일 정부서울청사서 '독자 AI 파운데이션 모델' 5개 정예팀 발표
송상훈 실장 "독자 AI 모델, 비즈니스 모델과 시장 창출하길 기대"
이달 중 정예팀과 협약 체결 예정...연말 평가 거처 4개팀으로 압축
[서울=뉴스핌] 양태훈 기자 = 정부가 인공지능(AI) 기술 주권을 확보하고 국내 생태계를 자립형으로 전환하기 위한 청사진으로 '프롬 스크래치(From Scratch)' 개발과 '오픈소스' 개방 전략을 제시했다. 기술 개발의 출발선에서부터 독자적으로 모델을 설계하고, 그 결과물을 민간 생태계 전반에 공유하는 방식으로 'K-AI'의 방향을 설정한 셈이다.
4일 과학기술정보통신부(이하 과기정통부)는 정부서울청사에서 '독자 AI 파운데이션 모델' 프로젝트 정예 5개팀을 최종 선정해 발표했다. 선정된 팀은 ▲네이버클라우드 ▲업스테이지 ▲SK텔레콤 ▲엔씨에이아이(NC AI) ▲LG경영개발원 AI연구원 등으로, 지난 6월 사업 공고를 통해 모집된 15개 팀 가운데 서면평가(10개 팀 압축)와 발표평가를 거쳐 결정됐다.
정부는 이번 프로젝트가 단순한 AI 모델 적용이 아닌, 모델의 설계와 사전 학습 단계까지 포함한 전주기 개발 역량을 갖춘 '프롬 스크래치'형 팀 선정을 목표로 했다고 밝혔다.
![]() |
4일 정부서울청사에서 열린 '독자 AI 파운데이션 모델' 브리핑 현장. 송상훈 과학기술정보통신부 정보통신정책실장이 발표하고 있다. [사진=양태훈 기자] |
송상훈 과학기정통신부 정보통신정책실장은 이날 브리핑에서 "이번 프로젝트는 단순한 데이터의 유입, 해외 AI 모델의 위세 조정이 아닌 모델의 초기 설계부터 사전 학습 과정 등을 수행하는 '프롬 스크래치' 역량을 지향한다"며 "새로운 기술 변화에 능동적으로 대응할 수 있는지, 새로운 모델 구조를 제안하고 시작한 경험이 객관적으로 검증 가능한지가 중요한 평가 요소로 고려됐다"고 설명했다.
이어 "AI 원천 기술에 단기간 투자한 경험과 오픈소스로도 공개되어 있는지도 검토되었으며, 기술적 파급 효과가 많은 기관의 역량과 실질적 기여 가능성에 중점을 두고 평가가 이뤄졌다"고 덧붙였다.
◆ 5개 정예팀, 오픈소스 전략 제시…"생태계 순환 구조 기대"
정예팀에 선정된 5개 팀은 공통적으로 개발한 AI 모델을 오픈소스 형태로 공개하거나, 상업적 활용이 가능한 개방형 전략을 제시했다. 과기정통부는 이를 통해 국내 AI 생태계 확장성과 접근성을 동시에 확보할 수 있을 것으로 기대하고 있다.
송 실장은 "다섯 개 팀들은 모두 개발 확보한 AI 모델들을 다른 기업들이 타산업 모델에 적용 가능하도록 공개하는 등 높은 수준의 오픈소스 정책을 제시해줬다"며 "우리가 개발한 AI 모델이 오픈소스 형태로 국내 AI 생태계에 순환되고, 또 다른 비즈니스 모델과 시장을 창출하고, 우리 국민들의 AI 접근성 증진에도 적극 기여하여 모두의 AI의 출발점이 되기를 기대한다"고 말했다.
![]() |
또한 "AI는 특정 기업만의 것이 되어선 안 되고, 우리 모두가 함께 활용할 수 있어야 한다는 점에서 개방 전략은 매우 중요하다"고 덧붙였다.
이번 프로젝트는 단순 모델 개발뿐 아니라, 산업·공공 부문과의 연계 전략도 함께 평가됐다.
구체적으로 네이버클라우드는 옴니(Omni) 파운데이션 모델을 구축해 국민 누구나 접근 가능한 AI 서비스 플랫폼과 'AI 에이전트 마켓플레이스'를 운영한다는 계획을 밝혔다. 업스테이지는 독자 구조 기반의 'Solar WBL' 모델을 개발하고, 금융·법률·국방 등 분야에서의 B2B·B2G 확산을 추진한다.
SK텔레콤은 언어·멀티모달·행동 데이터를 융합한 차세대 모델을 개발해 국민 AI 접근성과 산업 전환(AX)을 동시에 추진할 계획이다. 엔씨에이아이는 산업 특화형 멀티모달 모델과 '도메인옵스' 플랫폼을 개발해 제조·공공 서비스 등으로의 확산을 꾀하며, LG경영개발원은 고성능 프론티어 모델 'K-EXAONE'을 개발해 B2B·B2G 분야의 대표 사례를 창출하겠다는 목표를 내세웠다.
◆ 정부, 데이터·GPU 등 집중 지원…"이달 협약 후 연말 평가"
정부는 각 정예팀이 AI 모델 개발에 필요한 데이터, 인프라, 인재 등도 적극 지원할 예정이다. 방송영상과 공공기관 보유 데이터를 중심으로 약 100억원 규모의 데이터 공동구매가 이뤄지며, 팀별 특화 데이터셋 구축에도 28억원씩 별도 지원된다. 방송영상 학습용 데이터에는 200억원이 추가 배정된다.
GPU의 경우, 네이버클라우드와 SK텔레콤은 이번에 GPU 임대 공급사로 지정돼 해당 정예팀은 임대 공급 방식으로 지원받으며, 업스테이지, 엔씨에이아이, LG경영개발원 팀은 정부로부터 직접 GPU 지원을 받는다.
정예팀과의 협약은 이달 중 체결되며, 연말까지 1차 단계 평가를 거쳐 5개 팀 중 4개 팀으로 압축될 예정이다. 이 과정에서 국민과 전문가가 함께 참여하는 공개 콘테스트와 성능 벤치마크도 병행될 계획이다.
![]() |
송 실장은 "정예팀 개발 교감 및 성능 평가를 위해 정예팀 모델 특징을 고려한 벤치마크 데이터센터 구축과 함께, 연내에 정예팀을 포함하여 대한민국 국민 누구나 AI 모델의 성능을 평가하고 검증을 받을 수 있는 윈더버드 시범 오픈을 추진할 계획"이라고 밝혔다.
이어 "각 팀이 개발하여 확보한 AI 모델 등을 기반으로 내년 말 1차 단계 평가를 추진한다"며 "각 정예팀이 개발하여 확보한 AI 파운데이션 모델이 AI 생태계 확장, 국민 AI 접근성 증진, 공공·경제·사회 분야의 AI 대전환, 국방·안보적 활용 등으로 이어질 수 있도록 적극 지원할 계획"이라고 말했다.
한편, 정부는 향후 정예팀에 'K-AI 모델', 'K-AI 기업' 등의 명칭을 부여하고, 각 팀이 개발한 AI 모델이 산업·공공·사회 전반에 적용될 수 있도록 적극 지원할 계획으로, 연말 1차 평가를 거친 뒤에는 남은 팀을 중심으로 후속 지원을 이어갈 예정이다.
■ 용어설명
* 프롬 스크래치(From Scratch) : 기존 모델이나 외부 라이브러리 없이 데이터 수집부터 모델 설계, 알고리즘 구현, 학습 및 테스트까지 모든 과정을 자체 기술로 처음부터 개발하는 것을 의미.
* CSP(Cloud Service Provider) : 클라우드 서비스 제공업체의 약자로, 서버·스토리지·네트워크 같은 클라우드 인프라와 소프트웨어 플랫폼, 각종 클라우드 기반 IT 서비스를 인터넷을 통해 제공하는 회사.
* 멀티모달(Multi Modal) : 텍스트, 이미지, 오디오 등 서로 다른 유형의 데이터를 통합적으로 처리하고 이해하는 AI 기술.
* 옴니(Omni) 파운데이션 모델 : 이종 데이터의 통합 이해 및 생성 등이 가능한 단일 모델.
* 도메인옵스(DomainOPs) : 특정 도메인에서의 운영, 자동화, 최적화 등이 가능한 프레임 워크.
* 글로벌 프런티어 모델 : 기존 최고 수준의 AI를 능가하거나 대등한 성능을 가진, 방대한 데이터와 초대규모 파라미터로 다양한 작업과 멀티모달 처리가 가능한 최첨단 대형 AI 모델.
dconnect@newspim.com