전체기사 최신뉴스 GAM
KYD 디데이
전국 대전·세종·충남

속보

더보기

"AI 수천억짜리 장난감 안 되려면 데이터 품질 챙겨야"

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

박지환 씽크포비엘 대표 "비전문가 목소리 커…현실적 대안 필요"
호랑이 큰 고양이 인식하는 실수 예방 위해 '데이터 밸런스' 중요

[서울=뉴스핌] 김수진 기자 = 인공지능(AI) 시장이 매년 큰 폭으로 성장하고 있다. 정보통신산업진흥원에 따르면 AI 시장규모는 2022년 1132억 달러에 이르고 관련 시장도 3조 9230억 달러에 달할 것으로 내다봤다.

동시에 AI를 학습하는 데이터 산업도 크게 성장할 것으로 보인다. 실제로 올해 AI 학습용 데이터 활용건수는 전년도 대비 6250배 성장한 것으로 나타났다.

관련 사업에 신청한 기업 수도 전년도 2075건에서 올해 6164건으로 3배 가까이 증가했다.

정부는 관련 예산을 올해보다 15% 증가한 1230억원을 투입하고 지원 분야도 늘릴 계획이다. 1000억원 이상의 정부 지원금이 들어가는 '뉴딜' 정책이다.

하지만 일각에서는 데이터 양을 늘리는 데에만 집중하지 말고 품질도 높여야 한다는 목소리가 커지고 있다.

산업현장에서 쓸 수 있는 AI를 실현하기 위해서는 질 높은 데이터를 잘 구축해야 하기 때문이다.

AI 학습용 데이터 품질에 대한 기준은 아직 전무한 상황이다. 많은 전문가들은 데이터 댐 사업이 활발한 지금이 데이터 품질 확보의 적기라고 보고 있다.

다음은 인공지능 기반 소프트웨어 공학 기업인 (주)씽크포비엘 박지환 대표와의 일문일답.

[서울=뉴스핌] 김수진 기자 = 박지환 씽크포비엘 대표가 정부 데이터댐 사업이 성공하기 위해 데이터 품질 확보에 나서야 한다고 밝혔다. 사진은 지난 23일 씽크포비엘 사무실에서 본지와 인터뷰 중인 모습. 2020.12.31 nn0416@newspim.com

-'데이터는 양'이라는 인식이 여전한데.

▲ 올해 사업 발표 후 강남 판교 일대 관련 회사들 중 여기에 발 한번 담가보지 않은 곳이 없을 정도로 엄청난 수가 데이터댐 사업에 뛰어들었다.

정부 재원 수천억 원이 풀리니 당연한 결과다. 하지만 프로젝트 대부분이 데이터 구축, 즉 양 불리기에 급급했던 것 같다.

하지만 생각해보라. 더하기 문제만 수만 개를 풀었다고 해서 우리가 그 사람을 수학을 잘한다고 하지 않듯 AI 학습용 데이터도 다양성을 확보해야 하는 것이 당연하다.

하지만 아직도 시장에서 데이터는 '양'으로만 그 가치를 평가한다. 그 인식 그대로 정부 사업에 반영된 것이다.

품질 논의도 이러한 배경에서 나온 것이 아닐까 싶다. 내년부터 중장기 사업도 진행되는 만큼 늦었지만 이제라도 품질 논의를 해야 할 시점이다.

중요한 것은 요구되는 데이터 품질이 무엇이냐는 거다. 데이터의 오타 유무를 의미하는 것인지, 양을 의미하는지, 다양성 수준을 의미하는지, 포맷의 일관성이나 정확성을 의미하는 지 등을 아주 명확히 해야 한다.

그것을 전제로 현장에서 필요한 신뢰성을 갖춰야 하는데 이를 위해 데이터의 '다양성' 수준이 매우 중요하다. 다양성은 AI가 현장에서의 상황을 이해하고 해석할 능력을 키워주기 때문이다.

데이터 댐의 궁극적 목적은 바로 이것을 확보하는 일이다. 결국 '현장에서 써먹을 수 있는 지능이 나오느냐, 아니면 실험실에서 구경할 장난감을 만드느냐'의 차이다.

이러한 다양성 수준을 평가하는 공인 기준이 없다는 것이 큰 문제다. AI 분야는 기술이나 제도가 성숙돼 있지 못한 상황이다. 미국 등 선진국도 마찬가지다. 따라서 지금이 데이터 다양성에 대한 품질을 확인하는 기준이 필요한 시점이다.

데이터를 바라보는 산업에서의 혼란은 적용 기준이 없기 때문이라고 생각한다. 또한 기준이 사용될 수 있는 실용적인 측정 기술이 부재하다. 이를 시급히 해결하지 못한다면 정부 기대치보다 낮은 결과가 나올 가능성도 있다.

얼마 전 '아마존' 구직자 평가 AI가 성차별하는 모습을 보여 폐기되지 않았나. 업계에 만연한 성차별 편견이 반영된 기존 데이터를 학습했기 때문이다. 이렇듯 AI 신뢰성은 이제 먼 미래 일이 아니라 당장 내가 겪을 수 있는 현실이 됐다.

헬스케어나 에너지 산업 적용 AI의 신뢰성은 생명과 관계되는 만큼 검증 시스템, 즉 가이드라인 확보는 필수다. AI 기술에 맞는 윤리기준을 다방면으로 생각해 만들어야 한다.

현장에서 바라는 정부 정책은.

▲ 다행히 지난 가을 정부가 조만간 관련 대안을 만들겠다고 발표했는데 현장 목소리에 부디 귀기울여주길 바란다. 지식은 없는데 힘을 가진 비전문가들이 정책에 관여해 현실성 떨어지는 대안을 만드는 일이 앞으로는 없었으면 한다.

데이터 댐 사업은 상당히 전문적인 분야고 일반인이 이해하기 쉽지 않다. 따라서 정책 결정 시 비전문가의 영역과 전문가 영역을 명확히 나눠야 한다고 생각한다. 

감리 부문의 현실화 등 현장의 애로도 반영해줬으면 한다. 일례로 감리로 온 분이 데이터와 빅데이터의 차이도 이해 못하거나 보고서를 회사 측에 대신 써달라고 했었다고 전해 들었다. 이런데 어찌 데이터 댐 사업이 좋은 결과를 얻겠는가. 정부는 이러한 업계 목소리를 열심히 들어야 한다.

데이터 댐 사업의 일자리 창출 효과에 대한 논의도 놓쳐선 안 된다고 생각한다. 당초 사회적 약자를 위해 만들어진 정책인 만큼 그들이 앞으로도 꾸준히 일을 하면서 능률과 경쟁력을 갖출 수 있도록 보완해야 한다.

현재 데이터 구축 사업은 단순반복에 그쳐 저임금근로자로 남을 수밖에 없는 구조다. 우리 회사에서는 단순반복 작업자가 아닌 '데이터 밸런서'로써 고효율적인 업무 능력을 갖출 수 있도록 교육하고 있다.

-데이터 밸런스를 강조하는데.

▲ 예를 들어 이미지 데이터 중 고양이 화상만을 뽑아내는 AI를 개발한다고 하자. 이때 AI는 이미지 데이터의 색조, 명암, 선명도 등 자체 특성뿐만 아니라 해상도, 촬영 시간대, 주변 환경 등 외부 요소까지 고려해 파악해야 한다.

여기에 더해 표범이나 자칼 등 고양이와 혼동할 수 있는 동물 데이터도 AI를 훈련시켜야 현장에서 호랑이를 큰 고양이로 인식하는 실수를 막는다. 이렇듯 AI가 실 산업현장에서 필요한 기능을 안정적으로 수행할 수 있도록 데이터를 설계하고 적용하는 기준 설정은 매우 중요하다. 그것이 '데이터 밸런스'라는 기술이다.

이 기술을 통해 데이터 댐에 모인 데이터가 실제로 특정 현장에서 유용한지 오작동 가능성은 없는지를 검증한다. 현재 한국정보통신기술협회(TTA)의 단체표준으로 지정돼 있다.

-앞으로 산업 전망은.

▲ AI의 경쟁력은 신뢰성이 생명이다. AI가 얼마나 똑똑한지 보다, 얼마나 안전하고 어디까지 믿을 수 있는지가 더 중요해질거다. 그러한 신뢰성을 갖추기 위해서는 AI 데이터를 평가하고 검증하는 기술을 갖춰야 한다고 생각한다.

아직 AI 성능이나 신뢰성을 평가하는 기술이 부재하고 그에 대한 기준도 사실상 거의 없다. 아직은 혼란한 상황이지만 또 다르게 말해 한국이 관련 시장을 선도할 수 있다는 의미기도 하다.

우리 회사의 데이터밸런스 뿐만 아니라 국내 다른 기업들이 더 많은 다양한 방법을 시도하며 선의의 경쟁을 펼친다면 관련 시장도 더욱 발전하지 않을까 싶다. 공공의 영역에서도 이에 많은 관심과 지원이 있기를 바란다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
한국 설상 첫 金 최가온은 누구 [서울=뉴스핌] 장환수 스포츠전문기자= 한국 스키·스노보드가 오랫동안 꿈꾸던 올림픽 금메달의 주인공은 17세 3개월 여고생이었다. 세화여고 3학년 최가온이 생애 첫 올림픽 무대에서 극적인 역전 드라마를 쓰며, 한국 설상 종목 사상 첫 동계올림픽 금메달을 품에 안았다. 최가온은 13일(한국시간) 이탈리아 리비뇨 스노파크에서 열린 2026 밀라노·코르티나담페초 동계 올림픽 스노보드 여자 하프파이프 결선에서 90.25점을 받아 클로이 김(미국·88.00점)과 오노 미쓰키(일본·85.00점)를 제치고 우승을 차지했다. 한국 선수가 스키·스노보드 종목에서 올림픽 금메달을 따낸 것은 이번이 처음이다. [리비뇨 로이터=뉴스핌] 장환수 스포츠전문기자= 최가온이 13일 스노보드 여자 하프파이프 결선에서 우승한 뒤 금메달을 깨무는 세리머니를 하고 있다. 2026.02.13 zangpabo@newspim.com [리비뇨 로이터=뉴스핌] 장환수 스포츠전문기자= 세화여고 3학년 최가온이 13일 스노보드 여자 하프파이프 결선에서 1차 시기 부상을 털고 일어나, 3차 시기에서 클로이 김을 제치고 극적인 역전 금메달을 따낸 뒤 태극기를 든 채 미소를 짓고 있다. 2026.02.13 zangpabo@newspim.com 최가온은 이미 국제 무대에선 검증받은 올림픽 금메달 후보였다. 2023년 1월 미국 애스펀 X게임에서 14세 2개월의 나이로 슈퍼파이프를 제패하며 클로이 김의 최연소 우승 기록을 갈아치웠고, 한국 최초 X게임 금메달리스트라는 타이틀을 거머쥐었다. 같은 해 12월엔 월드컵 데뷔전에서 곧바로 우승을 차지하며 월드 클래스 반열에 올랐다. 그러나 상승 곡선은 큰 부상으로 한 차례 끊겼다. 2024년 1월 스위스 락스 월드컵 훈련 도중 허리를 크게 다쳐 척추 골절 판정을 받았고, 수술 후 1년 가까이 재활에 매달려야 했다. 유소년 시절부터 '천재 보더'로 불렸던 10대 선수에게 커리어 전체를 흔들 수 있는 일격이었다. 돌아온 곳도, 방식도 드라마 같았다. 부상을 당했던 바로 그 락스에서 2025년 1월 복귀전을 치른 그는 월드컵 동메달을 따내며 재기에 성공했다. 이후 중국·미국·스위스에서 열린 월드컵 하프파이프를 연달아 제패하며 출전한 월드컵을 모조리 석권하는 신화를 만들었다. 월드컵에서도 1차 시기 부진 후 역전 우승을 여러 차례 연출해 '역전의 명수'라는 별명을 얻었고, 그 흐름은 고스란히 올림픽까지 연결됐다. [리비뇨 로이터=뉴스핌] 장환수 스포츠전문기자= 최가온이 13일 스노보드 여자 하프파이프 결선에서 극적인 역전 금메달을 차지한 뒤 시상대에서 눈물을 터뜨리자 클로이 김이 활짝 웃으며 쳐다보고 있다. 2026.02.13 zangpabo@newspim.com 이번 대회 결선은 그야말로 최가온 커리어를 상징하는 한 편의 시나리오였다. 1차 시기 두 번째 점프에서 보드가 파이프 턱에 걸리며 크게 넘어졌다. 한동안 일어나지 못한 채 쓰러져 있었고, 의료진이 슬로프 안으로 들어와 상태를 살폈다. 2차 시기를 앞두곤 전광판에 'DNS(출전하지 않는다)'가 잠시 표기될 정도로 기권 가능성까지 거론됐다. 그럼에도 그는 두 번째 런에서 다시 슬로프 위에 섰다. 하지만 2차 시기에서도 초반에 또 한 번 넘어지며 점수를 만들지 못했다. 3차 시기를 앞둔 최가온의 점수는 10.00점, 결선 12명 가운데 11위. 반면 올림픽 3연패에 도전하던 클로이 김은 이미 1차 시기에서 88.00점을 받아 여유 있게 1위를 지키고 있었다. 눈발까지 다시 굵어지며 코스가 무거워진 최악의 조건 속에서, 최가온은 무리한 1080도 회전 대신 현실적인 선택을 택했다. 1080도 이상의 초고난도 기술을 덜어내고 900도, 720도 회전으로 루틴을 재구성한 뒤, 세 번째 런을 완주하는 데 모든 걸 걸었다. 결과는 90.25점. 깔끔한 착지와 구성으로 심판 점수를 끌어올리며 단숨에 1위로 도약했다. 이제 남은 건 클로이 김의 마지막 런. 하지만 김은 2·3차 시기 모두 도중에 넘어지며 점수를 보태지 못했고, 결국 최가온의 금메달이 확정됐다. [리비뇨 로이터=뉴스핌] 장환수 스포츠전문기자= 최가온이 13일 스노보드 여자 하프파이프 결선 1차 시기에서 두 번째 점프 후 보드가 눈 턱에 걸리며 넘어지고 있다. 2026.02.13 zangpabo@newspim.com [리비뇨 로이터=뉴스핌] 장환수 스포츠전문기자= 최가온이 13일 스노보드 여자 하프파이프 결선 1차 시기에서 넘어지자 의료진이 달려와 상태를 살펴보고 있다. 2026.02.13 zangpabo@newspim.com 최가온의 출발은 거창하지 않았다. 스노보드를 취미로 즐기던 아버지를 따라 보드를 타기 시작했고, 어린 시절엔 피겨 여왕 김연아를 동경해 피겨스케이팅을 먼저 배웠다. 그러다 하프파이프 특유의 공중 연기에 매료돼 보드를 선택했고, 가족의 헌신적인 뒷바라지를 받으며 세계 정상급 라이더로 성장했다. 겉으로는 수줍은 평범한 여고생이지만, 파이프 위에 올라서면 누구보다 승부욕이 강한 선수라는 건 코치와 동료들이 입을 모아 말하는 대목이다. 허리 부상 당시에도 "아픈 것보다 대회에 못 나가는 게 더 속상했다"는 이야기가 나올 만큼, 경쟁과 무대 자체를 갈망하는 타입이다. 이번 금메달로 그는 올림픽 여자 하프파이프 최연소 금메달리스트 자리에도 이름을 새겼다. 17세 3개월에 금메달을 목에 걸며, 2018 평창에서 17세 10개월로 금메달을 땄던 클로이 김의 최연소 우승 기록을 7개월 앞당겼다. zangpabo@newspim.com 2026-02-13 06:48
사진
알파벳 '100년물 채권'에 거품 경고 [뉴욕=뉴스핌] 김민정 특파원 = 인공지능(AI) 인프라 구축을 위해 막대한 자금을 쏟아붓고 있는 알파벳이 영국 시장에서 발행한 100년 만기 회사채가 폭발적인 인기를 끌었다. 하지만 월가 전략가들은 이를 두고 "신용 시장의 사이클 후반부 과열을 보여주는 최신 신호"라며 경고의 목소리를 높였다. 12일(현지시간) 블룸버그통신과 CNBC에 따르면 알파벳은 지난 10일 영국 파운드화 채권 시장에서 10억파운드 규모(1조9600억 원)의 100년 만기 채권을 발행했다. 이는 알파벳의 첫 파운드화 표시 채권이자 총 200억달러 규모의 다중 통화 자금 조달 계획의 일부다. 이번 100년물 채권에는 발행 규모의 약 10배에 달하는 주문이 몰렸으며 발행 금리는 영국 국채 10년물보다 120bp(1.20%포인트) 높은 수준에서 결정됐다. 알파벳은 지난주 올해 자본지출 규모가 1850억달러에 달할 것으로 예상된다고 밝혔다. 경쟁사인 오라클과 아마존 마이크로소프트 등도 인프라 지출을 늘리고 있어 빅테크 기업들의 총부채 발행 규모는 향후 5년간 3조달러에 이를 것으로 전망된다. 윈드 시프트 캐피털의 빌 블레인 최고경영자(CEO)는 이번 거래가 AI 확장을 위해 공공 및 민간 시장에서 조달되고 있는 부채가 역사적인 규모를 벗어난 수준임을 반영한다고 지적했다. 블레인 CEO는 CNBC와의 인터뷰에서 "적당히 높은 쿠폰(금리)의 100년 만기 채권을 팔 기회를 포착한 점에 대해서는 그들에게 온전한 공로를 인정한다"며 "그들은 영국 보험사와 연기금들이 부채를 충당하기 위해 원했던 수요를 명확히 파악했다"고 말했다. 알파벳.[사진=로이터 뉴스핌]  2026.02.13 mj72284@newspim.com 하지만 그는 이번 100년물 발행이 시장 거품의 증거라고 강조했다. 블레인 CEO는 "나는 100년 만기 채권이 나온다는 사실 자체가 그보다 더 거품일 수는 없다고 생각한다"며 "만약 당신이 고점의 신호를 찾고 있다면 비록 그것이 훌륭하게 실행된 거래일지라도 그것은 절대적으로 고점의 신호처럼 보인다"고 직격탄을 날렸다. 이어 블레인 CEO는 "AI 하이퍼스케일러들의 '부채 축제'의 엄청난 규모에 대한 요점은 과거 내가 보았던 수많은 상황들을 떠올리게 한다"며 "특히 시장이 하나의 테마를 잡고 그들이 무엇을 사고 있는지 정말로 이해하지 못한 채 극단으로 치닫는 상황 말이다"라고 비판했다. 전문가들은 알파벳의 이번 움직임이 자금 조달 다각화 차원이라고 분석하면서도 리스크를 우려했다. 페더레이티드 헤르메스의 나추 초칼링엄 런던 크레딧 책임자는 "알파벳이 AI 자본지출(CAPEX)을 자금 조달하기 위해 시장의 맨 끝단(초장기물)에서 파운드화 발행을 준비한 것은 흥미롭다"며 "그들은 보험사와 연기금 수요를 활용하고 미국 달러 시장의 과포화를 피하기 위해 자금 조달원을 다각화하려는 것"이라고 설명했다. 프리미어 미튼의 사이먼 프라이어 채권 펀드 매니저는 100년물 발행이 여전히 "검증되지 않은 바다"라고 경고했다. 프라이어 매니저는 "구매자들은 기술 기업들이 주식 시장에서 사상 최고치를 기록하고 있고 업계의 본질이 끊임없이 진화하고 있음에도 불구하고 혼란스러운 글로벌 및 현지 정치 환경 속에서 6%를 조금 넘는 수익률에 자금을 묶어두게 될 것"이라고 지적했다. 무지니치앤코의 타티아나 그레일 카스트로 공공시장 공동 대표는 이번 발행이 투자자들의 '믿음'에 기반하고 있다고 봤다. 그는 "당신은 그 회사가 향후 100년 동안 이자를 지급하기 위해 존재할 것이라는 점에 올라타는 것"이라며 "이건 매우 드문 일이며 심지어 정부들도 100년 만기 부채를 잘 발행하지 않는다"고 말했다. 영화 '빅쇼트'의 실제 인물로 알려진 마이클 버리도 알파벳의 100년물 채권 발행에 우려를 표시했다. 버리는 소셜미디어 엑스(X, 옛 트위터)에 "알파벳이 100년 만기 채권 발행을 모색하고 있다"며 "이런 일이 마지막으로 있었던 것은 1997년의 모토롤라였는데 그해는 모토롤라가 거물(big deal)로 여겨졌던 마지막 해였다"고 지적했다. 그러면서 "1997년 초 모토롤라는 미국에서 시가총액 상위 25위이자 매출 상위 25위 기업이었다"며 "오늘날 모토롤라는 매출 110억달러에 불과한 시가총액 232위 기업"이라고 덧붙였다.    mj72284@newspim.com 2026-02-13 03:24
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동