전체기사 최신뉴스 GAM
KYD 디데이
전국 대전·세종·충남

속보

더보기

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
내년 의대 490명 더 뽑는다 [서울=뉴스핌] 황혜영 기자 = 2027학년도 의과대학 모집 정원이 3548명으로 늘면서 전년보다 490명이 증원된다. 이에 따라 의대 합격선 하락과 재수 이상 'N수생' 증가, 상위권 자연계 입시 재편 등 입시 지형 변화가 불가피할 것으로 보인다. 10일 열린 보건복지부의 보건의료정책심의위원회(보정심)에 따르면 2027학년도 의대 정원이 현행 3058명에서 490명 늘린 3548명으로 확정됐다. 2028·2029학년도에는 613명, 2030·2031학년도에는 813명씩 증원하기로 했다. [서울=뉴스핌] 정일구 기자 = 정부가 2027∼2031학년도 의과대학 정원을 오늘 확정한다. 보건복지부는 10일 오후 보건의료정책심의위원회(보정심) 제7차 회의를 열고 의대 정원 규모를 논의한 뒤 브리핑을 진행해 2027∼2031학년도 의사인력 양성 규모와 교육현장 지원 방안을 발표할 예정이다. 사진은 이날 서울시내 의과대학 모습. 2026.02.10 mironj19@newspim.com 2027학년도 증원분 490명은 비서울권 32개 의대를 중심으로 모두 지역의사제 전형으로 선발되며 해당 지역 중·고교 이력 등을 갖춘 학생만 지원할 수 있는 구조다. 입시업계는 이번 정원 확대가 '지역의사제' 도입과 맞물려 여러 학년에 걸쳐 입시 전반을 흔들 것으로 보고 있다. 이번 증원은 현 고3부터 중학교 2학년까지 향후 5개 학년에 영향을 미칠 것으로 분석된다. 특히 의대 정원 확대에 따른 합격선 하락이 예상된다. 종로학원 분석에 따르면 2025학년도 의대 정원 확대로 합격선 컷이 약 0.3등급 낮아졌으며, 이번 증원도 최소 0.1등급가량 하락을 불러올 것으로 보인다. 당시 지역권 대학의 경우 내신 4.7등급대까지 합격선이 내려오기도 했다. 합격선 하락은 상위권 학생들의 '반수'와 'N수생' 증가로 이어질 가능성이 크다. 임성호 종로학원 대표는 "의대 문턱이 낮아질 것이란 기대가 생기면 최상위권은 물론 중위권대 학생까지도 재도전에 나설 가능성이 커진다"고 전망했다. 특히 2027학년도 입시가 현행 9등급제 내신·수능 체제의 마지막 해라는 점에서 이미 내신이 확정된 상위권 재학생들이 반수에 나설 가능성도 제기된다. 지역의사제 도입은 중·고교 진학 선택에도 적지 않은 영향을 미칠 것으로 보인다. 지역전형 대상 지역의 고교에 진학해야 지원 자격이 주어지기 때문에 서울·경인권 중학생 사이에서는 지방 또는 경기도 내 해당 지역 고교 진학을 고려하는 움직임이 예상된다. 또 일반 의대와 지역의사제 전형 간 합격선 차이도 발생할 것으로 관측된다. 지원 단계부터 일반 의대를 우선 선호하는 경향이 강해 동일 학생이 두 전형에 합격하더라도 일반 의대를 택할 가능성이 높아 지역의사제 전형의 합격선은 다소 낮게 형성되고 중도 탈락률도 상승할 수 있다는 전망이 나온다. 전형 구조 측면에서도 변화가 예상된다. 김병진 이투스교육평가연구소 소장은 "490명 증원 인원 전체가 일반 지원자에게 해당되지는 않으며 지역인재전형과 일반전형으로 나눠 보면 실제 전국 지원자에게 영향을 주는 증원 규모는 약 200명 수준일 것"이라고 분석했다. 또 "최근 3년간 입시에서 모집 인원 변동에 가장 민감하게 반응한 전형은 수시 교과전형, 특히 지역인재전형이었다"며 "이번 증원에서도 교과 중심 지역인재전형의 모집 인원 증가 폭이 전체 입시 흐름을 결정할 것"이라고 전망했다.  hyeng0@newspim.com 2026-02-10 19:32
사진
알파벳 '100년물' 채권에 뭉칫돈 [뉴욕=뉴스핌] 김민정 특파원 = 인공지능(AI) 투자를 위한 실탄 확보에 나선 구글의 모기업 알파벳이 발행한 '100년 만기' 채권이 시장에서 뜨거운 반응을 얻었다. 100년 뒤에나 원금을 돌려받는 초장기 채권임에도 불구하고, 알파벳의 재무 건전성과 AI 패권에 대한 투자자들의 신뢰가 확인됐다는 평가다. 10일(현지시간) 블룸버그통신은 소식통을 인용해 알파벳이 영국 파운드화로 발행한 8억5000만 파운드(약 1조6900억 원) 규모의 100년 만기 채권에 무려 57억5000만 파운드의 매수 주문이 몰렸다고 보도했다. 이날 알파벳은 3년물부터 100년물까지 총 5개 트랜치(만기 구조)로 채권을 발행했는데, 그중 100년물이 가장 큰 인기를 끌었다. 알파벳은 올해 자본지출(CAPEX) 규모를 1850억 달러로 잡고 AI 지배력 강화를 위한 공격적인 행보를 이어가고 있다. 이를 위해 전날 미국 시장에서도 200억 달러 규모의 회사채 발행을 성공적으로 마쳤다. 강력한 수요 덕분에 발행 금리는 당초 예상보다 낮게 책정됐다. 또한 스위스 프랑 채권 시장에서도 3년에서 25년 만기 사이의 5개 트랜치 발행을 계획하며 전방위적인 자금 조달에 나섰다. 100년 만기 채권은 국가나 기업의 신용도가 극도로 높지 않으면 발행하기 어려운 '희귀 아이템'이다. 기술 기업 중에서는 닷컴버블 당시 IBM과 1997년 모토롤라가 발행한 사례가 있으며, 그 외에는 코카콜라, 월트디즈니, 노퍽서던 등 전통적인 우량 기업들이 발행한 바 있다. 기술 기업이 100년물을 발행한 것은 모토롤라 이후 약 30년 만이다. 미국 캘리포니아주 마운틴뷰의 구글.[사진=로이터 뉴스핌] 2026.02.11 mj72284@newspim.com ◆ "알파벳엔 '신의 한 수', 투자자에겐 '미묘한 문제'" 전문가들은 이번 초장기채 발행이 알파벳 입장에서는 매우 합리적인 전략이라고 입을 모은다. 얼렌 캐피털 매니지먼트의 브루노 슈넬러 매니징 파트너는 "이번 채권 발행은 알파벳 입장에서 영리한 부채 관리"라며 "현재 금리 수준이 합리적이고 인플레이션이 장기 목표치 근처에서 유지된다면 알파벳과 같은 기업에 초장기 조달은 매우 타당한 선택"이라고 평가했다. 그러면서 "알파벳의 견고한 재무제표와 현금 창출 능력, 시장 접근성을 고려할 때 100년 만기 채권을 신뢰성 있게 발행할 수 있는 기업은 전 세계에 몇 안 된다"고 강조했다. 하지만 투자자 입장에서는 신중해야 한다는 지적도 나온다. 초장기채는 금리 변화에 따른 가격 변동성(듀레이션 리스크)이 매우 크기 때문이다. HSBC은행의 이송진 유럽·미국 크레딧 전략가는 "AI 산업 자체는 100년 뒤에도 존재하겠지만, 생태계가 5년 뒤에 어떤 모습일지조차 예측하기 어렵다"며 "기업 간 상대적인 서열은 언제든 뒤바뀔 수 있다"고 꼬집었다. 실제로 금리 상승기에는 초장기채의 가격이 급락할 위험이 있다. 지난 2020년 오스트리아가 표면금리 0.85%로 발행한 100년 만기 국채는 이후 금리가 오르면서 현재 액면가의 30%도 안 되는 가격에 거래되고 있다. 이를 두고 슈넬러 파트너 역시 "투자자 입장에서 이 채권의 매력은 훨씬 미묘하고 복잡한 문제"라고 했다. mj72284@newspim.com 2026-02-11 01:35
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동