전체기사 최신뉴스 GAM
KYD 디데이
전국 대전·세종·충남

속보

더보기

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 : 2023년03월21일 17:21

최종수정 : 2023년03월21일 17:21

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
한강버스 재운항 보름 만에 또 멈춰 [서울=뉴스핌] 이경화 기자 = 서울시 수상교통 수단인 '한강버스'가 수심이 얕은 구간을 지나던 중 강바닥에 걸려 멈춰서 승객 82명이 구조됐다. 한강버스는 잦은 고장으로 한 달간 중단됐다 이달부터 재개된 가운데, 서울시는 안전 확인을 위해 일부 구간의 운항을 또 중단하기로 했다. 16일 서울시에 따르면 15일 오후 8시25분경 잠실행 7항차 한강버스 102호가 잠실선착장 인근 100m 부근에서 강바닥에 걸려 멈췄다. 시는 수난구조대·한강경찰대·한강본부 등 관련 기관에 즉시 신고해 구조정을 투입했고, 오후 9시14분 승객 82명 전원을 잠실선착장으로 이송해 귀가 조치했다. 인명 피해는 없었다. ㈜한강버스와 서울시는 선장 작성 사고보고서, 선박 내 CCTV, 한강본부 수심 측정 데이터, 항로 준설 실적, 지장물 현황 등을 종합 검토해 원인을 파악했다. 직접적인 멈춤 사고의 원인은 항로 이탈에 따른 저수심 구간 걸림이며, 간접적 원인은 저수심 구간 우측 항로 표시등(부이) 밝기 불충분으로 추정된다. [서울=뉴스핌] 최지환 기자 = 지난 1일부터 다시 운항을 재개한 한강버스가 3일 서울 강남구 한강버스 압구정선착장으로 향하고 있다. 2025.11.03 choipix16@newspim.com 시는 추후 해양안전심판원, 관할 경찰서, 행정안전부 등 관계기관의 추가 조사를 통해 정확한 사고원인이 확정될 것으로 예상하고 있다. 멈춘 한강버스의 인양은 오는 19일 오후 7시 만조 시점 물 때에 맞춰 선박 부상 시 이동할 예정이다. 또 점검 조치를 완료할 때까지 당분간 한남대교 남단 마곡~여의도 구간만 부분 운항한다. 압구정~옥수~뚝섬~잠실 구간은 운항하지 않는다. 시는 한남대교 상류 항로 수중 탐사, 저수심 구간 토사퇴적 현황 확인, 부유물·이물질 제거, 선기장 교육 강화 등 안전조치를 강화할 예정이다. 이민경 서울시 대변인은 입장문을 통해 "한강버스 102호가 잠실선착장 인근 지점에서 일시 정지해 시민 여러분께 불편을 끼쳐드린 점에 깊이 사과드린다"고 밝혔다. 그러면서도 "사고 발생 즉시 안전을 최우선으로 대응했고, 그 과정에서 모든 안전 절차가 정상적으로 작동했다"고 덧붙였다. 지난 9월 정식 운항을 시작한 한강버스는 열흘 만에 잦은 고장으로 한 달간 운항을 중단했다가 이달부터 재개했다. 시는 300회 이상 성능 안정화 시범 운항을 마치고 안정성을 대폭 강화했다고 밝혔지만, 재개 보름 만에 다시 운항을 중단하게 됐다. 김민석 국무총리는 이날 한강버스 안전성 관련 심각한 우려를 표하며, 사고 원인 규명과 대응 방안 등에 관해 특별 지시를 내렸다. 김 총리는 "서울시는 행안부와 협조해 사고원인을 철저히 조사하고 한강버스 선박, 선착장, 운항 노선의 안전성을 전반적으로 재점검하라"며 "한강의 얕은 수심과 관련해 발생할 수 있는 위험 요인과 대응 방안을 상세하게 분석해 조치하라"고 밝혔다. 특별 지시에는 한강버스 운항 중 좌초, 침몰, 화재 등 사고 발생 시 모든 승객의 안전을 보장할 수 있는 대응체계가 갖춰졌는지 재점검하는 내용이 포함됐다. 김 총리는 "안전은 아무리 강조해도 지나치지 않다"며 "점검·후속 조치를 조속히 완료하고 필요 시 일시 중단 기간 연장 등을 포함한 방안을 추가 검토해 시행하라"고 덧붙였다. kh99@newspim.com 2025-11-16 15:23
사진
'천안 이랜드 화재' 이틀째 진화 중 [서울=뉴스핌] 신수용 기자 = 지난 15일 천안 이랜드패션 물류센터에서 발생한 대형 화재의 진화 작업이 이틀째 이어지고 있다. 화재 발생 9시간 30여 분 만인 전날(15일) 오후 3시 31분쯤 큰 불길이 잡혔으나 불이 아직 다 꺼지지는 않았다. 화재가 난 물류 창고의 천장이 무너지는 등 건물 붕괴도 우려된다. 다행히 불이 업무 시작 전 발생해 인명 피해는 없었다. 당시 물류센터 경비원 등 근무하던 직원 3명은 119에 신고한 후 모두 스스로 대피했다. 16일 충남소방본부 등은 소방관 150여 명과 소방차 및 진화 장비 80여 대를 투입해 진화 작업을 벌이고 있다고 밝혔다.  지난 15일 소방청은 이날 오전7시쯤 천안시 동남구 풍세면 용정리에 위치한 이랜드패션 물류센터에서 발생한 화재에 대해 대응 2단계를 발령하고 화재 진압에 나섰다. [사진=독자제공]  소방 당국에 따르면 골조가 강한 불길에 장시간 노출된 탓에 지붕 등 건물 일부분이 붕괴한 상태라 내부 진입은 불가능한 상황이다. 이에 건물 외부에서 내부를 향해 방수포로 분당 최대 7만 5000L의 물을 뿌리며 진화 작업을 진행하고 있다. 화재 발생 9시간 30여 분 만인 전날 오후 3시 30분쯤 큰 불길이 잡혔고 오후 7시 30분을 기해 대응 2단계가 해제됐다. 하지만 소방 당국은 이날 오전 6시 기준 대응 1단계를 유지 중이다. 큰 불길은 잡혔지만, 의류 등 내부 적재물이 불쏘시개 역할을 하면서 진화에 어려움을 겪고 있다. 2014년 7월 준공된 이랜드 패션 물류센터는 지하 1층·지상 4층 규모로 건물 연면적이 축구장 27개 넓이와 맞먹는 19만 3210㎡에 달한다. 화물차 150대가 동시 접안할 수 있고, 일일 최대 5만 박스, 연간 400만∼500만 박스를 처리하는 대형 물류 시설이다. 의류 등이 최소 1만 개 넘게 보관돼 있었다고 한다. 물류센터 전체가 사실상 전소된 상태로, 보관하던 의류와 신발 등 상품이 다 타버려 막대한 피해가 예상된다. 불은 전날 오전 6시 8분경 건물 지상 4층에서 시작된 것으로 알려졌다. 소방 당국은 신고 접수 7분 만에 '대응 1단계', 50여 분 만에 '대응 2단계' 경보를 발령하고 장비 150대와 소방관 430명을 동원해 진화에 나섰다. 화재 발생 9시간 30여 분 만인 전날 오후 3시 31분경 큰 불길은 잡혔지만 불은 계속 이어지고 있다. aaa22@newspim.com 2025-11-16 11:03
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동