전체기사 최신뉴스 GAM 라씨로
KYD 디데이
전국 대전·세종·충남

속보

더보기

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 : 2023년03월21일 17:21

최종수정 : 2023년03월21일 17:21

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
與 위성정당 비례 1번 '장애인 변호사' 최보윤…인요한 8번·김예지 15번 [서울=뉴스핌] 송기욱 기자 = 국민의힘 위성정당인 국민의미래 비례대표 순번 명단이 공개됐다. 비례 1번에는 '장애인 변호사' 최보윤 한국장애인고용공단 인권경영위원이, 2번에는 탈북자 출신 박충권 현대제철 연구개발본부 책임연구원이 이름을 올렸다. 사격 국가대표 출신 진종오 강원동계청소년올림픽 조직위원장은 4번에, 인요한 전 국민의힘 혁신위원장은 8번에, 15번에는 김예지 의원에 각각 추천됐다. [서울=뉴스핌] 이형석 기자 = 유일준 국민의미래 공천관리위원장이 18일 오후 서울 여의도 당사에서 비례대표 후보자 순번을 발표하고 있다. 2024.03.18 leehs@newspim.com 유일준 국민의미래 공천관리위원장은 18일 오후 여의도 국민의힘 중앙당사에서 22대 총선 비례대표 후보자 35명 추천 명단을 발표했다. 비례 1번에는 최보윤 한국장애인고용공단 인권경영위원이 추천됐다. 유 위원장은 "장애인과 사회적 약자 보호 앞장섰다. 본인도 장애인이고 장애인 업무를 많이 하셨던 분"이라고 소개했다. 비례 2번은 박충권 현대제철 연구개발본부 책임연구원이 받았다. 3번에는 최수진 항공대 특임교수가, 4번에는 진종오 조직위원장이 이름을 올렸다. 8번에는 인요한 전 국민의힘 혁신위원장이 추천됐다. 이 밖에도 ▲5번 강선영 전 육군 항공작전사령관 ▲6번 김건 전 외교부 한반도평화교섭본부장 ▲7번 김소희 기후변화센터 사무총장 ▲9번 김민전 경희대 교수 ▲10번 김위상 한국노총대구지역본부의장 등이 10위권 내에 추천됐다. 현역 비례대표인 김예지 의원은 15번에 추천됐다. 유 위원장은 "비례대표는 흔히 한 번만 하는 것으로 인식돼있는데 그것은 각자가 하기 나름이라고 생각한다"면서 "김 의원은 의정활동도 잘 하셨고 우리당 뿐만아니라 전 국회적으로 상당히 감동을 주셨다. 충분히 인정받으신 분이라 그런 차원에서 했다"고 설명했다. 이후 비례 11번에는 한지아 을지대학교병원 재활의학과 부교수 ▲12번 유용원 육해공군본부 국가보훈부 정책자문위원 ▲13번 강세원 전 대통령실 법률비서관실 행정관 ▲14번 김장겸 전 MBC 사장 ▲16번 안상훈 서울대 사회복지학과 교수 ▲17번 이시우 전 국무총리비서실 공보실 서기관 ▲18번 박준태 크라운랩스 대표이사 ▲19번 이소희 여민합동법률사무소 변호사 ▲20번 남성욱 고려대 교수 등이 뽑혔다. 또 ▲21번 정혜림 전 에너지경제연구원 연구원 ▲22번 김화진 전 국민의힘 전남도당위원장 ▲23번 이달희 전 경상북도 경제부지사 ▲24번 주기환 전 국민의힘 광주시당위원장 ▲25번 김민정 국회 보좌관 ▲26번 서보성 국민의힘 대구시당 사무처장 ▲27번 김미현 전 영화진흥위원회 연구본부장 ▲28번 이석환 변호사 ▲29번 임보라 전 국민의힘 당무감사실장이다. 아울러 ▲30번 김인현 고려대 교수 ▲31번 최연후 휴먼에이드 공동대표 ▲32번 이승현 중기중앙회 한국영상제작협동조합 이사장 ▲33번 이윤정 전 광명시의원 ▲34번 백종욱 전 국정원 3차장 ▲35번 김소양 청년정책조정위 부위원장 등이 비례대표 후보로 이름을 올렸다. oneway@newspim.com 2024-03-18 16:15
사진
뉴스핌 싱어송라이터 시즌2 '히든 스테이지'…실력파 총40팀 본선행 [서울 = 뉴스핌] 오광수 문화전문기자 = 종합뉴스통신사 뉴스핌(회장 민병복)이 주최하는 싱어송라이터 경연대회 시즌2 '히든 스테이지'가 10일 접수를 마감하고 본격적인 본선 무대를 시작한다. 히든스테이지 사무국은 "국내외에서 총 337팀(명)이 참여, 언론사에서 주최하는 싱어송라이터 경연대회에 큰 관심을 보였다"고 밝혔다. 사무국은 이들 지원자 중에서 총 40팀(명)을 선발하여 15일 오후 5시 30분 각 개인에게 통보한 뒤 홈페이지를 통해 합격자를 발표했다. [서울 = 뉴스핌] 오광수 문화전문기자 = 지난해 싱어송라이터 시즌1의 수상자인 파일럿이 축하공연을 하고 있다. 2024.03.18 oks34@newspim.com 18일 히든 스테이지 사무국에 따르면 전체 지원자 337팀(명) 가운데 밴드는 20%정도 차지했다고 밝혔다. 본선 진출팀은 40팀 중애서 밴드와 개인의 비율은 2 : 8 이다. 남녀 비율은 남성 지원자 53%, 여성지원자 47%로 남여 5:5로 대등한 비율을 보였다. 참가곡은 발라드, 재즈, 팝, 록, 힙합, CCM 등 다양한 장르를 망라했다. 참가자 나이대는 20~35세가 90% 이상으로 대세를 이뤘다. 최고령 61세 최연소 13세이다. 언론사로서는 유례를 찾기 힘든 이번 싱어송라이터 경연대회는 시작부터 열기가 뜨거웠다. 우선 가요계를 대표하는 실력파 싱어송라이터들의 응원메시지가 이어졌다. 싱어송라이터 강허달림, 이한철, 안예은, 에일리를 비롯하여 여행스케치 루카, 레이지본, 범진 등이 미래를 책임질 싱어송라이터를 기다리는 마음을 담아 메시지를 보내왔다. 또 문화체육관광부(장관 유인촌), 한국콘텐츠진흥원(원장 조현래), (사)한국음악저작권협회(회장 추가열) 등 문화예술 진흥을 위해 힘쓰는 기관과 단체가 후원하고 있는 점도 눈길을 끈다. 본선에 직행한 40팀(명)은 3월 29일부터 8월 2일까지 7차례에 걸쳐서 매주 금요일 서울 여의도 미원빌딩에 마련된 본사 스튜디오에서 녹화를 진행한다. 이렇게 녹화된 영상은 유튜브채널 뉴스핌TV에서 시작한 KYD(코리아유스드림)를 통해 방송된다. 심사위원은 물론 누구나 유튜브를 통해서 참가자들의 노래를 들어볼 수 있다. 4월 12일 오후 4시 10분 첫방송 되며, 매주 금요일 오후 공개된다. [서울 = 뉴스핌] 오광수 문화전문기자 = 지난해 싱어송라이터 경연대회 시즌1의 수상자인 미지니가 축하공연을 하고 있다. 2024.03.18 oks34@newspim.com 화려한 개막에 앞서 지난해 수상자인 파일랫을 시작으로 미지니, 에이트레인(A.TRAIN)의 축하 무대가 잇따라 공개됐다. 뉴스통신사 최초로 진행된 '싱어송라이터 오디션-음악의 탄생' 시즌1에서 수많은 경쟁자를 물리치고 우승했던 실력파들이다. 작년 최우수상을 수상한 파일랫이 8일 첫 주자로 나서 축하무대를 꾸몄으며, 우수상을 받은 미지니는 15일 무대에 섰다. 대상의 영예를 안았던 에이트레인의 무대는 오는 22일 오후 5시 15분에 공개된다. 이들 무대는 유투브 방송 뉴스핌TV KYD(Korea Youth Dream)를 통해 볼 수 있다. 유튜브TV 'KYD' 채널은 뉴스핌이 대한민국 청년의 미래를 응원하기 위해 올해 출범시켰다. [서울 = 뉴스핌] 오광수 문화전문기자 = 지난해 싱어송라이터 경연대회 시즌 1의 우승자인 에이트레인이 축하공연을 갖고 있다. 2024.03.18 oks34@newspim.com 올해 가을까지 치열한 경합을 벌이게 될 '히든 스테이지'는 대상(최종 우승자)에게는 500만원, 최우수상 2팀 각 300만원, 우수상 2팀 각 100만원 등 총 1500만원의 상금이 걸려 있다. 또 TOP10에 오른 나머지 결선진출자에게도 50만원의 상금이 수여된다. 본선 진출자 전원에게 포트폴리오로 활용 가능한 라이브클립을 제작하여 선물한다. 또 음원제작 지원 등 특전도 마련돼 있다. 톱 10 결정전은 8월말이나 9월초 치러진다. oks34@newspim.com 2024-03-18 15:51
안다쇼핑
Top으로 이동