전체기사 최신뉴스 GAM 라씨로
뉴스핌 채널 추가
뉴스핌 채널 추가 안내
전국 대전·세종·충남

속보

더보기

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 : 2023년03월21일 17:21

최종수정 : 2023년03월21일 17:21

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
"초봉 4억원"...AI가 배출한 新직업 '프롬프트 엔지니어' 뭐길래 [서울=뉴스핌] 최원진 기자= 생성형 인공지능(AI) 챗봇 '챗GPT'가 출시된 지 고작 반년이 지났지만 전 세계의 삶에 미친 영향은 크다. 생성형 AI가 미래의 글로벌 정규직 일자리 3억개에 영향을 줄 수 있다는 미 투자은행 골드만삭스의 지난 3월 전망은 큰 충격을 안겼는데 기업들의 AI 대체 움직임은 벌써 시작했다. 미국 인사관리 컨설팅 업체 '챌린저 그레이 앤드 크리스마스'(CG&C)가 지난 1일(현지시간) 발표한 보고서에 따르면 지난 5월 한 달 미국서 해고된 인원은 약 8만명. 이 중 해고 사유가 AI라고 명시된 근로자 수는 전체의 약 5%인 3900명으로 집계됐다. 노트북 PC에 켜져 있는 오픈AI 챗GPT 홈페이지. [사진=블룸버그] 이는 어려워진 시장 및 경제 여건, 비용절감, 구조조정, 계약만료 등 17가지 인력감축 사유 중에 11번째로 많은 사유였다. 블룸버그는 "보고서에서 인력 감축 원인으로 AI가 등장한 건 이번이 처음"이라며 "AI로 인한 인력 감축이 이제 막 시작했다는 걸 보여준다"고 평가했다. 생성형 AI로 일부 일자리가 위협받고 있는 반면 등장한 지 2년도 채 안 됐지만 고액 연봉으로 각광받는 새로운 IT직업군이 있다. 바로 '프롬프트 엔지니어'(prompt engineer)다. ◆ 프롬프트 엔지니어는 AI모델 훈련사 생성형 AI가 배출한 직업군, 프롬프트 엔지니어를 간단히 소개하자면 내가 원하는 최적의 결과물을 얻기 위해 대화체 명령어 '프롬프트'를 작성, 설계하는 사람이다. 챗GPT를 사용해본 사람은 많지만 잘 사용할 줄 아는 사람은 드물다. AI는 학습한 데이터를 기반으로 같은 질문에도 새로운 답변을 내놓는데 항상 내가 원하는 구조의 답변을 얻기는 어렵다. 예컨데 챗GPT에 "햄버거 가게를 창업할 건데 광고 문안을 작성해줘"란 두루뭉실한 질문보다는 "이제부터 너는 카피라이터(copywriter·광고 문안 작성자)야. 너의 업무는 새로 창업한 햄버거 가게의 광고 문안을 작성하는 거야. 고객층은 회사 밀집 지역의 바쁜 직장인이고 나는 이들에게 간편하고 가성비 높은 점심식사를 판매할거야"와 같은 구체적인 상황 설명을 해야 원하는 답변을 얻을 수 있다. 이처럼 어떤 프롬프트를 입력하느냐에 따라 다른 품질의 출력값이 나오기 때문에 프롬프트 엔지니어는 중요하다. 프롬프트 엔지니어는 '최적의 질문 던지기'로 가장 효율적으로 생성형 AI와 대화하는 방법을 분석한다. 언어모델이 성능 개선을 위해 훈련하는 과정에서 프롬프트 엔지니어는 훈련사 역할을 한다. AI 모델 테스트 과정에서 최대한 구체적인 상황 설명의 프롬프트를 입력했는데도 출력값에 오류나 불만족스러운 답변은 없는지 확인하고 모범 답변 사례들을 토대로 새로운 프롬프트를 개발한다. 미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그] 누가 프롬프트 엔지니어 직군에 맞을까. 기본적으로 AI가 이해할 수 있는 구체적이고 간결한 글을 작성할 수 있는 문장력이 있어야 하고, 창의력, 문장 분석력, 문제 해결 능력 등을 갖추고 있으면 유리하다. 방대한 데이터를 다루는 직업인 만큼 빅데이터 기술을 보유하면 좋다. 자바, C++ 등 프로그래밍 언어 지식도 있어야 한다. 프롬프트 엔지니어를 상시 채용 중인 미국 AI 스타트업 앤스로픽(Anthropic)의 경우 프롬프트 엔지니어 자격 조건으로 "코딩 언어 '파이선'을 다룰 수 있어야 하고 기본적인 프로그래밍 능력을 갖춰야 한다"고 명시하고 있다. ◆ 초봉 4억원도 제시...美기업 30% "올해 안에 고용" 6일(현지시간) 벤징가에 따르면 미국에서 현재 공개 채용 중인 프롬프트 엔지니어직은 재택 근무 형태의 시간당 200달러(약 26만원) 계약직부터 30만달러가 넘는 연봉의 정규직까지 다양하다. 앤스로픽은 지난달부터 프롬프트 엔지니어 상시 채용 공고를 내고 있는데 회사가 제시한 연봉은 최소 28만~37만5000달러다. 한화로 환산하면 무려 3억6500만~4억9000만원이다. 기업들은 프롬프트 엔지니어 인재 찾기에 열을 올리고 있다. 미국의 구인구직 플랫폼 레주메닷컴이 지난 4월에 기업인 1187명을 대상으로 설문한 결과 29%가 "올해 프롬프트 엔지니어 고용을 계획 중"이라고 답했고 4명 중 1명은 "초봉은 20만달러가 넘을 것"이라고 응답했다. 기업들이 고액 연봉을 제시하는 이유는 "너무 새로운 직업이기 때문"이란 진단이 나온다. 스테이시 헐러 최고커리어 어드바이저는 프롬프트 엔지니어란 직업이 워낙 신흥 직업이라 "이에 맞춘 능력을 갖춘 인재를 찾기가 어렵기 때문에 여섯 자릿수 초봉을 제시하는 것이 가능하다"면서 기업 입장에서도 "엔지니어를 데리고 오는 편이 장기적으로 운영 비용절감에 도움이 된다고 판단하고 있다"고 설명했다.   wonjc6@newspim.com 2023-06-07 17:02
사진
[단독] 3기 신도시 도시철도 2년이상 빨라진다 [서울=뉴스핌] 강명연 기자 = 사전청약이 본격 시작된 하남교산, 고양창릉, 남양주왕숙을 비롯한 3기 신도시 지하철 건설이 1·2기 신도시에 비해 최소 2년 이상 빨라질 전망이다. 한국토지주택공사(LH)가 3기 신도시 개발 사업에서 거둬들인 광역교통개선분담금으로 주요 도시철도 사업비를 전액 가까이 충당할 수 있는 것으로 확인돼서다.  이에 따라 예비타당성 조사를 마치면 LH와 운영사업자(코레일·서울교통공사 등) 및 각 지방자치단체의 사업비를 둘러싼 협의 과정이 크게 줄어 최소 2년 이상 사업 추진이 빨라질 것이란 예상이 나온다.  7일 국토교통부 등에 따르면 한국토지주택공사(LH)가 3기 신도시 주요 철도건설 사업비 대부분을 충당하는 것으로 확인됐다. LH는 3기 신도시 개발사업과정에서 거둬들인 광역교통개선대책 분담금으로 철도건설 사업비를 대부분 조달할 계획이다. 남양주왕숙, 하남교산, 고양창릉이 여기에 해당된다. 해당 3기 신도시 지구계획 승인 당시 이런 내용이 광역교통개선대책에 담겼다. 광역교통개선대책은 지구계획 승인 전 대도시권광역교통위원회의 승인을 완료해야 한다. 정부가 3기 신도시 개발사업 전체 사업비의 20%를 광역교통개선대책 분담금으로 책정하도록 한 결과다. 총 사업비의 10% 수준에 머물렀던 2기 신도시 교통분담금에 비해 규모가 대폭 늘어나며 LH 교통분담금만으로 도시철도 건설 재원 조달이 가능해진 것이다. 2기 신도시의 경우 신도시 개발 총 사업비의 약 10%를 교통사업비로 책정해 사업 추진에 어려움을 겪은 바 있다. 이에 3기 신도시는 교통 인프라 구축에 총 사업비의 20%를 배정하도록 하면서 여유가 생겼다. 대표적인 사업이 하남교산 신도시를 위한 송파~하남 서울 3호선 연장이다. 광역교통개선대책상 1조5400억원 사업비가 3호선 연장에 투입되는데 LH는 이를 위해 약 2조원의 교통분담금을 조성한다. 나머지 5000억원은 도로와 환승시설 등 교통 개선에 활용된다. 고양창릉의 고양은평선 역시 총 사업비 1조4100억원 전액을 LH 분담금으로 활용한다. 남양주왕숙의 9호선 연장 사업은 총 사업비 2조1000억원 가운데 LH가 1조5000억원을 부담한다. 2기 신도시에는 가구당 1200만원(한강신도시)에서 2200만원(광교신도시)의 교통분담금이 분양가에 반영돼 교통분담금 부과액은 가구당 평균 2000만원 수준이다. 사업자인 LH가 거둬들인 교통분담금 총액은 25조원에 달한다. 3기 신도시는 교통난 방지를 위해 사업비의 20%를 광역교통개선대책에 사용할 예정이며 이에 따라 가구당 분담금도 4000만원 수준이 될 예정이다. 대광위 관계자는 "3기 신도시의 주요 도시철도사업비 대부분을 LH 충당금으로 조달한다"며 "3기 신도시 사업지마다 조금씩 차이는 있지만 LH의 교통분담금이 총 사업비의 20% 안팎으로 조성하도록 광역교통개선대책에 반영돼 있어 2기 신도시 대비 두 배 정도 늘었다"고 말했다. 전문가들은 3기신도시 도시철도사업의 빠른 추진이 가능할 것으로 내다보고 있다. 그 동안 신도시 지하철 사업에서 해당 지자체는 광역교통분담금을 미리 납부했음을 근거로 빠른 사업 추진을 LH에 요구했지만 사업비 문제를 두고 진흙탕 싸움이 잇따랐다. 이에 따라 일부 주민들은 LH에 대해 '광역교통분담금 먹튀' 논란까지 제기한 상태다. 하지만 LH의 이같은 입장에 따라 예비타당성조사가 성공적으로 완료되면 지하철 건설사업도 순조롭게 진행될 것이란 진단이 나온다. 실제 지구 지정부터 광역교통개선대책 확정까지 2기 신도시는 성남판교 25개월, 김포한강 28개월 등 평균 27개월이 소요된 데 비해 3기 신도시는 하남교산 7개월, 남양주왕숙 15개월 등 평균 11개월이 걸려 1년 반 이상 기간을 단축하는 효과가 있었다. 사업비 협의는 신도시 도시철도 사업을 늦추는 가장 큰 원인으로 꼽힌다. 대표적인 사례가 과천선(서울지하철4호선) 과천지식정보타운역이다. 과천지정타역은 2015년 광역교통개선사업으로 신설이 확정됐다. 하지만 사업자인 LH와 운영자인 한국철도공사가 비용문제를 놓고 대립을 보이면서 입주가 시작된 지금까지 착공조차 하지 못한 실정이다. 물론 지정타역은 기존 과천선에 역사만 설치하면 되는 만큼 시간이 많이 걸리는 사업은 아니다. 하지만 두기관의 대립으로 사업이 지연되면서 지난해 기준 582억원의 사업비 증액이 발생했으며 과천시의 분담금도 203억원 더 늘어난 상태다. 이에 따라 사업비를 LH가 광역교통개선분담금 만으로 자체 조달하면 신도시 도시철도사업은 쓸데없는 시간 낭비 없이 추진이 가능할 것이란 진단이 나온다.  다만 광역교통개선대책을 통해 LH 교통분담금만으로 자금을 조달하기로 한 사업에 대해서도 공공기관 예비타당성조사(공타)를 통과해야 하는 관문이 있어 사업 속도가 늦어질 가능성은 여전히 남아 있다.  unsaid@newspim.com 2023-06-07 14:00
안다쇼핑
Top으로 이동