"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 : 2023년03월21일 17:21

최종수정 : 2023년03월21일 17:21

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다.

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[관련기사]

[관련키워드]

챗GPT AI 데이터 과기부 품질 신뢰성

GAM - 해외주식 투자 도우미

앤스로픽 날개 단 아마존 ② AI 투자 피로감 속 주가 재평가 분수령

앤스로픽 날개 단 아마존 ① IPO 효과와 1000억달러 초대형 연합

[홍콩 대장주] 메이퇀 ③ 신성장 동력의 '폭발적 성장'

[홍콩 대장주] 메이퇀② 실적은 고속 상승, 밸류는 역대 저점

[뉴스핌 베스트 기사]

사진

29일부터 SK하닉 본주·ADR 전환 허용 [서울=뉴스핌] 이정아 기자 = 오는 29일부터 SK하이닉스 미국주식예탁증서(ADR)와 SK하이닉스 국내 보통주(본주) 간 상호 전환이 허용된다. 그동안 차익거래가 막혀 유지됐던 국내 본주와 ADR 간 가격 차가 조정받을 수 있는 여건이 마련되는 것이다. 다만 시장에서는 전환이 시작되더라도 실제 차익거래는 제한적일 가능성이 크다는 분석이 나온다. ADR 발행 한도가 대부분 소진된 것으로 알려진 데다, 기존 ADR 투자자가 먼저 원주로 전환해야 새로운 ADR 발행이 가능하기 때문이다. 27일 금융투자업계에 따르면, 오는 29일 SK하이닉스 ADR 기초주식 1779만주가 국내 증시에 추가 상장된다. 이후 국내 SK하이닉스 원주를 ADR로, ADR을 다시 원주로 바꾸는 상호 전환이 허용된다. SK하이닉스.[이미지=로이터 뉴스핌] 2026.07.09 mj72284@newspim.com ADR은 미국 투자자가 달러로 국내 기업 주식을 거래할 수 있도록 만든 예탁증서다. 그동안은 국내 주식을 ADR로 바꾸거나 ADR을 본주로 교환할 수 없었기 때문에 두 시장의 가격이 크게 벌어져도 이를 이용한 차익거래는 불가능했다. 하지만 앞으로는 국내 시장에서 본주를 매입해 ADR로 전환한 뒤 미국 시장에서 매도하는 거래가 가능해지면서 양 시장 간 가격 차를 활용한 차익거래도 가능해진다. 반대로 ADR 가격이 낮아질 경우 ADR을 본주로 교환하는 거래도 가능하다. 본주와 ADR 간 전환이 원활하게 이뤄질 경우 국내에서는 원주 매수세가 유입되고, 미국에서는 ADR 공급이 늘어나면서 양 시장의 가격 차가 점진적으로 좁혀질 수 있다는 분석이 나온다. 그간 국내 본주와 미국 ADR의 주가 흐름은 계속 엇갈렸다. SK하이닉스 ADR이 미국 나스닥에 상장한 지난 10일부터 27일까지 SK하이닉스 본주는 218만원에서 181만6000원으로 16.69% 하락했다. 반면 ADR은 168.01달러에서 154.57달러로 8.0% 하락하는 데 그쳤다. 이 기간 국내 증시 변동성이 심화하면서 이른바 '삼전닉스' 레버리지 ETF에서 탈출해 서학개미로 전환한 개미 투자자들의 SK하이닉스 ADR 구매세도 상당하다. 한국예탁결제원에 따르면, SK하이닉스 ADR이 미국 나스닥에 상장한 지난 10일부터 27일까지 국내 투자자는 6억7555만달러(약 9900억원)를 순매수했다. 미국 주식 가운데 순매수 1위를 기록한 것이다. 서학개미의 행동에 제임스 매킨토시 월스트리트저널 선임 시장 칼럼니스트는 "2주 전 SK하이닉스 ADR이 상장된 이후 프리미엄은 16~51%까지 치솟았다"라며 "미국 투자자들은 한국 기업의 주식을 직접 거래해줄 증권사를 찾는 수고를 덜기 위해 엄청나게 높은 가격을 지불하고 있다"고 경고했다. 그는 "일반적인 ADR이라면 금요일에 나타난 29% 수준의 프리미엄은 헤지펀드들이 한국에서 주식을 사서 ADR로 바꾸는 동시에 미국에서 ADR을 공매도하게 만드는 요인"이라며 "하지만 본주를 ADR로 전환하는 것이 원천적으로 불가능하기 때문에 프리미엄이 더 커질 경우 투자자들은 큰 손실을 입을 수 있다"고 경고한 것이다. 시장에서도 본주와 ADR 간 실제 전환이 얼마나 이뤄질지를 관건으로 꼽고 있다. 핵심 변수는 ADR 발행 한도다. 본주를 ADR로 전환하려면 새로운 ADR을 발행해야 한다. 그러나 ADR은 정해진 발행 한도 내에서만 추가 발행이 가능하다. 현재는 상당수 한도가 이미 사용된 상태다. 또 기존 ADR 투자자가 본주 전환을 선택할 유인이 크지 않다는 점도 고려해야 한다. 현재 미국 시장에서는 ADR이 국내 본주보다 높은 가격에 거래되고 있기 때문에, 굳이 저평가된 원주로 교환할 이유가 많지 않다. 경기 이천시 SK하이닉스 본사의 모습 [사진 = 뉴스핌DB] 다만 일각에서는 시장 상황에 따라 시나리오는 달라질 수 있다고 보고 있다. 기존 ADR 투자자의 원주 전환이 예상보다 늘어나 발행 여력이 확보될 경우 국내 본주를 ADR로 전환하는 거래도 활발해질 수 있다. 이 경우 국내 본주 수요 증가와 함께 국내외 가격 차가 빠르게 축소될 가능성이 있다. 이정빈 신한투자증권 연구원은 "29일부터 본주와 ADR 간 상호전환 신청 절차가 시작되지만 실제 가격 괴리 조정 강도는 ADR 신규 발행 규모와 시장 수급에 따라 결정될 것"이라며 "전환 절차와 행정적 마찰이 존재하는 만큼 프리미엄이 즉시 축소되기는 쉽지 않다"고 분석했다. 그러면서 "ADR 프리미엄은 장기적으로 0으로 수렴하기보다 일정 수준 유지되는 특성이 있지만, 과도하게 확대된 구간에서는 축소될 가능성이 높다"며 "프리미엄이 조정되는 과정에서는 ADR 가격 하락보다 국내 본주 상승이 상당 부분을 차지할 가능성이 높다"고 전망했다. 정민희 아리스 연구원도 "ADR의 단기 강세는 상장 초기 공급이 제한된 상황에서 프리미엄이 반영된 결과일 수 있다"며 "장기적으로는 차익거래를 통해 ADR과 원주 가격이 점차 수렴하는 특징을 보일 것"이라고 내다봤다. 이어 "결국 주가 방향을 결정하는 것은 ADR 자체가 아니라 기업의 실적과 성장 모멘텀"이라며 "ADR 프리미엄보다 실적과 인공지능(AI) 메모리 시장 성장성이 중장기 주가를 좌우할 것"이라고 진단했다. plum@newspim.com 2026-07-28 06:00

사진

전국 곳곳 폭염…중부지방 소나기 [서울=뉴스핌] 송은정 기자 = 화요일인 28일은 전국 곳곳에서 폭염이 이어지고 중부지방을 중심으로 곳에 따라 소나기가 내릴 전망이다. 기상청과 케이웨더에 따르면 이날 중부지방과 경북권은 구름이 많고, 그 밖의 남부지방과 제주도는 대체로 맑은 날씨를 보이겠다. 늦은 새벽부터 오후 사이 중부지방과 경북권에는 곳에 따라 소나기가 내리겠다. 화요일인 28일은 전국적인 무더위가 계속되겠다. 중부지방 중심으로 곳에 따라 소나기가 내려 돌풍과 천둥·번개에 유의해야겠다.[사진 = 뉴스핌DB] 예상 강수량은 서울·인천·경기 5~40㎜, 강원 내륙·산지 5~40㎜, 강원 동해안 5~20㎜다. 대전·세종·충남 내륙과 충북, 대구·경북은 5~40㎜다. 울릉도·독도에는 5~20㎜가 예상된다. 아침 최저 기온은 22∼26도로 예상된다. ▲서울 26도 ▲인천 25도 ▲수원 25도 ▲춘천 25도 ▲강릉 26도 ▲청주 26도 ▲대전 25도 ▲전주 26도 ▲광주 26도 ▲대구 25도 ▲부산 26도 ▲울산 25도 ▲제주 27도다. 낮 최고 기온은 31∼36도로 예보됐다. ▲서울 33도 ▲인천 32도 ▲수원 32도 ▲춘천 31도 ▲강릉 33도 ▲청주 33도 ▲대전 34도 ▲전주 34도 ▲광주 34도 ▲대구 35도 ▲부산 33도 ▲울산 36도 ▲제주 32도다. 바다의 물결은 동해·서해·남해 앞바다에서 0.5∼1.0m로 일겠다. 에어코리아에 따르면 이날 미세먼지의 농도는 전국이 '좋음'∼'보통'으로 예상된다. yuniya@newspim.com 2026-07-28 06:30