전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

감정까지 학습하는 KT의 마이AI보이스...지금 내 감정은 뭐게?

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

사용자의 톤과 말투 학습해 합성하는 마이AI보이스
한국어로 녹음해도 5개 국어로 변환 가능

[서울=뉴스핌] 조수빈 기자 = 금요일 퇴근을 앞두고 힘이 빠진 목소리를 인공지능(AI)에 학습시켰더니 실제로 평소보다 차분한 기자의 목소리가 컴퓨터에서 흘러나왔다.

직접 녹음을 하고 음성을 확인하며 비슷한 분위기의 목소리를 학습시킨다. KT의 AI보이스 스튜디오 화면 갈무리. [서울=뉴스핌] 조수빈 기자 2023.06.09 beans@newspim.com

KT의 인공지능(AI)보이스의 차별점인 '감정 더빙'이다. 톤과 목소리 크기 등을 통해 사용자의 감정을 분석해 목소리를 합성해낸다. AI보이스 제작은 간단하다. 원하는 스크립트를 선택하고 주어진 30개의 문장을 읽고 난 후 친절함, 다정함, 귀여움 등 분위기를 선택하면 AI가 녹음된 감정에 맞는 목소리를 합성해 출력하는 방식이다.

30여개의 문장을 다 읽는데 걸린 시간은 10여분. 보이스를 올려놓고 하루가 지나니 'AI 조수빈'이 읽는 스크립트를 체험할 수 있었다. 감정 구현뿐 아니라 외국어 지원도 된다. 한국어만 녹음해도 영어, 중국어, 일본어, 스페인어로 말하는 내 목소리를 들을 수 있다. 직접 써보니 전혀 할 줄 모르는 스페인어는 제법 수준급으로 들린다.

30문장은 최소 단위로, 더 많은 문장을 녹음할수록 더 자연스러운 문장 합성이 가능해진다. 한층 더 정확한 평가를 위해 밀리의 서재에 공개된 '돈과 나의 일' 오디오북을 통해 김대훈 MBC 아나운서의 AI보이스를 들어봤다. AI보이스는 평소 아나운서가 구사하는 톤, 발음, 음역대와 매우 유사해 이질감이 없었다. 

최근 공개된 밀리의 서재의 아나운서 AI보이스 오디오북에도 KT의 기술이 들어갔다. 김대호 MBC 아나운서의 묵직하고 진중한 음성으로 '돈과 나의 일'을 들으니 신뢰도가 더 높아지는 기분이 들었다.

실제로 KT는 정보, 에세이, 자기계발 면에서 아나운서의 목소리에 대한 선호도가 높다고 설명했다. KT의 AI보이스는 이렇게 사용자들이 친숙한 일명 셀럽들의 보이스를 활용해 인공지능에 대한 사용자의 거부감을 낮추고 있다.

AI보이스는 현재 오디오북, 도슨트, 유튜브 시장을 중심으로 진출 중이다. 가장 큰 이유는 '효율성'이다. 시간과 비용 측면 모두 AI보이스가 월등하다.

오디오북 하나 당 재생시간은 보통 4시간을 초과한다. 성우가 이 완독본을 직접 녹음하기 위해서는 최소 일주일의 시간이 걸린다. 성우는 30문장 정도의 녹음으로 자신의 AI보이스를 제작할 수 있고, 이후 작업은 텍스트를 입력하여 AI 음성 합성으로 작업한다.

또한 사람이 직접 녹음하게 되면 실수, 오류 등으로 피로도가 누적돼 동일한 질의 작업에 한계가 생긴다는 점도 극복한다. 일주일에는 4권 정도의 책을 제작할 수 있을 정도로 시간과 비용이 단축됐다. 성우나 제작 페이지에 따라 차이는 있겠지만 3분의 1에서 5분의 1 정도로 시간과 비용이 단축되는 추세다.

녹음을 끝내고 나면 언어와 성별, 분위기를 지정해 학습을 고도화한다. KT의 AI보이스 스튜디오 화면 갈무리. [서울=뉴스핌] 조수빈 기자 2023.06.09 beans@newspim.com

◆유튜버도 주목하는 시장...더빙까지 넘본다

AI보이스의 활용 가능성은 무궁무진하다. 지금까지는 해외에 파견된 장병의 가족을 위해 장병들의 AI 목소리로 자녀들에게 동화책을 읽어주는 서비스, 2022 카타르 월드컵 공식 응원가 '더 뜨겁게, 한국'의 고(故) 유상철 감독 목소리 복원 등이 눈길을 끌었다.

권진조 KT AI보이스 기획 운영 PM은 "최근에는 해외 진출을 준비하는 유튜버의 문의가 늘었다. 내 목소리로 직접 다국어 서비스를 제공한다는 측면에서 경쟁력이 있다고 보는 듯 하다"고 설명했다. 방송인이자 유튜버인 파비앙 역시 KT '마이AI보이스'를 사용해 보는 콘텐츠 영상을 올리기도 했다.

자막보다 더빙이 활성화된 해외 콘텐츠 시장도 노려볼 만하다. 노진우 KT AI플랫폼사업 팀장은 "기존에는 배우와 비슷한 톤과 목소리의 성우를 섭외해야 한다는 어려움이 있었지만 AI보이스를 활용하면 배우의 목소리를 학습한 AI가 더빙을 대신할 수 있다"고 설명헀다.

한편 목소리라는 고유한 데이터를 사용하기 때문에 악용될 수 있다는 우려도 있다. KT는 타인의 음성을 마음대로 가져다 쓸 수 있다는 부작용을 막기 위해서 주어진 스크립트를 '실시간'으로 읽는 방식을 선택했다. 용도별로 다양화된 스크립트를 고객이 실시간으로 읽어야 하며, 타인의 녹음 파일을 확보해서 학습시킬 순 없다. 이용약관, 운영정책에도 사용자 본인의 목소리만 사용할 것을 명시했다.

노 팀장은 "AI가 더 이상 인간을 따라하는 불쾌하거나 딱딱한 서비스가 아니라 다양한 곳에서 활용될 수 있는 가능성이라고 본다"며 "시장이 성장하면서 KT의 보이스스튜디오가 대한민국을 대표하는 오디오 콘텐츠 플랫폼으로 자리잡을 수 있게 하겠다"고 말했다.

beans@newspim.com

[뉴스핌 베스트 기사]

사진
삼성전자, 車 메모리 첫 '세계 1위' [서울=뉴스핌] 이나영 기자= 삼성전자가 세계 차량용 메모리 반도체 시장에서 미국 마이크론을 제치고 사상 처음으로 세계 1위에 올랐다. 31일 시장 조사업체 스탠더드앤드푸어스(S&P) 글로벌 모빌리티에 따르면 삼성전자의 지난해 차량용 메모리 시장 점유율은 40%로 전년(35%) 대비 5%포인트(P) 올라 1위를 차지했다. 기존 1위였던 마이크론은 같은 기간 점유율이 40%에서 36%로 하락하며 2위로 밀려났다. 서울 서초구 삼성전자 사옥 전경 [사진=뉴스핌DB] 차량용 메모리 시장은 자동차의 전장화와 소프트웨어 중심 차량(SDV) 확산에 힘입어 빠르게 성장하고 있다. 자율주행 기능과 고사양 인포테인먼트 시스템 탑재가 늘면서 대용량 데이터 처리와 높은 안정성을 갖춘 메모리 반도체 수요도 증가하는 추세다. 삼성전자는 지난 2015년 저전력 D램(LPDDR)과 유니버설 플래시스토리지(UFS)를 앞세워 차량용 반도체 시장에 본격 진출했다. 이후 차량용 SSD와 그래픽 D램(GDDR) 등으로 제품군을 확대하며 사업 영역을 넓혀왔다. 제품 포트폴리오 확장을 바탕으로 삼성전자는 2020년부터 지난해까지 차량용 메모리 사업에서 연평균 40% 이상의 매출 성장률을 기록한 것으로 알려졌다. 한편 S&P 글로벌 모빌리티는 글로벌 차량용 반도체 시장 규모가 2025년 약 900억달러(약 136조원)에서 2031년 1390억달러(약 209조원)로 성장할 것으로 전망했다. nylee54@newspim.com 2026-05-31 12:46
사진
외환 거래 '24시간'으로 확대 [서울=뉴스핌] 박가연 기자 = 오는 7월 6일부터 서울 외환시장의 외환 거래시간이 평일 24시간 무중단 방식으로 연장된다. 이에 따라 주말과 새해 첫날을 제외하면 국내 공휴일에도 거래가 가능해진다. 서울외환시장운영협의회(외시협)는 29일 총회를 개최하고 이 같은 내용의 '서울 외환시장 행동규범' 개정안을 의결했다. 이번 개정으로 중개회사를 통한 원·달러 외환거래 시간은 기존 '오전 9시~익일 오전 2시'에서 주중 내내 24시간 문을 여는 방식으로 바뀐다. 뉴욕 서머타임(DST) 기간에는 월요일 오전 6시부터 토요일 오전 6시까지, 그 외 기간에는 월요일 오전 7시부터 토요일 오전 7시까지 시장이 상시 가동된다. 다만 원화와 이종통화 간 거래시간은 현행대로 오전 9시부터 오후 3시 30분까지 유지된다. 한국은행 현판. [사진=뉴스핌DB] 외환시장 개방 확대로 시차가 다른 외국인 투자자는 물론, 미국 주식 등에 투자하는 국내 투자자와 수출입 기업들의 환전 편의가 높아지고 거래 비용도 줄어들 것으로 전망된다. 매년 첫 영업일은 오전 9시에 개장하며 마지막 영업일은 24시에 폐장한다. 공휴일이나 야간 거래는 허용되지만 실제 거래 대금이 오가는 결제 업무는 기존처럼 은행 영업일에 처리된다. 글로벌 시장 관행에 따라 은행 비영업일에는 자금 이체가 불가능해 가장 가까운 다음 은행 영업일로 결제가 순연된다. 24시간 개장에 맞춰 환율 공시 체계도 일부 조정된다. 현물환중개회사는 오전 6시부터 익일 오전 6시까지 매시 정각마다 시간가중평균환율(TWAP)을 산출해 시장에 제공할 예정이다. ▲시가 ▲고가 ▲저가 ▲환율 역시 같은 기준에 따라 공표된다. 다만 시장의 혼선을 최소화하기 위해 기업 재무제표나 세무 기준 등에 활용되는 '서울 오후 3시 30분 종가 환율'과 매매기준율(MAR)은 당분간 현행 기준을 따르기로 했다. 외환당국도 공식 통계와 보도자료 작성 시 기존 종가 환율을 계속 활용할 방침이다. 외시협은 향후 매매기준율 산정 방식도 글로벌 관행에 맞춰 거래량 가중평균 방식(MAR)에서 시간가중평균환율(TWAP) 방식으로 변경하는 방안을 논의했다. 시장 참가자들의 적응 기간을 고려해 외국환거래규정 개정 이후 1년의 유예기간을 두는 방안도 검토됐다. 외환당국은 이번 총회에서 수렴된 시장 참가자 의견을 바탕으로 오는 6월 중 매매기준율 변경 등을 포함한 외국환거래규정 개정을 추진할 계획이다. eoyn2@newspim.com 2026-05-31 12:00
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동