소형언어모델 효율·품질 동시 향상…산업 데이터 학습 방식 제안
통신·금융 등 산업 현장 적용성 입증, 초거대 AI 의존도 낮춘 성과
'도메인 특화 학습' 기법으로 산업형 AI 경쟁력 강화
[서울=뉴스핌] 양태훈 기자 = LG유플러스는 자체 생성형 AI 기술 '익시젠(ixi-GEN)' 관련 논문이 세계 3대 자연어처리 학회 중 하나인 'EMNLP 2025'에 채택됐다고 24일 밝혔다.
EMNLP(Empirical Methods in Natural Language Processing)는 국제언어학회(Association for Computational Linguistics, ACL) 산하에서 주관하는 세계 최고 권위의 AI 학회로, 글로벌 빅테크 기업과 주요 연구기관의 연구 성과를 엄격히 심사해 발표 논문을 선정한다.
LG유플러스가 제출한 논문 제목은 'ixi-GEN: Efficient Industrial sLLMs through Domain Adaptive Continual Pretraining(도메인 특화 학습을 통한 산업 특화 소형언어모델 고도화)'로, 산업 현장에서 활용 가능한 소형언어모델(sLLM)의 효율성과 품질을 동시에 높이는 새로운 접근법을 제시했다.
![]() |
사진은 이번 논문 집필에 참여한 LG유플러스 구성원들. [사진=LG유플러스] |
이 논문은 산업 데이터를 지속적으로 학습하면서도 범용 언어 능력을 유지할 수 있는 '도메인 특화 학습(Domain Adaptive Continual Pretraining, DACP)' 기법을 도입한 점에서 높은 평가를 받았다. 기존 sLLM은 특정 산업에 특화하면 일반 언어 이해력이 떨어지고, 반대로 범용 성능을 유지하면 산업 적합도가 낮아지는 한계가 있었지만, DACP는 산업 데이터와 일반 데이터를 균형 있게 학습해 이러한 문제를 해결했다.
실제 통신·금융 분야에 적용한 결과 기존 모델 대비 성능이 크게 개선됐으며, 초거대 AI가 아니더라도 소형 모델로 산업 현장에서 바로 활용할 수 있는 수준의 품질을 확보한 것으로 나타났다.
LG유플러스는 이번 논문 채택이 산업형 AI 연구가 학문적으로도 공인받은 성과라는 점에서 의미가 크다고 설명했다. DACP 기반 sLLM은 초거대 모델을 직접 운영하기 어려운 기업들도 낮은 비용과 인프라 부담으로 산업 맞춤형 AI 서비스를 구현할 수 있게 해줄 것으로 기대된다. 특히 통신, 금융, 교육, 제조 등 데이터가 방대하고 보안이 중요한 산업 분야에서의 적용 가능성이 크다는 평가다.
LG유플러스는 올해 자체 개발한 sLLM '익시젠'을 사내 AI 플랫폼과 산업·교육계 협업 프로젝트에 적용하는 등 고도화를 이어가고 있다. 지난 3월에는 MWC25 기간 중 열린 '레드팀 챌린지(Red Team Challenge)' 에 참여해 익시젠의 보안성과 신뢰성을 검증받기도 했다.
한영섭 LG유플러스 AI테크Lab장(담당)은 "EMNLP는 전 세계 AI 연구자들이 가장 주목하는 학회 중 하나"라며 "이번 논문 채택은 LG유플러스의 산업형 AI 기술이 세계적으로 학문적 검증을 받았다는 점에서 큰 의미가 있다"고 말했다.
dconnect@newspim.com