전체기사 최신뉴스 GAM
KYD 디데이
산업 중기·벤처

속보

더보기

한컴, 문서에서 AI 데이터 추출하는 '한컴 데이터 로더' 글로벌 출시

기사입력 : 2024년04월18일 11:06

최종수정 : 2024년04월18일 11:06

[서울=뉴스핌] 송은정 기자 =한글과컴퓨터가 PDF 문서에서 인공지능(AI) 데이터를 추출하는 SDK(소프트웨어 개발 키트) '한컴 데이터 로더(Loader)'를 출시하고 본격적인 글로벌 기업 간 거래(B2B) 세일즈에 나선다.

[사진=한글과컴퓨터]

최근 세계 AI 업계에서는 LLM(대규모 언어모델)의 단점인 '환각(할루시네이션) 현상'을 최소화하는 해결책으로 '검색 증강 생성(Retrieval-Augmented Generation·RAG)' 기술이 떠오르고 있다. RAG는 특정 데이터베이스나 문서 집합으로부터 관련 정보를 검색(Retrieval)한 뒤 그 정보를 LLM에 적용해 적절한 답변으로 텍스트를 생성(Generation)하므로 실시간으로 정보가 업데이트되며 정보의 정확도가 높은 것이 특징이다. 이때문에 많은 글로벌 기업과 기관이 RAG의 도입을 원하지만 구조화되지 않은 문서에서는 데이터 추출이 어려운 실정이다. 따라서 기업들의 방대한 문서를 AI가 학습하기 좋은 형태로 데이터화하는 전처리 기술이 매우 중요해졌다.

한컴은 지난 35년간 축적한 문서 기술을 바탕으로 문서의 AI 데이터화를 위한 전처리 기술을 모듈화해 '한컴 데이터 로더'라는 SDK 제품을 내놓았다. 세계적으로 가장 대표적인 전자문서 형식인 PDF에서 텍스트를 추출, AI가 학습하기 쉬운 여러 포맷(JSON·CSV·TXT·XML 등)으로 변환해 주는 도구다. PDF뿐만 아니라 오피스 문서에서도 텍스트 외 다양한 객체를 AI 학습용 데이터로 추출해 제공한다.

한컴 데이터 로더는 국내 대기업을 대상으로 테스트를 이미 마쳤다. 5월부터 국내를 비롯해 최근 투자한 스페인 AI 보안 설루션 기업 '페이스피'의 네트워크와 글로벌 고객사를 연계해 유럽 시장을 우선 공략한다.

한컴은 최근 해외 고객을 대상으로 한컴 데이터 로더뿐만 아니라 한컴의 AI 기술과 SDK 기술을 소개하는 해외향 다국어(영어·독일어·스페인어·일어) 사이트도 열고 본격적인 글로벌 출시를 알렸다.

한컴은 AI 사업을 크게 두 축으로 나누어 추진한다는 전략이다. 한컴독스 AI, 한컴 어시스턴트, 한컴 도큐먼트 QA와 같이 AI를 활용한 서비스 분야와 한컴 데이터 로더나 한컴 OCR 등 AI에 필요한 데이터 추출 분야가 그것이다. 한컴은 올해 데이터 시각화 기술을 보유한 한컴이노스트림(구 클립소프트)을 인수하고 생체 데이터를 추출하고 분석하는 페이스피에 전략적으로 투자하는 등 AI 관련 데이터 사업을 발 빠르게 확장하고 있다.

김연수 한컴 대표는 "한컴은 올해를 글로벌 빅테크 기업으로 나아가는 원년으로 삼고, 인수·투자·협력을 여러 방면으로 진행하며 AI 사업을 본격화하고 있다"라고 말했다. 이어 "한컴 데이터 로더로 글로벌 AI 시장에 빠르게 침투하여 AI 기업으로서 의미 있는 성과를 분명하게 만들어 나가겠다"라고 강조했다.

yuniya@newspim.com

[뉴스핌 베스트 기사]

사진
[단독] 李정부 국정 5개년 책자 나왔다 [서울=뉴스핌] 윤채영 지혜진 기자 = 이재명 정부의 국정운영 5개년 계획이 담긴 책자가 발간된 것으로 20일 확인됐다. 이날 뉴스핌이 확보한 '이재명 정부 국정운영 5개년 계획(안)' 책자에는 123대 국정과제에 대한 주요 내용과 구체적인 입법 방향 등이 담겼다. [서울=뉴스핌] 이재명 대통령이 13일 서울 종로구 청와대 영빈관에서 열린 국정기획위원회 국민보고대회에서 발언하고 있다. [사진=대통령실] 2025.08.13 photo@newspim.com 국정기획위원회가 지난 13일 1호 과제로 발표한 개헌에는 대통령 권력 구조 개편도 포함됐다. ▲4년 연임제 및 결선투표제 도입 ▲감사원 국회소속 이관 ▲대통령 거부권 제한 ▲비상명령 및 계엄 선포 시 국회 통제권 강화 ▲국무총리 국회 추천제 도입 ▲중립성 요구 기관장 임명 시 국회 동의 의무화를 추진하겠다고 명시했다. 또 5·18 광주 민주화운동 정신 등 헌법 전문 수록과 검찰 영장 청구권 독점 폐지, 안전권 등 기본권 강화 및 확대, 지방자치와 균형발전을 위한 논의기구 신설, 행정수도 명문화 등이 개헌 과제로 포함됐다. 개헌을 위한 국민투표법 개정도 추진된다. 헌법불합치 결정을 받은 재외국민 투표 관련 규정을 개정해 국민투표법 위헌을 해소하겠다는 계획이다. 개헌 찬반 투표는 2026년 지방선거나 2028년 국회의원 선거 때 실시하겠다고 명시했다. [서울=뉴스핌] 뉴스핌이 확보한 이재명 정부 국정운영 5개년 계획(안) 책자. 2025.8.20 ycy1486@newspim.com 이번 책자에는 국정기획위가 지난 13일 대국민보고대회에서 공개한 123대 국정과제보다 훨씬 세부적인 내용이 담겼다. 당초 국정위는 이날 국정운영 5개년 계획도 공개하려 했다가, 돌연 비공개 결정을 내렸다. 비공개 결정에는 이재명 대통령의 의중이 강하게 작용한 것으로 알려졌다. 국정위 소속으로 활동했던 한 위원은 뉴스핌과 통화에서 "갑자기 보안을 강조하면서 내부 자료는 절대 공개하지 말라고 했다"며 "이유는 모른다"고 전했다.  ycy1486@newspim.com 2025-08-20 15:55
사진
美, 인텔 이어 삼성도 지분 내놔라? [서울=뉴스핌] 최원진 기자= 도널드 트럼프 미국 행정부가 반도체법(CHIPS Act)상 보조금을 활용해 인텔 지분 확보를 추진 중인 가운데, 삼성전자와 대만 TSMC 등 다른 반도체 기업에도 같은 방식을 적용하는 방안을 검토 중이라고 로이터 통신이 두 명의 소식통을 인용해 19일(현지시간) 보도했다. 보도에 따르면 하워드 러트닉 상무부 장관은 삼성전자, 마이크론, TSMC 등 미국 내 공장 건설과 투자를 진행 중인 반도체 기업들을 상대로, 조 바이든 전임 행정부 시절 약속된 정부 보조금 제공과 맞바꿔 지분을 확보하는 방안을 모색하고 있다. 현실화하면 글로벌 반도체 업계에 파장이 불가피하다. 미국 정부에 지분을 넘기고 싶지 않다면 보조금을 포기해야 할 수 있는데 이 경우 기업들의 순익 전망과 투자 계획도 차질을 빚을 수 있다. 미국의 산업정책이 정권에 따라 오락가락한다는 업계의 불만과 비난 또한 커질 수 있지만 트럼프 행정부의 성격상 귀담아 들을 가능성은 높지 않다. 러트닉 장관은 CNBC 인터뷰에서 "트럼프 대통령은 미국이 거래에서 실질적 이익을 얻어야 한다고 본다"며 "왜 1천억 달러 규모의 기업에 돈을 줘야 하는가. 우리는 약속한 보조금을 지급하되, 그 대가로 지분을 받아 미국 납세자들에게 혜택을 돌릴 것"이라고 말했다. 트럼프 행정부가 인텔 지분 10%를 확보할 경우 최대 주주가 될 수 있지만, 러트닉 장관은 "경영권에 개입하지는 않을 것"이라고 선을 그었다. 그럼에도 불구하고 이러한 조치는 전례가 없는 것이며, "이는 대기업에 대한 미국의 영향력 확대라는 새로운 시대를 열게 될 것"이란 진단이다.  로이터는 "마이크론은 인텔에 이어 반도체법 보조금을 가장 많이 받는 미국 기업이며, 삼성전자와 TSMC 역시 주요 수혜 대상"이라며 "이번 검토는 미국 정부가 반도체 산업에 대한 직접적 영향력을 확대하려는 움직임"이라고 분석했다. 올해 6월에도 비슷한 조치가 있었는데, 트럼프 정부는 일본제철의 U.S.스틸 인수 승인 조건으로 '황금주(golden share)'를 확보해 주요 경영 결정에 거부권을 행사할 수 있게 됐다. 삼성전자 미국 텍사스주 테일러 공장 건설 현장. [사진=삼성전자] wonjc6@newspim.com   2025-08-20 08:31
안다쇼핑
Top으로 이동