전체기사 최신뉴스 GAM
KYD 디데이
증권·금융 증권

속보

더보기

크라우드웍스, 'AI 데이터 전처리 기술' 국내 특허 출원

기사입력 : 2025년04월22일 15:35

최종수정 : 2025년04월22일 15:35

'알피 날리지 컴파일러' 핵심 기술 국내 최초 특허 출원
문서 복잡도 정량 분석으로 자동화 효율↑

[서울=뉴스핌] 이나영 기자= 인공지능(AI) 테크기업 크라우드웍스가 자체 개발한 AI 데이터 전처리 솔루션 '알피 날리지 컴파일러(Alpy Knowledge Compiler)'의 주요 기술에 대한 국내 특허를 출원했다고 22일 밝혔다.

특허 내용은 문서의 복잡도 분석을 기반으로 전처리 자동화 효율을 높이는 것으로 이 같은 기술이 특허로 출원된 것은 국내 업계 첫 사례라고 회사측은 덧붙였다. 해당 기술은 RAG(검색증강생성) 기반 AI 에이전트 개발에 필수적인 비정형 데이터 전처리를 지원한다. 문서 구조의 복잡도를 정량 분석해 자동화 범위를 설정하고, 전문가 투입 여부를 결정할 수도 있다.

이 기술은 복잡한 문서에서 인식률이 떨어지고 데이터 전처리 품질이 하락하는 문제를 해결하기 위해 개발됐다. 실제 전처리 대상 문서가 수십만 페이지에 달하는 사례도 적지 않다. 이 경우, 자동화 범위와 전문가 투입 여부를 사전에 판단해 품질을 확보하고 리소스를 효율화하는 것이 비용 최적화를 위한 필수 전략이다.

알피 날리지 컴파일러 스크린샷. [사진=크라우드웍스]

크라우드웍스의 출원 기술은 문서의 복잡도를 Class1부터 4까지 네 단계로 분류한다. 구조가 단순한 문서는 자동화 처리하고, 복잡한 문서는 전문가 파싱(Parsing)을 병행해 전체 전처리 품질을 높이는 방식이다. 이를 통해 데이터 전처리 자동화 시 오류 발생 가능성을 예측하고 투입 인력과 예산, 일정 등을 효율적으로 관리할 수 있다. 파싱은 문장이나 데이터의 구조를 분석해 의미 단위로 나누는 작업을 말한다.

해당 기술은 크라우드웍스가 자체 개발한 AI 데이터 전처리 솔루션 '알피 날리지 컴파일러'에 적용되고 있다. '알피 날리지 컴파일러'는 다양한 문서를 AI가 이해할 수 있는 형태의 데이터로 변환한다. Word, PPTX, PDF, Excel 외에도 한국 기업에서 주로 사용하는 HWP, HWPX 문서 변환도 지원하며 복잡한 테이블 내 테이블, 차트 등 다양한 문서 요소까지 정확히 인식한다.

또한, 테이블, 차트, 이미지 등의 시각 요소에 대해서도 초대형언어모델(LLM)을 활용해 AI가 이해할 수 있도록 메타데이터를 생성해 비정형 데이터의 효과적인 전처리를 지원하며, 비전언어모델(VLM)을 이용해 문서를 처리하는 기능도 준비하고 있다.

최근 AI 기술 도입 확산으로 기업 내 비정형 데이터 활용과 자산화의 중요성이 높아지면서, AI 기반 문서 자동화 도구에 대한 수요도 크게 증가하고 있다. 크라우드웍스는 '알피 날리지 컴파일러'를 활용해 국내외 다양한 산업군의 데이터 전처리 수요에 적극 대응하고, 기업용 AI 시장에서 선도적 입지를 강화할 계획이다.

김우승 크라우드웍스 대표는 "문서 복잡도 분석을 통해 AI 데이터 전처리의 효율성을 높인 것은 국내 업계 최초 사례로, 이번 특허 출원을 통해 AI 데이터 전문성을 바탕으로 차별화된 경쟁력을 다시 한번 입증했다"라며 "알피 날리지 컴파일러는 이미 데이터 전처리 방식을 고민하던 많은 기업들로부터 문의가 이어지고 있다"고 전했다.

nylee54@newspim.com

[뉴스핌 베스트 기사]

사진
李대통령, 오광수 민정수석 사의 수용 [서울=뉴스핌] 이영태 선임기자 = 이재명 대통령은 13일 전날 밤 사의를 표명한 오광수 대통령실 민정수석비서관의 사의를 수용했다. 강유정 대통령실 대변인은 이날 오전 브리핑에서 "오광수 민정수석이 어젯밤 이재명 대통령께 사의를 표했다"며 이같이 말했다. 오광수 대통령실 민정수석비서관 [사진=대통령실] 강 대변인은 "이 대통령은 공직기강 확립과 인사 검증을 담당하는 민정수석의 중요성을 두루 감안해 오 수석의 사의를 받아들였다"고 전했다. 이어 "대통령실은 이재명 대통령의 사법개혁 의지와 국정 철학을 깊이 이해하고 이에 발맞춰 가는 인사로 조속한 시일 내에 차기 민정수석을 임명할 예정"이라고 부연했다. 대통령실 관계자는 차명 부동산과 차명 계좌 의혹으로 오 수석이 물러난 만큼 차기 민정수석 검증 기준에 청렴함 등이 포함될 것이야는 질문에 "일단 저희가 가지고 있는 국정철학을 가장 잘 이해하고 이를 시행할 수 있는 분이 가장 우선적인 이재명 정부의 인사검증 원칙이라고 할 수 있겠다"며 "새 정부에 대한 국민들의 기대감이 워낙 크기 때문에 그 기대에 부응하는 게 첫 번째 사명"이라고 답했다. 이 관계자는 오 수석 건을 계기로 인사 검증 기준이라 원칙이 마련될 수 있느냐는 질의에는 "이 대통령이 여러 번 표방했던 것처럼 우리 정부에 대한 기대감, 그리고 실용적이면서 능력 위주의 인사가 첫 번째 가장 먼저 포방될 원칙"이라며 "그리고 여러 가지 우리 국민들이 요청하고 있는 바에 대한 다방면적인 검토는 있을 예정"이라고 언급했다. medialyt@newspim.com 2025-06-13 09:43
사진
조은석 내란특검 "사초 쓰는 자세로" [서울=뉴스핌] 김현구 기자 = 이른바 '3대 특검(특별검사)' 중 내란 특검을 맡게 된 조은석(60·사법연수원 19기) 전 감사원장 권한대행이 13일 "수사에 진력해 온 경찰 국가수사본부, 고위공직자범죄수사처, 검찰의 노고가 헛되지 않도록 최선을 다해 사초를 쓰는 자세로 세심하게 살펴 가며 오로지 수사 논리에 따라 특검직을 수행하겠다"고 밝혔다. 조 특검은 이날 "수사팀 구성과 업무공간이 준비되면 설명해 드릴 기회를 갖도록 할 것"이라며 이같이 전했다. 조 특검은 현재 퇴직 후 별도 근무 중인 변호사 사무실이 없고 재택근무 중이다. 조은석 내란 특별검사. [사진=뉴스핌DB] 전남 장성 출신인 조 특검은 광주 광덕고와 고려대 법학과를 졸업한 뒤 1993년 수원지검 성남지청에서 검사 생활을 시작했다. 그는 대검찰청 중앙수사부 검찰연구관, 대검 공판송무과장, 대검 범죄정보1·2담당관, 서울중앙지검 형사3부장검사, 서울북부지검 차장검사, 광주지검 순천지청장, 서울고검 형사부장 등을 거쳤다. 이후 2014년 대검 형사부장 시절 세월호 참사 검경 합동 수사를 지휘했고, 청주지검장, 사법연수원 부원장을 지낸 뒤 문재인정부에서 서울고검장과 법무연수원장을 역임한 뒤 검찰을 떠났다. 2011~2025년 감사원 감사위원을 지낸 조 특검은 임기 중 전현희 전 국민권익위원회 위원장에 대한 감사가 '표적 감사'라며 제동을 거는 등 윤석열정부와 대립하기도 했다. 한편 이재명 대통령은 전날 저녁 내란 특검에 조 특검, 김건희 특검에 민중기 전 서울중앙지법원장, 채해병 특검에 이명현 전 국방부 검찰단 고등검찰부장을 각각 지명했다. 조 특검과 민 특검은 더불어민주당 추천, 이 특검은 조국혁신당 추천이다. 각 특검은 최장 20일간 준비기간을 거치게 되며, 내달 초 본격적인 수사가 이뤄질 것으로 예상된다. 내란 특검은 최대 60명, 김건희 특검은 40명, 채해병 특검은 20명의 검사를 파견받을 예정이다. hyun9@newspim.com 2025-06-13 07:42
안다쇼핑
Top으로 이동