전체기사 최신뉴스 GAM
KYD 디데이
증권·금융 증권

속보

더보기

크라우드웍스, 'AI 데이터 전처리 기술' 국내 특허 출원

기사입력 : 2025년04월22일 15:35

최종수정 : 2025년04월22일 15:35

'알피 날리지 컴파일러' 핵심 기술 국내 최초 특허 출원
문서 복잡도 정량 분석으로 자동화 효율↑

[서울=뉴스핌] 이나영 기자= 인공지능(AI) 테크기업 크라우드웍스가 자체 개발한 AI 데이터 전처리 솔루션 '알피 날리지 컴파일러(Alpy Knowledge Compiler)'의 주요 기술에 대한 국내 특허를 출원했다고 22일 밝혔다.

특허 내용은 문서의 복잡도 분석을 기반으로 전처리 자동화 효율을 높이는 것으로 이 같은 기술이 특허로 출원된 것은 국내 업계 첫 사례라고 회사측은 덧붙였다. 해당 기술은 RAG(검색증강생성) 기반 AI 에이전트 개발에 필수적인 비정형 데이터 전처리를 지원한다. 문서 구조의 복잡도를 정량 분석해 자동화 범위를 설정하고, 전문가 투입 여부를 결정할 수도 있다.

이 기술은 복잡한 문서에서 인식률이 떨어지고 데이터 전처리 품질이 하락하는 문제를 해결하기 위해 개발됐다. 실제 전처리 대상 문서가 수십만 페이지에 달하는 사례도 적지 않다. 이 경우, 자동화 범위와 전문가 투입 여부를 사전에 판단해 품질을 확보하고 리소스를 효율화하는 것이 비용 최적화를 위한 필수 전략이다.

알피 날리지 컴파일러 스크린샷. [사진=크라우드웍스]

크라우드웍스의 출원 기술은 문서의 복잡도를 Class1부터 4까지 네 단계로 분류한다. 구조가 단순한 문서는 자동화 처리하고, 복잡한 문서는 전문가 파싱(Parsing)을 병행해 전체 전처리 품질을 높이는 방식이다. 이를 통해 데이터 전처리 자동화 시 오류 발생 가능성을 예측하고 투입 인력과 예산, 일정 등을 효율적으로 관리할 수 있다. 파싱은 문장이나 데이터의 구조를 분석해 의미 단위로 나누는 작업을 말한다.

해당 기술은 크라우드웍스가 자체 개발한 AI 데이터 전처리 솔루션 '알피 날리지 컴파일러'에 적용되고 있다. '알피 날리지 컴파일러'는 다양한 문서를 AI가 이해할 수 있는 형태의 데이터로 변환한다. Word, PPTX, PDF, Excel 외에도 한국 기업에서 주로 사용하는 HWP, HWPX 문서 변환도 지원하며 복잡한 테이블 내 테이블, 차트 등 다양한 문서 요소까지 정확히 인식한다.

또한, 테이블, 차트, 이미지 등의 시각 요소에 대해서도 초대형언어모델(LLM)을 활용해 AI가 이해할 수 있도록 메타데이터를 생성해 비정형 데이터의 효과적인 전처리를 지원하며, 비전언어모델(VLM)을 이용해 문서를 처리하는 기능도 준비하고 있다.

최근 AI 기술 도입 확산으로 기업 내 비정형 데이터 활용과 자산화의 중요성이 높아지면서, AI 기반 문서 자동화 도구에 대한 수요도 크게 증가하고 있다. 크라우드웍스는 '알피 날리지 컴파일러'를 활용해 국내외 다양한 산업군의 데이터 전처리 수요에 적극 대응하고, 기업용 AI 시장에서 선도적 입지를 강화할 계획이다.

김우승 크라우드웍스 대표는 "문서 복잡도 분석을 통해 AI 데이터 전처리의 효율성을 높인 것은 국내 업계 최초 사례로, 이번 특허 출원을 통해 AI 데이터 전문성을 바탕으로 차별화된 경쟁력을 다시 한번 입증했다"라며 "알피 날리지 컴파일러는 이미 데이터 전처리 방식을 고민하던 많은 기업들로부터 문의가 이어지고 있다"고 전했다.

nylee54@newspim.com

[뉴스핌 베스트 기사]

사진
SKT 이용자 1천명, 공동손배소 예고 [서울=뉴스핌] 최수아 인턴기자 = SK텔레콤(SKT) 유심 정보 해킹 사태와 관련해 이용자 1천여 명이 SKT를 상대로 집단 손해배상 청구 공동소송을 예고했다. 법무법인 대륜은 22일 오전 서울 영등포구 소재 사무실에서 기자회견을 열고 "이번 주 또는 늦어도 다음 주 초에는 약 1000명 규모의 손해배상 소송을 제기할 예정이다"라고 밝혔다. 1인당 손해배상 청구 금액은 100만원으로 전해졌다. [서울=뉴스핌] 양윤모 기자 = 손계준 법무법인 대륜 변호사가 21일 오후 SK텔레콤의 유심(USIM) 정보 유출 사태 고발인 조사를 위해 서울 중구 남대문경찰서에 출석하며 입장을 밝히고 있다. 법무법인 대륜은 유영상 SK텔레콤 대표이사와 보안 담당자 등을 정보통신망법 위반, 위계에 의한 공무집행방해, 배임 등의 혐의로 경찰에 고발했다. 2024.05.21 yym58@newspim.com 대륜은 "집단소송 신청자는 1만 명 이상이나 서류 취합까지 완료된 분들에 한해서만 1차 민사소장 접수 예정"이라고 전했다. 이들은 해당 소장을 접수한 이후에도 2차 소장 모집을 계속할 계획이다.  대륜은 "역대 최대 규모의 유심정보 유출 사고로, 장기간 해킹에 노출된 정황이 있으며 피해자들은 유심 교체 등으로 현실적인 불편을 겪었다"면서 "SKT는 보안에 소홀한 반면 높은 영업이익을 유지해왔고, 지금까지도 피해 규모나 경위에 대해 충분히 밝히지 않고 있다"고 지적했다. 이어 "이러한 점을 종합하여 1인당 100만 원의 위자료 청구가 정당하다고 판단했다"고 설명했다. 또 "SKT는 고객의 개인정보를 안전하게 보호해야 할 의무가 있음에도 불구하고, 정보보호에 있어 구조적인 소홀과 의도적인 비용 감축 정황이 확인된다"고 주장했다. 공동소송이란 원고 또는 피고 혹은 그 쌍방이 여러 사람일 경우, 즉 소송주체가 다수일 경우를 의미한다. 이번 사건처럼 다수에게 피해가 발생했을 때 다수의 피해자가 함께 소송에 참여한다.  앞서 대륜은 지난 1일 SKT 유영상 대표이사와 SKT 보안 책임자를 업무상 배임과 위계 공무집행 방해 등의 혐의로 경찰에 고발했으며 전날(21일) 남대문경찰서에서 고발인 조사를 받았다. geulmal@newspim.com 2025-05-22 12:49
사진
폭스콘 "AI 데이터센터, 단계 건설" [서울=뉴스핌] 고인원 기자= 세계 최대 전자 위탁생산업체인 대만 폭스콘이 미국 반도체 기업 엔비디아와 함께 추진 중인 인공지능(AI) 데이터센터 프로젝트가 최대 100메가와트(MW) 규모로 단계적으로 건설될 예정이라고 밝혔다. 류양웨이 폭스콘 회장은 대만 타이베이에서 열린 '2025 컴퓨텍스 타이베이' 기조연설에서 "이번 AI 데이터센터는 엄청난 전력이 필요한 만큼, 단계적으로 구축할 것"이라며 "1차로 20메가와트 규모로 시작한 뒤, 40메가와트를 추가로 설치할 예정이며, 궁극적으로는 100메가와트까지 확대할 계획"이라고 말했다. 이 프로젝트는 전날 엔비디아가 대만을 대표하는 제조 기업 TSMC·폭스콘 및 대만 정부와 함께 초대형 AI 생태계를 대만에 구축한다고 발표한 데 따른 후속 설명이다. 2024년 10월 8일 대만 타이페이에서 열린 폭스콘 연례 기술 전시회에 전시된 폭스콘 전기이륜차 파워트레인 시스템 [서울=뉴스핌]박공식 기자 = 2025.05.14 kongsikpark@newspim.com 류 회장은 "전력은 대만에서 매우 중요한 자원"이라며 "공급 부족이라는 표현은 쓰고 싶지 않지만, 이를 감안해 여러 도시를 대상으로 부지를 분산하는 방식으로 데이터센터를 건설할 것"이라고 설명했다. 일부 시설은 대만 남서부 가오슝시에 우선 들어서며, 나머지는 전력 여건에 따라 다른 도시로 확대될 수 있다고 덧붙였다. 이날 류 회장의 키노트 무대 위로 젠슨 황 엔비디아 CEO가 깜짝 등장해 눈길을 끌었다. 황 CEO는 "이번 AI 센터는 폭스콘, 엔비디아, 그리고 대만 전체 생태계를 위한 시설"이라며 "우리는 대만을 위한 AI 팩토리를 만들고 있다. 여기에는 대만의 350개 파트너사가 참여하고 있다"고 강조했다. 이번 AI 데이터센터는 고성능 컴퓨팅 인프라 확보를 통해 AI 학습 및 추론 속도를 크게 높이고, 대만 내 AI 산업 생태계 전반에 걸쳐 활용될 것으로 기대된다. koinwon@newspim.com 2025-05-20 23:40
안다쇼핑
Top으로 이동