전체기사 최신뉴스 GAM
KYD 디데이
증권·금융 증권

속보

더보기

크라우드웍스, 'AI 데이터 전처리 기술' 국내 특허 출원

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

'알피 날리지 컴파일러' 핵심 기술 국내 최초 특허 출원
문서 복잡도 정량 분석으로 자동화 효율↑

[서울=뉴스핌] 이나영 기자= 인공지능(AI) 테크기업 크라우드웍스가 자체 개발한 AI 데이터 전처리 솔루션 '알피 날리지 컴파일러(Alpy Knowledge Compiler)'의 주요 기술에 대한 국내 특허를 출원했다고 22일 밝혔다.

특허 내용은 문서의 복잡도 분석을 기반으로 전처리 자동화 효율을 높이는 것으로 이 같은 기술이 특허로 출원된 것은 국내 업계 첫 사례라고 회사측은 덧붙였다. 해당 기술은 RAG(검색증강생성) 기반 AI 에이전트 개발에 필수적인 비정형 데이터 전처리를 지원한다. 문서 구조의 복잡도를 정량 분석해 자동화 범위를 설정하고, 전문가 투입 여부를 결정할 수도 있다.

이 기술은 복잡한 문서에서 인식률이 떨어지고 데이터 전처리 품질이 하락하는 문제를 해결하기 위해 개발됐다. 실제 전처리 대상 문서가 수십만 페이지에 달하는 사례도 적지 않다. 이 경우, 자동화 범위와 전문가 투입 여부를 사전에 판단해 품질을 확보하고 리소스를 효율화하는 것이 비용 최적화를 위한 필수 전략이다.

알피 날리지 컴파일러 스크린샷. [사진=크라우드웍스]

크라우드웍스의 출원 기술은 문서의 복잡도를 Class1부터 4까지 네 단계로 분류한다. 구조가 단순한 문서는 자동화 처리하고, 복잡한 문서는 전문가 파싱(Parsing)을 병행해 전체 전처리 품질을 높이는 방식이다. 이를 통해 데이터 전처리 자동화 시 오류 발생 가능성을 예측하고 투입 인력과 예산, 일정 등을 효율적으로 관리할 수 있다. 파싱은 문장이나 데이터의 구조를 분석해 의미 단위로 나누는 작업을 말한다.

해당 기술은 크라우드웍스가 자체 개발한 AI 데이터 전처리 솔루션 '알피 날리지 컴파일러'에 적용되고 있다. '알피 날리지 컴파일러'는 다양한 문서를 AI가 이해할 수 있는 형태의 데이터로 변환한다. Word, PPTX, PDF, Excel 외에도 한국 기업에서 주로 사용하는 HWP, HWPX 문서 변환도 지원하며 복잡한 테이블 내 테이블, 차트 등 다양한 문서 요소까지 정확히 인식한다.

또한, 테이블, 차트, 이미지 등의 시각 요소에 대해서도 초대형언어모델(LLM)을 활용해 AI가 이해할 수 있도록 메타데이터를 생성해 비정형 데이터의 효과적인 전처리를 지원하며, 비전언어모델(VLM)을 이용해 문서를 처리하는 기능도 준비하고 있다.

최근 AI 기술 도입 확산으로 기업 내 비정형 데이터 활용과 자산화의 중요성이 높아지면서, AI 기반 문서 자동화 도구에 대한 수요도 크게 증가하고 있다. 크라우드웍스는 '알피 날리지 컴파일러'를 활용해 국내외 다양한 산업군의 데이터 전처리 수요에 적극 대응하고, 기업용 AI 시장에서 선도적 입지를 강화할 계획이다.

김우승 크라우드웍스 대표는 "문서 복잡도 분석을 통해 AI 데이터 전처리의 효율성을 높인 것은 국내 업계 최초 사례로, 이번 특허 출원을 통해 AI 데이터 전문성을 바탕으로 차별화된 경쟁력을 다시 한번 입증했다"라며 "알피 날리지 컴파일러는 이미 데이터 전처리 방식을 고민하던 많은 기업들로부터 문의가 이어지고 있다"고 전했다.

nylee54@newspim.com

[뉴스핌 베스트 기사]

사진
국정원 "로저스 대표 위증 고발 요청" [서울=뉴스핌] 조민교 기자 = 국가정보원(이하 국정원)이 해럴드 로저스 쿠팡 대표를 위증 혐의로 고발한다는 의견을 밝혔다.  30일 국회 과학기술정보방송통신위원회 위원장인 최민희 더불어민주당 의원은 청문회 도중 "국정원이 오늘 청문회를 모니터링하던 중, 청문회를 지켜보던 국정원장이 로저스 대표를 위증죄로 고발해 달라고 과방위에 요청할 계획이라는 입장을 전달해 왔다"며 "구체적인 위증 내용도 함께 전달받았다"고 말했다. 이어 "해당 사안은 간사에게 전달해 내일 청문회 종료 시점에 처리하겠다"고 밝혔다. [서울=뉴스핌] 윤창빈 기자 = 해롤드 로저스 쿠팡 임시 대표가 30일 서울 여의도 국회 과학기술정보방송통신위원회 전체회의에서 열린쿠팡 침해사고 및 개인정보 유출, 불공정 거래, 노동환경 실태 파악과 재발방지 대책 마련을 위한 청문회에서 의원 질문에 답변하고 있다. 2025.12.30 pangbin@newspim.com 로저스 대표는 이날 청문회에서 쿠팡이 정부 및 수사기관을 거치지 않고 정보 유출자를 접촉했다는 의혹과 관련해 "저희는 피의자와 연락하는 것을 원치 않았지만 여러 차례에 걸쳐 그 기관(국가정보원)에서 피의자와 연락하라는 요청을 받았다"고 말했다. 이어 '명확한 지시나 명령이 있었느냐'는 추가 질의에는 "명령이었다. 지시 명령"이라고 주장했다. '국정원 누구와 소통했느냐'는 질문에 대해서는 "현재 이름은 없지만 해당 이름을 전달하겠다"고 답했다. 로저스 대표는 해킹에 사용된 장비의 포렌식과 관련해서도 "정보기관이 복사본을 보유하고 있고, 원본은 경찰에 전달했다"며 "그 기관이 별도의 카피를 만들어 우리가 보관하는 것도 허락했다"고 말했다. 또 '셀프 면죄부 조사 아니냐'는 지적에는 "정부 지시에 따라 한 조사"라며 "이사회도 한국 법에 따라 협력해야 한다고 판단했다"고 밝혔다. 그러나 정부 측은 로저스 대표의 주장과 선을 긋고 있다. 배경훈 부총리 겸 과학기술정보통신부 장관은 이날 청문회에서 "포렌식 검사와 로그 분석의 주체는 과기정통부가 주관하는 민관합동조사단과 개인정보보호위원회, 경찰청"이라며 "국정원이 지시하거나 조사를 주도한 사실은 없다"고 밝혔다. 배 부총리는 "국정원은 증거물을 국내로 반입하는 과정에서 훼손이나 분실을 방지하기 위한 기술적 지원을 한 것으로 안다"며 "이를 조사 지시나 개입으로 볼 수는 없다"고 설명했다. 국정원도 별도의 입장을 내고 로저스 대표의 발언을 부인했다. 국정원은 지난 26일 공지를 통해 "쿠팡 사태와 관련해 국정원은 쿠팡 측에 어떠한 지시를 할 위치에 있지 않으며, 어떠한 지시를 한 바도 없다"고 밝혔다. 다만 "외국인에 의한 대규모 정보 유출 사태를 국가안보 위협 상황으로 인식해, 관련 정보 수집·분석을 위한 업무 협의를 진행한 바는 있다"고 설명했다. mkyo@newspim.com 2025-12-30 18:00
사진
이혜훈 "내란은 민주주의 파괴" [서울=뉴스핌] 양윤모 기자 = 초대 기획예산처 장관 후보자로 지명된 이혜훈 전 국민의힘 의원이 30일 오전 서울 중구 예금보험공사에 마련된 인사청문회 준비 사무실로 출근하며 "내란은 민주주의 파괴하는 일이며 실체파악 잘 못했다"라며 사과문을 발표하고 있다. 2025.12.30 yym58@newspim.com   2025-12-30 10:27
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동