x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

AI 개발 기업 미스트랄 AI(Mistral AI)가 스캔한 문서와 손글씨를 인식해 텍스트 데이터로 변환할 수 있는 AI 모델 미스트랄 OCR 3을 발표했다. 미스트랄 OCR 3 정확도는 엔터프라이즈용 문서 처리 솔루션이나 AI 기반 OCR 솔루션을 상회하며 읽기 어려운 필기체도 인식할 수 있는 게 특징이다.

미스트랄 OCR 3는 이전 모델인 미스트랄 OCR 2를 대폭 업그레이드한 모델로 필기체는 물론 활자 위에 주석 형태로 덧붙여진 손글씨 콘텐츠도 정확하게 판독할 수 있다. 또 복잡하게 밀집된 레이아웃이나 입력 폼에 대한 검출 능력도 개선되어 다양한 계약 문서 판독에도 적합하다는 설명이다. 이와 함께 저품질 스캔으로 인한 문자 압축이나 왜곡, 저해상도, 배경 노이즈에 대해서도 높은 견고성을 갖췄다.

HTML 기반 표 구조를 포함한 마크다운 출력도 지원해 하위 시스템이 문서 내용 뿐 아니라 구조까지 이해할 수 있도록 설계됐다. 미스트랄 OCR 3는 벤치마크에서 중국어, 동아시아 언어, 동유럽 언어, 영어, 서유럽 언어 전반에서 경쟁 제품을 상회하는 성능을 보였다고 한다.

아마존 Textract를 포함해 입력 용지, 손글씨, 청구서, 복잡한 표, 역사적 문서 스캔 데이터 등 서식별 성능을 비교한 결과에서도 미스트랄 OCR 3가 경쟁 제품보다 뛰어난 성능을 나타냈다.

언어별로 이전 모델인 미스트랄 OCR 2와 성능을 비교한 결과 역시 모든 언어에서 미스트랄 OCR 3 정확도가 더 높았으며 전체적으로는 74% 승률을 기록했다.

미스트랄 OCR 3는 미스트랄 AI 스튜디오 내 API 또는 도큐먼트 AI 플레이그라운드(Document AI Playground) 인터페이스를 통해 이용할 수 있다. 다수 경쟁 솔루션보다 소형 모델인 점을 바탕으로 업계 최고 수준인 1,000페이지당 2달러 가격에 제공되며 배치 API 할인을 적용할 경우 1,000페이지당 1달러로 이용 가능하다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post