
바이두(Baidu)가 장문 서류를 한 번에 판독하는 걸 목적으로 한 AI 모델인 언리미티드 OCR(Unlimited OCR)을 오픈소스로 공개했다. 언리미티드 OCR은 이미지나 PDF에 포함된 문자를 판독하는 OCR 모델로 여러 페이지에 걸친 긴 문서 분석을 중시하고 있다고 한다.
종이 계약서를 스캔해 PDF로 만들거나 연구 논문 페이지를 한꺼번에 읽어 들이거나 매뉴얼이나 회의록에서 필요한 기술을 찾을 때 OCR은 이미지 안에 있는 문자를 텍스트로 추출하는 역할을 담당한다. 짧은 이미지라면 기존 OCR로도 다루기 쉬운 반면 수십 페이지에 달하는 PDF에서는 페이지별로 처리한 뒤 나중에 결과를 이어 붙여야 할 필요가 생긴다. 페이지를 나눠서 처리하면 시간이 걸릴 뿐 아니라 전후 문맥이나 표 연결이 유실되기 쉬워진다.
최근에는 AI 모델을 활용해 이미지 내 문자나 문서 구조를 판독하는 OCR도 늘고 있다. AI 모델을 사용하면 단순히 문자를 추출하는 것에 그치지 않고 문장 흐름이나 표, 레이아웃을 고려한 판독을 기대할 수 있다. 하지만 출력하는 문장이 길어질수록 AI가 이전에 출력한 내용을 기억해 두기 위한 임시 메모에 해당하는 KV 캐시가 증가해 메모리 사용량이 커지고 생성 속도도 떨어지는 과제가 있었다.
언리미티드 OCR은 이런 장문 처리 문제를 해결하기 위해 공개된 새로운 오픈소스 모델. 논문에서는 2025년 10월 출시된 딥시크-OCR(DeepSeek-OCR)을 베이스라인으로 삼아 장문 출력 시 메모리 사용량이 증가하는 과제를 R-SWA로 억제하는 설계라고 설명하고 있다.
언리미티드 OCR은 긴 문서를 1회 처리로 분석할 수 있는 점이 특징이라고 한다. 논문에서는 최대 컨텍스트 길이 32K라는 조건에서 수십 페이지짜리 문서를 1회 추론 처리로 전사할 수 있다고 설명하고 있다.
장문 처리를 뒷받침하는 구조로 도입된 게 R-SWA(Reference Sliding Window Attention)이다. 어텐션(Attention)은 AI가 입력 어느 부분에 주목할지를 결정하는 구조로 R-SWA는 문서 이미지 등 참조 정보를 보면서 출력 완료된 텍스트에 대해서는 직전 일정 범위를 작업 기억처럼 다룬다. 모든 출력을 무제한으로 축적하는 게 아니라 필요한 참조 정보와 직전 문맥을 사용해 KV 캐시를 일정하게 유지하고 장문에서도 처리 비용을 억제하는 설계라고 한다.
We’re open-sourcing Unlimited OCR — built to read long documents in one pass.
With 3B total parameters and only 500M activated, Unlimited OCR sets new end-to-end SOTA results on OmniDocBench v1.5 and v1.6.
The key innovation is Reference Sliding Window Attention (R-SWA),… pic.twitter.com/cBRqmyRUKN
— Baidu AI (@BaiduAI_News) June 23, 2026
모델 규모는 전체 파라미터 수가 3B(30억)이며 실제 처리에서 활성화되는 파라미터는 500M(5억)이라고 한다. 모든 파라미터를 항상 사용하는 게 아니라 일부를 활성화하는 설계로 해 장문 처리에 필요한 능력과 계산 효율 양립을 도모하고 있다.
깃허브 샘플 코드에서는 여러 페이지짜리 이미지나 PDF를 다루는 처리 실례가 제시되어 있다. PDF는 페이지를 이미지로 변환한 뒤 여러 페이지 분석을 수행하는 형식이라고 한다.
바이두는 언리미티드 OCR 코드와 모델 가중치를 MIT 라이선스로 공개했으며 현재 깃허브, 허깅 페이스, 모델스코프에서 이용할 수 있게 되어 있다. 또 논문에서는 R-SWA에 대해 OCR뿐 아니라 음성 인식이나 번역 등 긴 출력을 다루는 처리에도 응용 가능하다고 서술하고 있으며 장문을 읽는 AI 구조가 문서 이외의 분야로도 확대될 가능성이 있다고 한다. 관련 내용은 이곳에서 확인할 수 있다.
![[DailyRecipe] 막 오른 넥스트라이즈2026…올해 특징은?](https://i0.wp.com/startuprecipe.co.kr/wp-content/uploads/2026/06/260618_nextrise_ai_0023052050235235.jpg?resize=350%2C250&ssl=1)
![[이번주글로벌] 스페이스X IPO 신호탄‧눈길 끈 AI 칩 설계 분야](https://i0.wp.com/startuprecipe.co.kr/wp-content/uploads/2026/02/260130_Ricursive-Intelligence_00001.jpg?resize=75%2C75&ssl=1)
![[AI서머리] 나눔비타민, AI 지역돌봄 플랫폼 공개‧에임, 신규 솔루션 ‘IPO Boost’ 출시](https://i0.wp.com/startuprecipe.co.kr/wp-content/uploads/2026/06/260629_naviyam.co_.kr_502305235.png?resize=350%2C250&ssl=1)
