
프랑스 AI 스타트업 H 컴퍼니(H Company)가 3월 31일 PC에서 클릭 조작이나 작업 실행 등을 할 수 있는 AI 모델 홀로3(Holo3)를 공개했다. 홀로3는 GUI 에이전트용으로 최적화된 대규모 비전 언어 모델로 오픈소스 버전인 Holo3-35B-A3B는 AI 모델 공개·배포 서비스인 허깅 페이스에서 무료로 이용할 수 있다.
홀로3는 웹, 데스크톱, 모바일 등 디지털 환경에서 동작하는 대규모 비전 언어 모델. 화면상 정보를 읽어내고 버튼을 누르거나 폼을 채우면서 상황에 맞는 조작을 실행하도록 설계되어 있다.
예를 들어 PDF 파일에서 장비 가격 정보를 추출하고 직원 잔여 예산과 대조한 뒤 승인 또는 거절 메일을 각자에게 발송하는 다중 앱 연계 처리도 상정되어 있다. 단순히 클릭하는 데 그치지 않고 PDF 파일·스프레드시트·메일을 넘나들며 문서 읽기, 계산, 복수 앱 간 정보 전달을 수행하고 중간 상태를 유지한 채 작업을 이어가는 처리까지 포함된다.
이번에 공개된 오픈소스 버전 Holo3-35B-A3B는 Qwen3.5-35B-A3B를 기반으로 파인튜닝된 모델이다. 여러 처리 부분 중 일부만을 사용해 동작하는 MoE(Mixture of Experts) 구성이 채택됐으며 전체 파라미터 수는 350억 개, 이 중 동작 시 사용되는 활성 파라미터 수는 30억 개다. 이미지와 텍스트를 입력해 텍스트를 생성하는 멀티모달 AI다.
학습에는 오픈소스 데이터셋 외에도, AI용으로 인공적으로 생성한 대량 조작 데이터와 인간이 내용을 확인하고 주석을 붙인 학습 데이터가 활용됐다. 이런 데이터를 조합해 화면 내용을 식별하는 능력과 다음 조작을 판단하는 능력을 강화했다고 한다. 나아가 인공적으로 생성한 조작 데이터를 활용하는 데 그치지 않고 학습에 사용하지 않은 장면에도 대응하기 쉽도록 훈련됐으며 엄선한 강화학습도 병행됐다.
기업용 시스템에 가까운 UI와 조작 환경을 코드 생성 에이전트로 자동으로 만드는 구조인 합성 환경 팩토리(Synthetic Environment Factory)도 마련되어 있으며 홀로3는 이러한 학습용 환경 속에서 실무에 가까운 조작을 학습하고 있다.
성능 면에서는 오픈소스 버전인 Holo3-35B-A3B가 국제 표준 벤치마크(OSWorld-Verified)에서 77.8%를 기록했다. 또 상위 모델인 Holo3-122B-A10B는 동일한 벤치마크에서 78.85%를 기록했다. Holo3-122B-A10B 파라미터 수는 1,220억 개이며 동작 시 사용하는 활성 파라미터 수는 100억 개다.
복수 단계를 순서대로 처리하는 486건 과제도 마련되어 있으며 전자상거래, 업무용 소프트웨어, 협업, 다중 앱 연계 4개 분야에서 평가가 이뤄진다. 앱 하나 안에서 완결되는 비교적 짧은 조작부터 복수 앱을 넘나들며 진행하는 긴 워크플로까지 포함하는 이 독자적인 벤치마크는 H 코퍼레이트 벤치마크(H Corporate Benchmark)로 명명됐다.
H 컴퍼니에 따르면 무료 플랜에서는 오픈소스 버전인 Holo3-35B-A3B를 API를 통해 시험해볼 수 있으며 레이트 한계는 분당 10 리퀘스트라고 한다. 상위 모델인 Holo3-122B-A10B는 유료 플랜 한정이다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] K-스타트업센터, 글로벌 진출 교두보 확대‧CJ제일제당, ‘프론티어랩스 6기’ 모집](https://startuprecipe.co.kr/wp-content/uploads/2026/04/260415_Busan-Center-for-Creative-Economy-Innovation_050325-75x75.jpg)
![[AI서머리] 인쇼츠, AI 슈퍼스케일러 협력‧배민, 라이더 참여 커뮤니티 출범](https://startuprecipe.co.kr/wp-content/uploads/2026/04/260415_KREAM-50230535-350x250.jpg)
