
기업용 엔터프라이즈 AI를 개발하는 코히어(Cohere) 연구 부문인 코히어랩스(Cohere Labs)가 다국어 오픈 웨이트 모델 타이니 아야(Tiny Aya)를 출시했다. 코히어랩스는 다양한 언어에서 신뢰성을 유지하면서도 로컬 사용에 충분한 효율성을 확보한 모델이라는 목표 아래 개발을 진행했으며 검증·번역·리소스가 적은 언어로 이뤄진 수학적 추론 등 태스크에서 기존 다국어 모델과 경쟁력 있는 성능을 갖췄다고 밝혔다.
번역 등 여러 태스크를 다국어로 수행한 벤치마크 결과에서 타이니 아야는 서아시아 및 아프리카 언어에서 다른 모델을 웃도는 높은 점수를 기록했다. 수 페타바이트에 달하는 웹 아카이브와 데이터셋을 제공하는 Common Crawl에서 페이지 수가 많을수록 다국어 LLM의 언어 간 성능에 큰 영향을 미친다. 타이니 아야는 페이지 수가 적은 웹에서 잘 사용되지 않는 언어에 대해서도 안정적인 성능을 발휘하는 것으로 나타났다.
Introducing ✨Tiny Aya✨, a family of massively multilingual small language models built to run where people actually are.
Tiny Aya delivers strong multilingual performance in 70+ global languages in a 3.35B parameter model, efficient enough to run locally, even on a phone. pic.twitter.com/TV8ESmFCrp
— Cohere Labs (@Cohere_Labs) February 17, 2026
오픈엔드 생성 AI 모델 크기와 66개 언어 평균 품질을 비교해보면 품질 면에서 Gemma 3-27b가 최고 수준이지만 모델 크기가 매우 크며 타이니 아야는 모델 크기를 억제하면서도 높은 품질을 보이는 것으로 확인됐다. 언어별 토큰화 효율에서도 타이니 아야는 대부분 언어에서 가장 효율적인 토큰화를 달성했다.
타이니 아야는 전 세계 5개 지역에서 67개 언어를 사후 학습(post-training)으로 우선 지원하며 지역별로 고유한 강점을 가진 4개 전문 모델(Tiny Aya Fire, Tiny Aya Earth, Tiny Aya Water, Tiny Aya Global)로 구성된다.
타이니 아야는 오픈 웨이트 모델로 제공되며 허깅페이스 스페이스나 코히어 플랫폼에서 체험해볼 수 있다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] 웹3 팬이코노미 ‘밋48’ 투자 유치‧원자력 AI 부트캠프 경진대회 성료](https://startuprecipe.co.kr/wp-content/uploads/2026/02/260220_4BY4_50025-75x75.jpg)
![[AI서머리] 오픈이노베이션 스타트업 모집‧‘2026 EMA-AGRIFOOD’ 모집 시작](https://startuprecipe.co.kr/wp-content/uploads/2026/02/260219_trillionlabs.co_500235035-350x250.jpg)
