Scroll to top
© 2020, Startuprecipe theme by Rssow
Share

일레븐랩스, 자체 음성-텍스트 모델 출시


정용환 기자 - 2025년 3월 2일

AI 스타트업 일레븐랩스(ElevenLabs)가 자체 음성-텍스트 변환 모델 스크라입(Scribe)을 출시했다.

그동안 방대한 음성 라이브러리를 통해 다양한 기업에 음성-텍스트 서비스를 제공해온 회사는 일레븐랩스는 직접 음성 인식 시장에 뛰어들어 글레디아(Gladia), 어셈블리AI(AssemblyAI), 딥그램(Deepgram), 오픈AI의 위스퍼(Whisper)모델 등과 경쟁할 예정이다.

스크랩는 출시와 동시에 99개 이상의 언어를 지원하며 특히 영어(97% 정확도), 프랑스어, 독일어, 힌디어, 인도네시아어, 일본어 등 25개 이상 언어는 5% 미만 단어 오류를 보였고 구글제미나이 2.0 플레시 등을 능가하는 성능을 보였다. 화자 분리, 단어 수준 타임스탬프, 청중 웃음소리 자동 태깅 등 다양한 기능을 제공하며 사용자가 비디오 콘텐츠를 직접 변환하여 자막을 추가할 수 있도록 지원한다.

현재 서비스는 사전 녹음된 오디오 형식만 지원하며 실시간 회의록이나 음성 메모에는 아직 사용할 수 없다. 일레븐랩스는 낮은 지연 시간의 실시간 버전을 곧 출시할 예정이라고 밝혔다. 가격은 시간당 0.40달러다.

Author avatar

정용환 기자

대기업을 다니다 기술에 눈을 떠 글쟁이로 전향한 빵덕후. 새로운 기술과 스타트업을 만나는 즐거움을 독자들과 함께 나누고 싶습니다.

추천기사