
딥엘(DeepL)이 실시간 음성 커뮤니케이션용 번역 서비스 스위트인 딥엘 보이스투보이스(DeepL Voice-to-Voice)를 발표했다.
딥엘은 음성 번역으로 사업을 확장하며 API를 통해 화상 회의·대면 대화·고객 응대 등 다양한 상황에서 즉각적이고 정밀한 음성 번역을 제공하며 언어 장벽 없이 팀이 협업할 수 있도록 지원한다.
딥엘 보이스투보이스 스위트에 포함된 제품·서비스는 이렇다. 먼저 딥엘 보이스포미팅(DeepL Voice for Meetings). 마이크로소프트 팀즈, 줌 같은 플랫폼에서 실시간 번역 기능을 제공한다. 사용자는 모국어로 말하고 다른 참가자는 이를 자신의 모국어로 들을 수 있다. 이 기능은 6월 얼리 액세스 프로그램을 시작할 예정이다.
다음은 딥엘 보이스포컨버세이션(DeepL Voice for Conversations). 모바일을 넘어 웹으로도 확장되어 앱 설치가 현실적이지 않거나 허용되지 않는 환경에서도 사용할 수 있는 멀티 플랫폼 경험을 실현한다.
다음은 그룹 대화. 교육·코칭·워크숍 같은 상황에서 참가자가 QR코드를 통해 즉시 참여해 다국어 의견 교환을 가능하게 하는 기능이다. 현장 직원은 여러 화자와의 실질적인 상호작용 속에서도 공통된 이해를 유지할 수 있다. 여러 기기에서 접속할 수 있으며 참가자는 실시간으로 동시 음성 번역을 받을 수 있다. 그룹 대화 기능은 4월 30일부터 일반 제공된다.
이어 음성 간 API. 기업이 딥엘 음성 번역 기능을 사내 애플리케이션이나 컨택센터 등 고객 응대 툴에 직접 통합할 수 있도록 한다. 현재 얼리 액세스 프로그램을 운영 중이며 등록을 받고 있다.
다음은 음성 용어 커스터마이징. 딥엘 보이스 내 새로운 품질 최적화 기능으로 업계에서 사용하는 용어·제품명·회사명·인명 등 전문 용어가 빠른 말투나 고난도 전문 용어에도 실시간으로 보다 정확하게 캡처·전사·번역된다. 이 기능 일환으로 딥엘 번역 용어집이 딥엘 보이스에 통합되어 사용자는 대화 전반에 걸쳐 주요 전문 용어를 표준화할 수 있게 된다. 일반 제공은 5월 7일부터 시작된다.
기존 음성 번역 시스템은 음성을 텍스트로 변환한 뒤 번역하고 이를 다시 음성으로 변환하는 절차를 거친다. 딥엘은 오랜 텍스트 번역 경험을 바탕으로 번역 품질에서 우위를 가진다며 향후 텍스트 변환 단계를 완전히 생략한 엔드투엔드 음성 번역 모델 개발을 목표로 한다고 밝혔다.
한편 보도에선 레딧 공동 창업자 알렉시스 오하니안(Alexis Ohanian)가 소유한 벤처캐피털이 지원하는 팔라브라(Palabra)가 번역어와 원어 양쪽 음성을 보존하도록 설계된 실시간 음성 번역 엔진을 개발 중으로 딥엘 입장에선 직접적인 경쟁자가 될 가능성이 있다고 지적하고 있다. 관련 내용은 이곳에서 확인할 수 있다.


