x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

중국 텐센트(Tencent)가 개발하는 범용 멀티모달 대규모 언어 모델(LLM) 패밀리인 텐센트 HY(Tencent HY)를 통해 텍스트·이미지·동영상을 바탕으로 인터랙티브한 3D 월드를 생성·재구축·시뮬레이션할 수 있는 멀티모달 월드 모델 HY-World 2.0을 오픈소스로 공개했다.

HY-World 2.0은 텍스트·이미지·동영상으로부터 인터랙티브한 3D 월드를 생성·재구축·시뮬레이션할 수 있는 멀티모달 월드 모델. 출력 결과는 게임 엔진이나 엠바디드 시뮬레이션(Embodied Simulation) 파이프라인에 통합할 수 있다.

원클릭으로 텍스트나 이미지를 자동으로 인터랙티브한 3D 월드로 변환할 수 있다. 또 유니티나 언리얼 엔진 같은 게임 엔진용 편집 가능한 3D 월드를 출력할 수 있다. 출력되는 3D 월드는 표준 3D 익스포트를 포함한다. 인터랙티브 캐릭터 모드를 지원하며 생성한 3D 월드를 실시간으로 탐색하는 것도 가능하다. 생성한 3D 월드 분위기를 버튼 하나로 변경하는 것도 가능하다.

 

HY-World 2.0에는 단일 이미지로부터 고충실도 3D 월드를 위한 파노라마 생성을 스케일업할 수 있는 HY-Pano 2.0, VLM과 내비메시(NavMesh)를 결합한 의미 이해 기반 경로 계획을 통해 충돌을 회피하면서 일관된 탐색을 실현하는 월드내브(WorldNav), 잠재 공간에서의 키프레임 기반 월드 확장을 통해 공간적으로 일관된 메모리를 유지하면서 안정적인 새로운 시점 생성을 가능하게 하는 월드스테레오 2.0(WorldStereo 2.0), 복수 시점 예측을 통합해 정확하고 내비게이션 가능한 3DGS 에셋을 생성할 수 있는 통합 3D 재구축 기법인 월드미러 2.0(WorldMirror 2.0), 라이팅 및 충돌 처리에 대응한 인터랙티브 탐색을 위한 고성능 엔진 비의존형 3DGS 렌더러인 월드렌즈(WorldLens) 등이 포함된다.

HY-World 2.0은 허깅 페이스에서 다운로드할 수 있으며 깃허브에도 공개되어 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post