x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

애플이 이미지 1장으로부터 고정밀 3D 장면을 생성하는 기법인 SHARP를 발표했다. SHARP는 신경망을 이용하며 표준적인 GPU에서도 1초 미만으로 실행할 수 있다고 한다.

SHARP는 이미지 1장을 입력하면 해당 이미지에 묘사된 장면에 대한 3D 가우시안 표현 파라미터를 반환한다. 이는 신경망을 통한 단일 피드포워드 패스를 통해 이뤄지며 표준 GPU에서도 1초 미만으로 실행할 수 있다고 한다.

SHARP로 출력된 3D 가우시안 표현은 출력 폴더에 3DGS(3D Gaussian Splatting) 형태로 저장된다. 3DGS는 이미지나 영상에서 특징을 추출해 점군(point cloud)이라 불리는 점 집합을 만들고 각 점에 대해 주변의 색상 정보를 가우스 함수로 평균화한다. 그리고 3D 공간상에 색을 배치해 나가 사실적인 3D 공간을 구축할 수 있다.

애플 연구팀은 SHARP가 기존 모델과 비교해 이미지 평가 벤치마크인 LPIPS 점수가 25~34%, DISTS 점수가 21~43% 개선됐다고 보고했다.

한편 이번에 발표된 SHARP와의 직접적인 관련성은 불분명하지만 애플은 이미 3D 장면 생성 기술을 공간 장면(Spatial Scene)이라는 이름으로 제품화한 바 있다. 공간 장면은 지난 9월 출시된 iOS 26부터 이용 가능하며 애플 기기에 탑재된 AI 전용 프로세서인 뉴럴엔진(Neural Engine)을 활용해 2D 이미지로부터 입체적인 이미지를 생성할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post