
독일 AI 스타트업 블랙포레스트랩스(Black Forest Labs)가 이미지 생성 AI 모델 패밀리 FLUX.2를 11월 25일 릴리스했다. 이전 모델인 FLUX.1 성공을 바탕으로 기능을 더 확장한 것으로 데모나 놀이 뿐 아니라 실용적인 크리에이티브 워크플로에서의 활용을 상정해 설계했다.
FLUX.2가 갖춘 최대 특징은 뛰어난 묘사 능력과 제어성에 있다. 10장까지의 참조 이미지를 동시에 읽어 들여 특징을 반영하면서 일관된 캐릭터나 스타일을 유지하는 멀티 레퍼런스 기능이 탑재됐다. 또 400만 화소까지 고해상도 출력을 지원하며 포스터나 인포그래픽에 포함된 복잡한 문자 정보도 무너지지 않고 정확하게 묘사할 수 있다.
기술적인 구조로는 Mistral-3이라는 240억 파라미터를 가진 비전 언어 모델(VLM)과 트랜스포머 기술을 결합한 구조를 채택했다. 이를 통해 현실 세계 물리 법칙이나 공간적 관계성을 더 깊이 이해한 생성이 가능해졌으며 조명이나 재질 표현이 더 리얼해졌다.
FLUX.2에는 현재 4개 모델이 준비되어 있다. FLUX.2 [pro]는 클로즈드 소스 최상위 모델에 필적하는 최고 수준 화질을 제공하는 모델. 프롬프트 충실도나 시각적 재현성에서 다른 모델과 동등한 성능을 가지면서도 더 고속이고 저비용으로 이미지를 생성할 수 있다는 점이 특징이다. 속도와 품질 간 타협을 배제한 설계가 되어 있다.
FLUX.2 [flex]는 개발자가 생성 스텝 수나 가이던스 스케일 등 파라미터를 세밀하게 제어할 수 있는 모델. 이를 통해 품질, 프롬프트 충실도, 처리 속도 밸런스를 자유롭게 조정할 수 있다. 그 중에서도 텍스트 렌더링이나 세부 묘사에 뛰어나다. 스텝 수가 증가할수록 텍스트 렌더링 정확도와 이미지 디테일이 향상된다.
FLUX.2 [dev]는 FLUX.2 베이스 모델에서 파생된 320억 파라미터를 가진 오픈 웨이트 모델. 텍스트에서 이미지 생성과 복수 입력 이미지를 활용한 편집 기능을 단일 체크포인트로 실현하고 있으며 현재 이용 가능한 오픈 웨이트 이미지 생성·편집 모델로서는 가장 강력한 성능을 자랑한다. FLUX.2 [dev]의 모델 데이터는 허깅페이스에서 공개되어 있다.
FLUX.2 [klein]은 조만간 공개 예정인 모델로 FLUX.2 베이스 모델을 증류를 통해 크기를 축소한 것. 아파치 2.0 라이선스 하에 오픈소스로 제공될 예정이며 동일 규모로 처음부터 트레이닝된 모델과 비교해 더 강력하고 개발자가 다루기 쉬운 사양이다.
FLUX.2는 고성능인 반면 동작에는 높은 연산 능력이 요구된다. 320억 파라미터를 가진 이 모델을 완전히 읽어 들이려면 보통 VRAM 90GB가 필요하지만 엔비디아와의 협력을 통해 FP8 양자화라는 기술을 사용해 최적화가 이뤄졌다. 이를 통해 화질을 유지하면서도 메모리 사용량을 40% 절감하는 데 성공했으며 지포스 RTX와 같은 일반 소비자용 GPU에서도 동작시킬 수 있게 됐다.
블랙포레스트랩스 측은 자사는 세상을 보고 이해하는 방식을 변혁하는 기술 그러니까 비주얼 인텔리전스 기반이 되는 인프라를 구축하고 있다며 FLUX.2는 지각, 생성, 기억, 그리고 추론을 개방적이고 투명성 높은 방식으로 통합하는 멀티모달 모델로의 한 걸음이 될 것이라고 밝혔다. 관련 내용은 이곳에서 확인할 수 있다.
![[AI서머리] 벤기협, 해외 SW 인재 매칭 페스티벌‧우아한청년들, 이륜차 LED 배달통 광고 실증특례 승인](https://startuprecipe.co.kr/wp-content/uploads/2025/11/251127_kova.or_.kr_050320235-75x75.jpg)

