Content Creation / Rendering

NVIDIA TensorRT로 가속화된 새롭고 안정적인 확산 모델

Reading Time: 2 minutes

CES에서 NVIDIA는 SDXL Turbo, LCM-LoRA 및 Stable Video Diffusion이 모두 NVIDIA TensorRT에 의해 가속화되고 있다고 발표했습니다. 이러한 향상된 기능을 통해 GeForce RTX GPU 소유자는 실시간으로 이미지를 생성하고 비디오 생성 시간을 절약하여 워크플로우를 크게 개선할 수 있습니다.

비디오 1. NVIDIA RTX GPU를 통한 안정적인 배포 가속화

SDXL Turbo

SDXL Turbo는 새로운 증류 기술로 최첨단 성능을 구현하여 단일 단계로 이미지를 생성할 수 있습니다. Tensor 코어와 TensorRT로 가속화된 NVIDIA 하드웨어는 초당 최대 4개의 이미지를 생성할 수 있어 사상 최초로 실시간 SDXL 이미지 생성에 액세스할 수 있습니다. 비상업적 및 상업적 사용에 대한 자세한 내용은 Stability AI 멤버십 페이지를 참조하세요.

Hugging Face에서 SDXL Turbo 모델을 다운로드하세요.

LCM-LoRA

낮은 순위 적응(LoRA)은 안정 확산(Stable Diffusion) 모델을 파인 튜닝하기 위한 훈련 기법입니다. 잠재 일관성 모델(LCM)과 결합된 LoRA 체크포인트를 사용하면 안정적 확산 이미지를 생성하는 데 필요한 샘플링 단계의 수를 대폭 줄일 수 있습니다. 따라서 이미지 품질이 저하되는 대신 속도가 크게 향상됩니다. LCM-LoRA는 기존 50단계에 비해 4단계만 사용하고 TensorRT 최적화를 통해 속도가 빨라지므로 최대 9배 더 빠르게 실행할 수 있습니다.

Hugging Face에서 LCM-LoRA 모델을 다운로드하세요.

스테이블 비디오 디퓨전(Stable Video Diffusion)

스테이블 비디오 디퓨전은 이미지 모델인 Stability AI를 기반으로 한 생성형 비디오를 위한 첫 번째 기반 모델입니다. 스테이블 비디오 디퓨전은 TensorRT를 통해 최대 40% 더 빠르게 실행되며, 세대당 최대 몇 분을 절약할 수 있습니다. 비상업적 및 상업적 사용에 대한 자세한 내용은 Stability AI 멤버십 페이지를 참조하세요.

스테이블 비디오 디퓨전 모델은 곧 다운로드할 수 있습니다.

스테이블 디퓨전 시작하기

Stable Diffusion 웹 UI TensorRT 확장 프로그램을 다운로드하려면 NVIDIA/Stable-Diffusion-WebUI-TensorRT GitHub 리포지토리를 참조하세요. 이 확장 기능에 대한 새로 릴리스된 업데이트에는 SDXL, SDXL Turbo 및 LCM-LoRA를 위한 TensorRT 가속이 포함됩니다.

Stable Diffusion 파이프라인의 가속화를 보여주는 데모는 NVIDIA/TensorRT를 참조하세요. 자동 1111 TensorRT 확장에 대한 자세한 내용은 안정적 확산 웹 UI를 위한 TensorRT 확장을 참조하세요.

생성형 AI 기반 Windows 앱 또는 플러그인에 대한 아이디어가 있으신가요? RTX PC의 NVIDIA 생성형 AI 개발자 콘테스트에 참가하여 GeForce RTX 4090 GPU, GTC 오프라인 컨퍼런스 입장권 등을 받을 수 있습니다.

관련 리소스

GTC 세션: 세계에서 가장 빠르고 안정적인 확산
GTC 세션: 데스크톱과 워크스테이션에서 추론 성능 최적화 및 새로운 LLM 기능 통합하기
GTC 세션: 확산 모델: 생성형 AI 빅뱅
SDK: cuSOLVER
웨비나: 가속화된 크리에이티브 AI – 미디어 및 엔터테인먼트에 최적화된 NVIDIA 이미지 생성 활용하기
웨비나: 더 빠른 추론을 위해 AI 모델을 최적화하는 방법

Discuss (0)

Tags