이미지 생성 AI . Stable Diffusion

🤔 Stable Diffusion이란?

✅ ** Stable Diffusion 는 무작위 노이즈 이미지 로부터 역방향 확산을 통해 원하는 이미지를 생성하는 방식** 이다.

Stability AI의 공식 파트너사 AICU Inc. 에서 제공
Stable Diffusion XL(SDXL) 모델을 사용함.
AUTOMATIC1111/Stable Diffusion WebUI(v1.8.0)
디지털 일러스트레이션 제작할 때 쓰임
Google colab 활용 가능함.
SDXL에는 OpenAI 가 개발한 CLIP-ViT/L 과 오픈소스인 OpenCLIP-ViT/G , 테스트 데이터인 LAION 이 적용됨
잠재확산 모델(latent diffusion model): 잠재공간(latent spcae)으로 압축 하여 모델 학습, 노이즈 생성함.
Stable Diffusion 은 CLIP-ViT/L의 텍스트 인코더 부분을 활용해 프롬프트를 해석함.

자세한 설명 👉 Openai CLIP git 바로가기

✅ CLIP 는 텍스트와 이미지 사이의 의미와 관계성을 이해할수 있도록 훈련 받은 모델 이다.

✅ UNet 에서 노이즈 예측해 제거하는 과정에서 CLIP가 해석한 텍스트 지시를 조건으로 부여한다

✅ U-Net 는 잡음(조건외 부분) 예측기(noise predictor) 모델 이다.

UNet 을 통한 이미지 생성 작동 원리

# [딥러닝]StablityMatrix 사용하는 방법, AI 이미지 생성하기 (0)	2025.01.05
# [딥러닝] Stable diffusion 로컬 환경 구축 하기 (1)	2025.01.05
# [이미지] Fooocus 로 이미지 생성하는 법 (0)	2025.01.04