[논문 리뷰] High-Resolution Image Synthesis with Latent Diffusion Models

Query (Q): UNet 내부의 중간 특징 맵(이미지 정보)에서 생성됩니다. "이미지의 어느 부분에 어떤 정보를 채워야 할까?"라는 질문 역할
Key (K): 조건 데이터(y)를 전용 인코더(tau_theta)로 처리한 결과물에서 생성됩니다. "내가 가진 조건 정보들 중 어떤 키워드가 있을까?"라는 목록 역할을 합니다.
Value (V): Key와 마찬가지로 조건 데이터에서 생성되며, 실제 이미지에 반영될 세부 정보를 담고 있습니다.

2026. 1. 5. 14:54· 논문 리뷰

[논문 리뷰] Diffusion-Based Visual Art Creation_ A Survey and New Perspectives (0)	2026.01.06
[논문 리뷰] Enhancing Creative Generation on Stable Diffusion-based Models (0)	2025.12.31
[논문 리뷰] Depth Anything 3:Recovering the Visual Space from Any Views (0)	2025.12.30

1. 선행 지식