Sieć trenowana na parach (obrazek, tekst). Tekst i obrazek są embeddowane a odległość między nimi liczona przez cosine distance. Źródło: The Illustrated Stable Diffusion
Sieć trenowana na parach (obrazek, tekst). Tekst i obrazek są embeddowane a odległość między nimi liczona przez cosine distance. Źródło: The Illustrated Stable Diffusion