Ce nouveau tuto sur Dreambooth stable diffusion 1.5 vous permettra d’ajouter votre tête dans vos générations d’images générées par IA. C’est une mise à jour de l’ancien tuto avec les nouveaux points techniques pour pouvoir générer votre image. Vous pouvez retrouver ce tuto en vidéo.
Table des matières
- Colab de Dreambooth stable diffusion 1.5
- Token HuggingFace
- Configuration Settings and run
- Préparation de vos images
- Génération des photos
- Quelques exemples d’images générées avec ma tête
- Tuto dreambooth stable diffusion 1.5 en vidéo
Colab de Dreambooth stable diffusion 1.5
ll faut se rendre sur https://colab.research.google.com/github/ShivamShrirao/diffusers/blob/main/examples/dreambooth/DreamBooth_Stable_Diffusion.ipynb
Il faut se connecter à Google et suivre toutes les étapes une à une. Je vais expliquer les étapes les plus délicates.
Token HuggingFace
Il faut entrer son token. Il faut aller sur HuggingFace, créer un compte, valider que l’on accepte les conditions générales et copier votre token sur Colab.
<img decoding="async" width="756" height="160" src="https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream.jpg" alt="Tuto Dreambooth stable diffusion 1.5" class="wp-image-42729" srcset="https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream.jpg 756w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream-300x63.jpg 300w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream-293x62.jpg 293w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream-390x83.jpg 390w" sizes="(max-width: 756px) 100vw, 756px" title="Tuto Dreambooth stable diffusion 1.5 22" /> <img decoding="async" width="741" height="126" src="https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream2.jpg" alt="Tuto Dreambooth stable diffusion 1.5" class="wp-image-42730" srcset="https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream2.jpg 741w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream2-300x51.jpg 300w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream2-293x50.jpg 293w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream2-390x66.jpg 390w" sizes="(max-width: 741px) 100vw, 741px" title="Tuto Dreambooth stable diffusion 1.5 24" /> <img decoding="async" width="852" height="629" src="https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream3.jpg" alt="Tuto Dreambooth stable diffusion 1.5" class="wp-image-42731" srcset="https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream3.jpg 852w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream3-300x221.jpg 300w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream3-770x568.jpg 770w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream3-293x216.jpg 293w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/tokendream3-390x288.jpg 390w" sizes="(max-width: 852px) 100vw, 852px" title="Tuto Dreambooth stable diffusion 1.5 26" />Configuration Settings and run
Il faut valider que l’on sauvegarde ses données sur Google drive (pas obligatoire) et peut définir son répertoire où l’on créera son modèle.
<img decoding="async" width="865" height="455" src="https://paradoxetemporel.fr/wp-content/uploads/2022/11/image.jpg" alt="Tuto Dreambooth stable diffusion 1.5" class="wp-image-42732" srcset="https://paradoxetemporel.fr/wp-content/uploads/2022/11/image.jpg 865w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/image-300x158.jpg 300w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/image-770x405.jpg 770w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/image-500x263.jpg 500w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/image-293x154.jpg 293w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/image-390x205.jpg 390w" sizes="(max-width: 865px) 100vw, 865px" title="Tuto Dreambooth stable diffusion 1.5 28" />Plus bas, il faut configurer son projet en commentant quelques données (celles du chien) et en enlever les # pour celle d’un humain. On utilisera le mot clé toto pour nos images. J’aurai pu choisir n’importe quel autre mot bien entendu.
<img decoding="async" width="906" height="351" src="https://paradoxetemporel.fr/wp-content/uploads/2022/11/parametredreambooth2.jpg" alt="Tuto Dreambooth stable diffusion 1.5" class="wp-image-42734" srcset="https://paradoxetemporel.fr/wp-content/uploads/2022/11/parametredreambooth2.jpg 906w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/parametredreambooth2-300x116.jpg 300w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/parametredreambooth2-770x298.jpg 770w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/parametredreambooth2-293x114.jpg 293w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/parametredreambooth2-390x151.jpg 390w" sizes="(max-width: 906px) 100vw, 906px" title="Tuto Dreambooth stable diffusion 1.5 30" />Préparation de vos images
Il faut envoyer des images de votre visage au format 512×512. Plus il y en a plus le résultat sera meilleur.
<img decoding="async" width="1024" height="187" src="https://paradoxetemporel.fr/wp-content/uploads/2022/11/imagedreamboth-1024x187.jpg" alt="Tuto Dreambooth stable diffusion 1.5" class="wp-image-42735" srcset="https://paradoxetemporel.fr/wp-content/uploads/2022/11/imagedreamboth-1024x187.jpg 1024w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/imagedreamboth-300x55.jpg 300w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/imagedreamboth-770x141.jpg 770w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/imagedreamboth-293x54.jpg 293w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/imagedreamboth-390x71.jpg 390w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/imagedreamboth.jpg 1171w" sizes="(max-width: 1024px) 100vw, 1024px" title="Tuto Dreambooth stable diffusion 1.5 32" />Génération des photos
Il faut entrer le mot clé toto dans le prompt afin que notre visage s’affiche.
Exemple : portrait of toto a kratos, cinematic lighting, smooth, focus, cinematic, concept art, highly detailed, artstation, deviantart, behance trending, art by feng zhu, shaddy safadi, noah bradley, tyler edlin, jordan grimmer, darek zabrocki, neil blevins, tuomas korpi, wlop, artgerm
<img decoding="async" width="1024" height="204" src="https://paradoxetemporel.fr/wp-content/uploads/2022/11/generationdesphotos-1024x204.jpg" alt="Tuto Dreambooth stable diffusion 1.5" class="wp-image-42736" srcset="https://paradoxetemporel.fr/wp-content/uploads/2022/11/generationdesphotos-1024x204.jpg 1024w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/generationdesphotos-300x60.jpg 300w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/generationdesphotos-770x153.jpg 770w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/generationdesphotos-293x58.jpg 293w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/generationdesphotos-390x78.jpg 390w, https://paradoxetemporel.fr/wp-content/uploads/2022/11/generationdesphotos.jpg 1315w" sizes="(max-width: 1024px) 100vw, 1024px" title="Tuto Dreambooth stable diffusion 1.5 34" />