On m'a offert un tirage format carte postale d'une image faite avec midjourney. Les ombrés sont très franc et je me suis dit que ça pouvait être un bon exercice de le reproduire.
Si vous voulez retrouver la version originale, voici le lien vers l'insta du créateur :
https://www.instagram.com/unexpected_universe_/
Pour le débruitage est ce que nous, on le fait aussi ? Ou est ce propre à l’ordi ? :)
Pour le coup, cette étape étant son "outil" de génération, son pinceau si tu veux, je dirais qu'il lui est unique.
Pour la patte, il se passe quelque chose de différent sur ces modèles. Au cours des dernières années, ce qui a progressé, c'est les algos d'apprentissages, ils sont devenus meilleurs que ce qu'on avait, mais beaucoup moins bon qu'un humain, qui est capable d'apprendre des choses à partir de très peu d'exemples. Par contre ces algos fonctionnent vite, alors on compense en leur donnant cent mille fois plus d'infos d'apprentissage qu'un humain n'en reçoit.
Imagine que tu te sois entraîné à imiter le style de millions d'images avant qu'on te laisse faire la moindre chose toi même. Tu n'aurais pas juste une "patte", tu aurais appris ce qu'est une patte, ce qui fait un style et serait capable d'en imiter des tonnes d'autres. Ces modèles en sont là. Et bien sur, comme derrière les boites qui les entrainent, il y a quand même une pensée pour la rentabilité, ils trouvent que c'est une bonne chose et ne verraient pas l'intérêt de limiter l'apprentissage d'un modèle pour le rendre mono-style et lui donner une patte perso, mais c'est quelque chose qui en théorie devrait marcher: donne au modèle ou outil limité de style crayon, et demande lui de se rapprocher le plus possible de photos (une tâche impossible) et laisse le faire émerger les erreurs qu'il trouve acceptable, tu auras un style. Je pense que d'autres archis que les modèles de diffusion marcheraient mieux (des VAE peut-être?).
Je ne serais pas surpris qu'avec ces outils maturissant on voit émerger ce genre d'explorations plus artisitiques.
Pour le coup, cette étape étant son "outil" de génération, son pinceau si tu veux, je dirais qu'il lui est unique.
Pour la patte, il se passe quelque chose de différent sur ces modèles. Au cours des dernières années, ce qui a progressé, c'est les algos d'apprentissages, ils sont devenus meilleurs que ce qu'on avait, mais beaucoup moins bon qu'un humain, qui est capable d'apprendre des choses à partir de très peu d'exemples. Par contre ces algos fonctionnent vite, alors on compense en leur donnant cent mille fois plus d'infos d'apprentissage qu'un humain n'en reçoit.
Imagine que tu te sois entraîné à imiter le style de millions d'images avant qu'on te laisse faire la moindre chose toi même. Tu n'aurais pas juste une "patte", tu aurais appris ce qu'est une patte, ce qui fait un style et serait capable d'en imiter des tonnes d'autres. Ces modèles en sont là. Et bien sur, comme derrière les boites qui les entrainent, il y a quand même une pensée pour la rentabilité, ils trouvent que c'est une bonne chose et ne verraient pas l'intérêt de limiter l'apprentissage d'un modèle pour le rendre mono-style et lui donner une patte perso, mais c'est quelque chose qui en théorie devrait marcher: donne au modèle ou outil limité de style crayon, et demande lui de se rapprocher le plus possible de photos (une tâche impossible) et laisse le faire émerger les erreurs qu'il trouve acceptable, tu auras un style. Je pense que d'autres archis que les modèles de diffusion marcheraient mieux (des VAE peut-être?).
Je ne serais pas surpris qu'avec ces outils maturissant on voit émerger ce genre d'explorations plus artisitiques.