Cette IA fascinante va dessiner tout ce que vous lui demandez (et même au délà) !
La technologie est géniale, mais soyons honnêtes : elle est parfois un peu ennuyeuse. Les ordinateurs et les smartphones évoluent progressivement d’année en année, les logiciels se transforment en abonnements et l’innovation, en général, n’est pas si courante. De temps en temps, cependant, un nouveau développement technologique est réellement surprenant et excitant. C’est ce que je ressens à propos de cette nouvelle IA, qui dessine presque tout ce que vous lui lancez.
Il s’agit du logiciel DALL-E 2, développé par OpenAI, qui utilise l’apprentissage automatique pour générer de nouvelles images à partir d’une description textuelle fournie par l’utilisateur. Vous pouvez voir des exemples de ce fonctionnement sur le site web : Les développeurs vous permettent de mélanger et d’associer différents sujets, actions et paramètres pour voir comment DALL-E 2 produit différentes images à partir de ces descriptions.
Par exemple, « un astronaute à cheval dans un style photoréaliste » génère des images de ce type, ce qui donne différentes « photos » d’un astronaute à cheval qui ressemblent à des images promotionnelles de MTV. Remplacez « style photoréaliste » par « dessin au crayon » et vous vous retrouvez soudain face à ce qui semble être de multiples croquis de cet astronaute sur son destrier, mais personne n’a réellement dessiné quoi que ce soit – c’est entièrement produit par l’IA.
Mais cela va bien au-delà de ces démonstrations techniques impressionnantes. D’après les tests que j’ai vus, l’IA peut accepter les demandes les plus détaillées et produire des images que vous pourriez voir dans un musée d’art moderne. La réalisatrice Karen X Chang en a fait la démonstration, en demandant d’abord à DALL-E 2 de dessiner une fille montant un escalier à l’infini, ce qu’il a fait avec aisance, puis en demandant à DALL-E 2 de dessiner une fille montant un escalier à l’infini dans les nuages faits de biscuits, ce qu’il a également fait, avec aisance.
En lien avec cet article : La Russie redirige le trafic Interne Ukrainien dans les territoire occupée vers son infrastructureComment fonctionne DALL-E 2
Le projet a réellement démarré en janvier 2021 avec DALL-E. L’objectif était le même que pour DALL-E 2, à savoir créer un programme capable de générer de nouvelles images à partir de texte. Depuis lors, OpenAI a trouvé le moyen d’améliorer considérablement la qualité de l’image, réintroduisant le logiciel sous le nom de DALL-E 2.
Les développeurs de DALL-E 2 entraînent le système en utilisant des images étiquetées. DALL-E 2 a probablement vu des milliers d’images de voitures étiquetées « voiture », de maisons étiquetées « maison », de cafés étiquetés « café », etc. Il utilise cette base de connaissances pour deviner au mieux ce que vous demandez. S’il a reçu suffisamment d’entraînement pour connaître chaque élément de votre description, vous obtiendrez des images remarquablement précises de choses que vous n’avez jamais vues auparavant, comme un « singe qui fait ses impôts en portant un drôle de chapeau ».
De nombreux programmes d’apprentissage automatique fonctionnent de cette manière, mais l’une des différences avec DALL-E 2 est qu’il est capable de « remplir les blancs », comme le dit OpenAI. Essentiellement, DALL-E 2 examine votre description textuelle et réfléchit au contexte que vous n’avez pas fourni. Si vous demandez un « chien jouant au basket dehors », il va supposer que vous voulez parler d’un terrain de basket, que l’on peut trouver autour d’un parc, ce qui signifie que vous devriez voir des arbres, de l’herbe, un ciel, etc.
Cela dit, l’équipe de DALL-E 2 admet ouvertement qu’il existe des lacunes dans les connaissances du système, ce qui peut donner lieu à des découvertes intéressantes et perspicaces. Si le système n’a pas été formé aux « singes hurleurs », le fait de lui demander de dessiner un « singe hurleur » peut donner lieu à des images de singes hurleurs, plutôt que du type de singe recherché.
L’application de DALL-E 2 va au-delà de la génération de nouvelles images. Vous pouvez utiliser l’outil comme un éditeur de photos alimenté par l’IA, en supprimant les éléments des images que vous n’aimez pas ou en ajoutant de nouveaux composants qui n’ont jamais existé. Il peut également générer de nouvelles images à partir d’images existantes : Si vous devez peindre la Joconde, mais que vous ne savez pas peindre, DALL-E 2 vous donne l’impression que vous pouvez le faire.
En lien avec cet article : À qui doit revenir le financement des réseaux ? Les opérateurs ont leur petite idée !Les développeurs de DALL-E 2 tiennent à ce que DALL-E 2 ne soit pas utilisé à mauvais escient, notamment pour générer des images fondées sur la haine ou la violence. C’est pourquoi l’équipe a ouvert le logiciel à un groupe limité de « testeurs de confiance », mais elle invitera éventuellement d’autres personnes à tester DALL-E 2 par elles-mêmes.
Cela dit, il n’y a pas de calendrier précis à ce sujet, ni d’explication sur ce qu’est un « testeur de confiance ». Si vous êtes intéressé, vous pouvez vous inscrire dès maintenant sur la liste d’attente de DALL-E 2 (je me suis inscrit au moment de la rédaction de cet article). Si vous répondez aux critères d’OpenAI, peut-être aurez-vous l’occasion de tester DALL-E 2 par vous-même.