Le nouveau modèle DALL.E d'OpenAI transforme vos mots en œuvres d'art

OpenAI, la startup de recherche sur l'IA, a annoncé (ouvre un nouvel onglet) DALL E 2, une mise à jour de son générateur de texte en image qui ressemble à un grand pas en avant.

Essentiellement, DALL·E 2 peut créer de l'art à partir d'entrées en langage naturel, telles que : "une peinture d'un renard assis dans un champ à l'aube dans le style de Claude Monet". OpenAI indique que l'objectif est de créer "des images et des illustrations originales et réalistes" qui peuvent "mélanger des concepts, des attributs et des styles".

C'est un exploit vraiment impressionnant pour une entreprise qui s'est lancée dans plusieurs initiatives d'IA, y compris GPT-3 (ouvre dans un nouvel onglet), qui peut produire une prose assez remarquable.

IA ouverte

(Crédit image : OpenAI)

Le document de recherche OpenAI qui l'accompagne explique beaucoup plus en détail le fonctionnement de DALL E 2. À l'aide de modèles CLIP contrastifs, DALL E 2 s'exécute en deux étapes : la première crée une image CLIP intégrée avec une légende de texte, et la seconde génère une image basée sur ce.

Les résultats sont très impressionnants et pourraient avoir d'énormes ramifications pour l'industrie de l'art et de la conception graphique, en particulier les studios de jeux vidéo, qui emploient actuellement des designers pour construire minutieusement des mondes et des concepts.

DALL·E 2 s'appuie sur le travail d'OpenAI avec DALL·E 1, qui a été annoncé (ouvre un nouvel onglet) en janvier 2021. Le nom est une combinaison de Salvador Dalí et WALL·E.

Un nouveau monde courageux

OpenAI est l'une des startups les plus passionnantes travaillant actuellement sur l'IA.

Fondée en 2015 par Elon Musk, Sam Altman, Ilya Sutskever et d'autres, l'objectif est de produire une "IA conviviale" qui profite à l'humanité dans son ensemble. La startup à but non lucratif est en concurrence avec DeepMind d'Alphabet.

DALL·E 2 est un très bon exemple de ce travail dans la pratique, repoussant les limites de ce qui est possible lorsqu'il s'agit de générer des images à l'aide de l'IA. Le service peut même éditer des images existantes selon les spécifications de l'utilisateur.

Il y a, bien sûr, un long chemin à parcourir. Les chercheurs ont noté que leurs bases CLIP peuvent être facilement amenées à étiqueter un élément comme un autre. Mais avec le temps, ces défauts seront résolus et améliorés.

OpenAI prévoit de publier prochainement DALL·E 2 pour sélectionner des chercheurs.