Le StyleGAN de Nvidia pourrait révolutionner de nombreuses industries créatives

Le StyleGAN de Nvidia pourrait révolutionner de nombreuses industries créatives

Nvidia (un client de l'auteur) a fait beaucoup de choses passionnantes ces derniers temps, de la création de postes de travail conçus pour concevoir le métaverse, aux assistants numériques qui évoluent en jumeaux numériques humains, aux outils qui pourraient permettre à n'importe qui de créer un art convaincant. L'un des outils les plus intéressants est Generator StyleGAN, qui crée les visages des gens en mélangeant des images.

L'ensemble de formation pour cette offre basée sur l'IA contient 70 000 images PNG de haute qualité (chacune avec une résolution de 1024 x 1024 pixels) qui offrent à l'utilisateur une flexibilité presque illimitée du matériel source.

StyleGAN existe depuis 2018, est devenu plus largement disponible en 2019 lorsque le code source est devenu open source, et en est maintenant à sa troisième permutation. StyleGAN3 est sorti en octobre dernier.

Les avantages pour ceux d'entre nous qui travaillent avec des images incluent la capacité potentielle de créer des images à partir de vastes pools d'images sources protégées par le droit d'auteur sans faire face à des problèmes de droit d'auteur ni se soucier d'une violation du droit d'auteur. Et au fur et à mesure que le processus évolue pour inclure d'autres images (il s'agit essentiellement d'un moteur de fusion d'images), il pourrait vous permettre de mélanger des photos professionnelles provenant de diverses sources pour créer des images uniques et magnifiques ou des peintures créées de mémoire ou d'imagination avec peu ou pas d'effort. à quelque chose de réel.

Un outil de mélange d'images basé sur l'IA comme StyleGAN pourrait radicalement changer et améliorer un certain nombre d'industries et de pratiques (ou être utilisé pour des "deep fakes" plus néfastes). Nous allons explorer.

Des dessinateurs de crime automatisés ?

Je vois beaucoup de procès criminels à la télévision; il y a généralement un segment où quelqu'un s'assoit en face d'un dessinateur pour créer une image d'un criminel qu'il a observé. Tout ce processus pourrait être automatisé par une IA conversationnelle. Le témoin peut voir une image évolutive avec des exemples de caractéristiques qui sont mélangées à la demande jusqu'à ce que l'image corresponde à la mémoire de la victime. Le résultat final serait une image photoréaliste qui pourrait être utilisée par les programmes de reconnaissance faciale pour localiser rapidement le délinquant. (Le dommage collatéral serait qu'il n'y aurait pas besoin de dessinateurs d'application de la loi.)

Un domaine où cette technologie pourrait avoir un grand impact est la localisation des enfants kidnappés. L'IA pourrait vieillir rapidement l'image de l'enfant afin qu'il soit mieux identifié plus tard dans la vie.

Marketing, télévision et cinéma

De nombreux supports marketing utilisent des images de stock ou des modèles de production. Le problème avec le premier est que ces mêmes images peuvent être utilisées dans d'autres campagnes, reliant par inadvertance des campagnes disparates. Par exemple, si la même image est utilisée dans une publicité pour un médicament et un restaurant, les clients peuvent associer les deux et éviter le restaurant. Le même problème pourrait résulter de l'utilisation d'un modèle vivant qui se retrouve ensuite dans une autre campagne, car certains acteurs et modèles se déplacent entre les candidats. Et les modèles/acteurs vivants peuvent avoir des problèmes personnels qui peuvent nuire à une marque ou à une campagne publicitaire.

Mais l'utilisation d'images et de vidéos combinées à partir de quelque chose comme StyleGAN signifie que vous pouvez créer une image qui peut être protégée par le droit d'auteur de votre entreprise, unique à partir de n'importe quelle image de stock, et non liée à un acteur ou un modèle, vivant ou mort. Le résultat est un coût moindre et, plus important encore, un risque moindre. Vous obtiendrez des résultats plus rapidement et le besoin de modèles et d'acteurs serait réduit. Vous ne pouvez utiliser que des acteurs dans des combinaisons d'images 3D qui cachent leur identité, et avec les progrès des outils de métaverse et des lecteurs d'images 3D, vous n'en aurez peut-être même pas besoin. Cela nous rapproche également de ne pas avoir besoin d'acteurs pour les films.

Des jumeaux numériques humains ?

Un autre domaine que Nvidia explore consiste à créer des jumeaux numériques pour le métaverse. Et à mesure que l'IA derrière ces jumeaux s'améliore, ils deviendront plus indiscernables du matériel source. Lorsque cela se produit, à qui appartient le résultat ? Vous pouvez affirmer qu'un employé devrait posséder son jumeau numérique. Mais si un outil comme StyleGAN est utilisé pour mélanger les images et les compétences d'un employé, cette position devient plus précaire ; une entreprise pourrait être en mesure de défendre sa propriété contre le résultat. (J'espère que les futurs employés et syndicats auront des problèmes majeurs avec quelque chose comme ça utilisé pour déplacer des employés sans compensation.

un avenir mitigé

La possibilité de remixer à grande échelle du matériel source qui peut (ou non) être protégé par le droit d'auteur est convaincante, surtout si cela supprime les problèmes juridiques potentiels. Le processus de Nvidia utilise une source d'image vérifiée qui élimine l'exposition légale, mais des outils comme celui-ci ne devraient pas s'appuyer uniquement sur des bases de données de photos ; pourrait être utilisé dans des images de personnalités publiques tirées de publications sur les réseaux sociaux, de films ou d'autres supports publicitaires.

À un moment donné, j'espère que cette technologie forcera une réécriture des lois sur le droit d'auteur concernant les images composites. En même temps, ils réduiraient les efforts et les coûts nécessaires pour créer des images et des films photoréalistes pouvant être utilisés dans les affaires et le divertissement. Il s'agit d'un exemple précoce de changements majeurs dans les pratiques commerciales actuelles et les revenus associés pour ceux qui travaillent comme mannequins, acteurs ou réalisateurs, et pour les artistes chargés de créer des images qui définissent des événements mémorables.

Des outils comme StyleGAN redéfiniront l'avenir des médias virtuels pour les entreprises, le gouvernement et le divertissement.

Copyright © 2022 IDG Communications, Inc.