Ceci est un post traduit par IA.
Le « corps » à l’ère de l’IA : comment le considérer ?
- Langue de rédaction : Coréen
- •
- Pays de référence : Tous les pays
- •
- Technologies de l'information
Choisir la langue
Texte résumé par l'IA durumis
- OpenAI a dévoilé Sora, un nouveau service qui permet de créer des vidéos IA à partir de texte, ce qui permet de créer des vidéos réalistes grâce à l’abstraction par le texte et la liaison avec l’espace des paramètres.
- Bien que Sora ait encore des limites, OpenAI prévoit de créer des vidéos encore plus réalistes grâce à 6 ans d’apprentissage de l’IA. Comme le montre le film « L’Origine du mal », les images et les vidéos générées par l’IA joueront un rôle essentiel dans la communication sociale.
- En particulier, avec le phénomène de consommation sociale d’images décontextualisées, il est nécessaire de changer non pas ce que nous regardons, mais comment nous regardons, et la question du corps humain devient de plus en plus complexe et importante lorsqu’il s’agit de discuter de l’avenir de la technologie.
Le week-end dernier, Open AI a dévoilé son nouveau service Sora. Sora est un service permettant de créer des vidéos d'IA à partir de texte, et il a été salué par les critiques dès sa sortie. Les démonstrations vidéo publiées avec quelques lignes de texte simples, comme une vidéo au ralenti d'un homme d'âge moyen mangeant un hamburger, une prise de vue en plongée d'une rue japonaise où deux personnes marchent, etc., offrent un niveau de réalisme comparable à celui de scènes de films ou de publicités qui ont été planifiées, mises en scène et filmées.
Open AI a qualifié Sora de "simulateur mondial" dans un rapport technique publié le même jour.L'abstraction par le texte et la connexion avec l'espace des paramètres rendent possible un niveau d'abstraction aussi réaliste. Cela aura un impact énorme sur les capacités d'inférence des modèles GPT à venir, et cela signifie qu'il est impossible d'évaluer l'impact de l'IA sur la société humaine.
Invite : Scène d’impression pas à pas d’une personne courant, prise de vue cinématographique en 35 mm.
Cependant, Sora présente encore de nombreuses limites. Par exemple, un homme mord dans un biscuit, mais la marque de la morsure disparaît ensuite. Ou un homme court sur un tapis roulant, mais il regarde vers l'arrière plutôt que vers l'avant, où se trouve le tableau de bord, et ses mouvements de bras sont maladroits. Cela montre que l'IA n'est pas encore capable de comprendre et de montrer avec précision les détails spatiaux d'une invite donnée par l'utilisateur, ni les changements qui se produisent dans le temps. L'incapacité de l'IA à relier cause et effet, ainsi que la difficulté de mettre en œuvre la physique dans des scènes complexes, sont également des signes qu'elle ne comprend toujours pas le monde comme il faut. Cependant, compte tenu de l'annonce de 2023 d'un partenariat avec Shutterstock, qui possède 35 millions de photos et de vidéos haute résolution, pour former l'IA pendant six années supplémentaires, il n'est pas difficile de prévoir que les images et les vidéos générées par l'IA se rapprocheront de plus en plus du niveau de qualité des productions humaines.
En 2013, l'archéologue britannique David Wengrow a publié un livre intitulé "L'origine des monstres". Il soutient que des images visuelles de créatures fantastiques et complexes ont été produites et diffusées dans toute l'Égypte primitive, la civilisation mésopotamienne et l'âge du fer méditerranéen.
Images de créatures fantastiques provenant des kourganes de Pazyryk et de Tuoekta, dans le sud de la Russie
Les descriptions graphiques de créatures hybrides comme le griffon, un corps de lion surmonté d'une tête et d'ailes d'aigle, ou le Minotaure, un corps humain avec une tête de taureau, ont été enregistrées sur des fresques et des documents par les habitants de l'époque, et se sont répandues le long des routes commerciales élargies afin de légitimer l'élite de l'époque. Le fait de séparer les membres ou d'autres caractéristiques de différentes espèces et de les recombiner pour créer une image d'une entité qui correspond au monde élargi invisible est une manifestation de la transformation sociale, où le point de vue selon lequel les membres de la famille sont "tout" dans la production est étendu. L'augmentation du travail en équipe avec des personnes inconnues, résultant de la division du travail, a fait prendre conscience à la fois de sa propre "partie" et de la peur qui en a résulté. En d'autres termes, la création d'hybrides et le lien entre la découverte de la conscience de soi et le développement technologique sont au cœur du message qu'il souhaite transmettre.
Depuis l'année dernière, nous avons déjà vu d'innombrables images intéressantes mais bizarres générées par des logiciels de génération d'images d'IA comme Midjourney et DALL-E, telles qu'une statue de Spider-Man de l'époque romaine, un astronaute montant un cheval sur la surface de la Lune, ou un robot avec trois bras qui peint. Avec la sortie de Sora, la diffusion de vidéos générées par l'IA va encore s'accélérer. Le plus important, c'est que la description de monstres, c'est-à-dire d'hybrides, et leur transmission sociale, qui se répète avec les archives de l'histoire humaine primitive, sont reproduites à l'ère de la génération d'IA.Cette tendance est ce qu'on pourrait appeler la "vibe" de cette époque, un sentiment qui englobe le monde et qui va bien au-delà de la simple expression "tendance".Cette expression n'est pas nouvelle, mais nous semblons être à un point d'inflexion remarquable dans notre passage à l'ère de l'IA. Nous devons donc prendre cette tendance au sérieux.
Le format long des arguments et des explications n'existe pas. Le format long des arguments et des explications n'existe pas. Les vidéos courtes sur YouTube et TikTok, les plus consommées et les plus addictives,démontrer la consommation sociale d'images décontextualisées.Les images poétiques instantanées et associatives sont devenues de plus en plus importantes, ce qui signifie queles points de vue traditionnels sur l'interprétation qui indiquent ce qui est considéré comme de l'information sont renversés.
En bref,il ne s'agit pas de savoir quoi regarder, mais comment regarder.
Nous devons choisir une approche différente, plus sémantique et analytique, des tendances et des phénomènes liés au corps. C'est une époque où l'esthétique de l'armée de mannequins dans les campagnes marketing de Guess et de Calvin Klein est reconnue, où la philosophie de marques de lingerie qui célèbrent la diversité des corps est reconnue, et où une image de lèvres roses sur une bouche, sans savoir s'il s'agit d'un homme ou d'une femme, est devenue un symbole efficace de stratégie de communication auprès des adolescents. Lorsque nous imaginons l'avenir de la technologie et que nous discutons de son développement, le corps humain est toujours présent. La question de savoir comment regarder le corps humain deviendra de plus en plus complexe et importante à l'avenir.
Références