El 'Cuerpo' en la Era de la IA: ¿Cómo Enfocarlo?

El fin de semana pasado, Open AI lanzó un nuevo servicio llamado Sora. Sora permite crear videos de IA a partir de texto, y desde su lanzamiento ha recibido elogios de los críticos. Los videos de demostración que se publicaron, creados con unas pocas líneas de texto simples, muestran un nivel de realismo comparable a las escenas planeadas, dirigidas y filmadas en comerciales o películas. Por ejemplo, se muestra un video en cámara lenta de un hombre de mediana edad comiendo una hamburguesa y una toma cenital de una calle japonesa con dos personas caminando.

En el informe técnico que publicó el mismo día, Open AI describió a Sora como un simulador de mundo.Si la abstracción tan realista que permite esta tecnología es posible gracias a la conexión entre la abstracción a través del texto y el espacio de parámetros, esto tendrá un impacto enorme en la capacidad de razonamiento de los futuros modelos GPT. Su significado es inmenso en términos de la influencia de la IA en la sociedad humana.

https://play-tv.kakao.com/embed/player/cliplink/rv4bqfvi1rq49f96sh1gmfm02@my?service=daum_brunch&section=article&showcover=1&showinfo=0&extensions=0&rel=0

Indicación: Escena de una persona corriendo impresa paso a paso, filmada en 35 mm con estilo cinematográfico.

Sin embargo, Sora todavía tiene muchas limitaciones. Por ejemplo, en un video se ve a una persona dando un mordisco a una galleta, pero la marca del mordisco desaparece posteriormente; en otro video, una persona corre en una cinta de correr mirando hacia atrás en lugar de hacia el panel de control, con movimientos de brazos y piernas torpes. Estos ejemplos demuestran que Sora aún no puede comprender y representar con precisión los detalles espaciales proporcionados en el prompt del usuario, ni los cambios que ocurren con el tiempo. Esta dificultad para representar casos de causa y efecto, así como la física en escenas complejas, es una prueba de que la IA aún no comprende el mundo de manera adecuada. Sin embargo, considerando el anuncio de 2023 sobre un contrato con Shutter Stock, que posee 35 millones de imágenes y videos de alta resolución, para entrenar aún más la IA durante seis años, no es difícil predecir que las imágenes y videos generados por IA se acercarán cada vez más al nivel de calidad de los producidos por humanos en un futuro cercano.

El arqueólogo británico David Wengrow, en su libro 'The Origins of Monsters' (Los orígenes de los monstruos) publicado en 2013, argumenta que desde el antiguo Egipto hasta la civilización mesopotámica y la Edad del Hierro del Mediterráneo, en los periodos en que las ciudades se formaban, las civilizaciones florecían y las redes políticas y comerciales se expandían, no existía región alguna donde no se crearan y difundieran imágenes visuales de criaturas fantásticas y complejas que no existían en la realidad.

El 'Cuerpo' en la Era de la IA: ¿Cómo Enfocarlo?

Imágenes de criaturas fantásticas de los túmulos de Pazyryk y Tuekta, sur de Rusia

Se dice que representaciones gráficas de criaturas compuestas como la grifo (con cuerpo de león, cabeza y alas de águila) o el minotauro (con cuerpo humano y cabeza de toro) fueron registradas en murales y documentos por personas de la época y difundidas a través de rutas comerciales expandidas para justificar el estatus de élite de entonces. Este fenómeno de separar y recombinar diferentes extremidades u otras características de diversas especies para crear imágenes de entidades que respondían a un mundo ampliado e invisible se puede interpretar como una consecuencia de la creciente especialización del trabajo, que obligó a las personas a reconocerse como 'partes' en lugar de la 'totalidad' que representaba la perspectiva centrada en las relaciones familiares en las actividades productivas, dentro de un contexto de cambio social y expansión. En otras palabras, el descubrimiento de la relación entre la creación de compuestos, el avance tecnológico y la autoconciencia es uno de los mensajes que Wengrow busca transmitir.

Desde el año pasado, hemos presenciado innumerables imágenes interesantes y extrañas a través de programas de generación de imágenes de IA como Midjourney y DALL-E, que muestran a Spiderman en una estatua romana, a un astronauta cabalgando sobre un caballo en la superficie lunar, o un robot con tres brazos pintando. Ahora, con el lanzamiento de Sora, la proliferación de videos generados por IA se acelerará. Lo importante es que la descripción de monstruos, es decir, compuestos, y su difusión social, que se repite en los registros de la historia de la humanidad desde sus inicios, se está reproduciendo en la era actual de la IA generativa.Esta tendencia se puede definir como el 'vibe' (ambiente, atmósfera) que envuelve al mundo en esta época, una expresión que va más allá de la simple etiqueta de 'moda'.Si bien esta expresión no es nueva, parece que nos encontramos en un punto de inflexión hacia la era de la IA, por lo que es necesario tomarse en serio esta tendencia y comprender su significado.

Los videos cortos en YouTube y TikTok, plataformas donde no existen argumentos ni explicaciones extensas y que se caracterizan por su alto consumo y adicción, son un ejemplo deel consumo social de imágenes descontextualizadas.Las imágenes poéticas, cada vez más instantáneas y asociativas, han ganado importancia, lo que implica quese ha invertido la perspectiva tradicional sobre la interpretación de la información, es decir, lo que se considera información.

En resumen,no se trata de qué ver, sino de cómo ver.

Es necesario adoptar un enfoque diferente, más semántico y analítico, para comprender las tendencias y fenómenos relacionados con el cuerpo humano. En una época en la que la filosofía de las marcas de lencería que defienden la expresión natural y segura de diferentes tipos de cuerpos ha logrado reconocimiento, frente a la estética de las legiones de modelos en las campañas de marketing de Guess y Calvin Klein, y en la que la imagen de unos labios con lápiz labial rosa, sin distinción de género, se convierte en una estrategia efectiva para llegar a los adolescentes, debemos recordar que el cuerpo humano está presente en cualquier reflexión sobre el futuro y desarrollo de la tecnología. La cuestión de cómo percibimos el cuerpo humano se volverá cada vez más compleja e importante en el futuro.

Referencias

Creación de video a partir de texto

Modelos de generación de video como simuladores de mundo

DALL-E de OpenAI se entrenará con la biblioteca de Shutterstock durante seis años más

Los orígenes de los monstruos

Comentarios0