Il corpo nell'era dell'IA: come osservarlo

Lo scorso weekend, Open AI ha rilasciato un nuovo servizio chiamato Sora. Sora consente di creare video AI inserendo del testo, e fin dal suo lancio ha ricevuto elogi da parte dei recensori. I video dimostrativi rilasciati, creati con poche righe di testo, mostrano un realismo di alto livello, paragonabile a scene progettate, dirette e filmate per spot pubblicitari o film. Tra gli esempi, si vedono un uomo di mezza età che mangia un hamburger in slow motion e una ripresa dall'alto di una strada giapponese con due persone che camminano.

Nello stesso giorno, Open AI ha pubblicato un rapporto tecnico in cui descrive Sora come un "world simulator" (simulatore di mondo).Se l'astrazione tramite testo e la connessione con lo spazio dei parametri permettono di raggiungere un livello di astrazione così realistico, ciò avrà un impatto enorme sulle capacità di ragionamento dei futuri modelli GPT. Il significato di questo evento, in termini di influenza dell'intelligenza artificiale sulla società umana, è davvero enorme.

https://play-tv.kakao.com/embed/player/cliplink/rv4bqfvi1rq49f96sh1gmfm02@my?service=daum_brunch&section=article&showcover=1&showinfo=0&extensions=0&rel=0

Prompt: Scena di una persona che corre in stile step-printing, ripresa cinematografica in 35mm.

Tuttavia, Sora presenta ancora molti limiti. Ad esempio, in un caso una persona morde un biscotto, ma in seguito il segno del morso scompare; in un altro, una persona corre su un tapis roulant, ma guarda verso il retro anziché verso il pannello di controllo, con movimenti delle braccia e delle gambe innaturali. Questi esempi dimostrano che Sora non riesce ancora a comprendere e rappresentare con precisione i dettagli spaziali forniti dal prompt dell'utente e i cambiamenti che si verificano nel tempo. La difficoltà nell'esprimere connessioni causa-effetto e nella simulazione della fisica in scene complesse suggerisce che l'intelligenza artificiale non ha ancora una piena comprensione del mondo. Tuttavia, considerando l'annuncio del 2023 di un accordo con Shutter Stock, che prevede l'addestramento dell'intelligenza artificiale con 35 milioni di foto e video ad alta risoluzione per i prossimi 6 anni, non è difficile prevedere che le immagini e i video generati dall'intelligenza artificiale si avvicineranno sempre più alla qualità di quelli creati dagli esseri umani.

L'archeologo britannico David Wengrow, nel suo libro "Le origini dei mostri" (Origins of Monsters), pubblicato nel 2013, sostiene che, a partire dall'Egitto primitivo, passando per la civiltà mesopotamica e l'età del ferro nel Mediterraneo, in tutti i periodi in cui le città si sono formate, le civiltà si sono sviluppate e le reti politiche e commerciali si sono espanse, non è esistita alcuna area geografica in cui non si siano diffuse immagini visive di creature fantastiche e ibride non realistiche.

Il corpo nell'era dell'IA: come osservarlo

Immagini di creature fantastiche provenienti dai kurgan di Pazyryk e Tuekta, Russia meridionale

Rappresentazioni grafiche di creature composite come la grifone (con il corpo di un leone, la testa e le ali di un'aquila) o il minotauro (con il corpo umano e la testa di un toro) sono state realizzate e registrate su murales e documenti dagli abitanti di quel periodo, e diffuse lungo le rotte commerciali espanse per legittimare il potere delle élite. Il fenomeno di separare e ricombinare diverse parti del corpo o altre caratteristiche di diverse specie per creare immagini di entità che corrispondono a un mondo esteso invisibile può essere interpretato come una conseguenza del passaggio da una visione del mondo incentrata sul nucleo familiare come "totalità" a una società più ampia e complessa. La crescente divisione del lavoro con persone mai incontrate prima ha portato a una consapevolezza di sé come "parte" e alla conseguente paura. In altre parole, una delle tesi che Wengrow vuole trasmettere è che la creazione di oggetti composti e la scoperta della consapevolezza di sé in relazione al progresso tecnologico sono strettamente correlate.

Già dallo scorso anno, tramite programmi di generazione di immagini AI come Midjourney e DALL-E, abbiamo potuto vedere innumerevoli immagini interessanti ma bizzarre che vanno oltre i limiti del corpo umano, come una statua di Spider-Man in epoca romana, un astronauta a cavallo che attraversa la superficie lunare o un robot con tre braccia che dipinge. E con il rilascio di Sora, la diffusione di video generati dall'intelligenza artificiale accelererà ulteriormente. Ciò che è importante è che la descrizione di mostri, ovvero di oggetti composti, e la loro diffusione sociale, che si ripete nella storia dell'umanità fin dai tempi antichi, si sta verificando anche nell'era attuale dell'intelligenza artificiale generativa.Questo trend può essere definito come una "vibe" (atmosfera) che avvolge il mondo di oggi, un concetto che va oltre la semplice definizione di tendenza.Anche se non è un termine nuovo, riteniamo che ci troviamo in un punto di svolta significativo nel nostro percorso verso l'era dell'intelligenza artificiale, e per questo motivo è necessario prendere questa tendenza più seriamente.

I video brevi su YouTube e TikTok, dove non è possibile presentare argomentazioni o spiegazioni lunghe e complesse, sono un esempio diconsumo sociale di immagini decontestualizzate.Le immagini poetiche, istantanee e associative sono diventate sempre più importanti, il che significa cheè stato sovvertito il tradizionale punto di vista che definisce cosa si considera informazione e la relativa interpretazione.

In breve,non è più importante cosa si guarda, ma come si guarda.

È necessario adottare un approccio diverso, più semantico e analitico, per esaminare i trend e i fenomeni legati al corpo umano. In un'epoca in cui la filosofia di marchi di lingerie che celebrano l'unicità di ogni corpo, senza l'estetica stereotipata delle modelle nelle campagne pubblicitarie di Guess o Calvin Klein, viene riconosciuta e in cui l'immagine di labbra rosa con rossetto, senza distinzione di genere, diventa un'efficace strategia di marketing per i teenager, è necessario ripensare il modo in cui analizziamo il corpo umano. Quando immaginiamo il futuro della tecnologia e ne discutiamo, l'elemento umano, il corpo umano, è sempre presente. La questione di come guardare al corpo umano diventerà sempre più complessa e importante.

Riferimenti

Creazione di video da testo

Modelli di generazione video come simulatori di mondo

DALL-E di OpenAI verrà addestrato sulla libreria di Shutterstock per altri sei anni

Le origini dei mostri

Commenti0