Questo è un post tradotto da IA.
Il 'corpo' nell'era dell'intelligenza artificiale: come guardarlo
- Lingua di scrittura: Coreana
- •
- Paese di riferimento: Tutti i paesi
- •
- Tecnologia dell'informazione
Seleziona la lingua
Testo riassunto dall'intelligenza artificiale durumis
- OpenAI ha rilasciato Sora, un nuovo servizio che crea video AI da input di testo, che consente di creare video realistici attraverso l'astrazione attraverso il testo e il collegamento con lo spazio dei parametri.
- Anche se Sora ha ancora dei limiti, OpenAI prevede di creare video ancora più realistici attraverso 6 anni di apprendimento dell'intelligenza artificiale. Come visto in The Monster's Origin, le immagini e i video generati dall'intelligenza artificiale svolgeranno un ruolo importante nella comunicazione sociale.
- In particolare, insieme al fenomeno del consumo sociale di immagini decontestualizzate, è necessario un cambiamento da cosa guardare a come guardare. Quando si discute del futuro della tecnologia, la domanda sul corpo umano diventa sempre più complessa e importante.
Il fine settimana scorso, Open AI ha rilasciato un nuovo servizio chiamato Sora. Sora consente agli utenti di creare video AI inserendo testo, il che ha portato a elogi da parte dei revisori subito dopo il rilascio. I video dimostrativi rilasciati con poche righe di testo semplici mostrano un livello elevato di realismo che rivaleggia con le scene girate, pianificate e dirette per spot pubblicitari o film, come un uomo di mezza età che mangia un hamburger in slow motion e una vista dall'alto di due persone che camminano per le strade giapponesi.
Lo stesso giorno, Open AI ha pubblicato un rapporto tecnico in cui Sora è definito un simulatore mondiale. L'astrazione tramite testo e la connessione con lo spazio dei parametri rendono possibile un'astrazione così realistica, il che avrà un impatto enorme sulla capacità di ragionamento dei modelli GPT in futuro, il cui significato è enorme in termini di influenza dell'IA sulla società umana.
Prompt: Scena di una persona che corre, stampata a passo, ripresa cinematografica in 35 mm.
Tuttavia, Sora presenta ancora molti limiti. Ad esempio, una persona morde un biscotto, ma il segno del morso scompare in seguito, o un uomo che corre su un tapis roulant guarda indietro invece che davanti al pannello di controllo e presenta movimenti degli arti imbarazzanti. Questo dimostra che l'IA ha ancora difficoltà a comprendere e rappresentare con precisione i dettagli spaziali all'interno di un prompt fornito dall'utente, i cambiamenti che si verificano nel tempo, ecc. Il fatto che l'IA abbia difficoltà a rappresentare casi di causa ed effetto collegati e ad implementare la fisica in scene complesse dimostra che l'IA non comprende ancora completamente il mondo. Tuttavia, considerando l'annuncio del 2023 secondo cui Open AI firmerà un accordo con Shutter Stock, che possiede 35 milioni di foto e video ad alta risoluzione, per addestrare ulteriormente l'IA per i prossimi sei anni, non è difficile prevedere che le immagini e i video generati dall'IA si avvicineranno sempre di più al livello di quelli realizzati dagli umani nel mondo reale.
L'archeologo britannico David Wengrow, nel suo libro "The Origins of Monsters" pubblicato nel 2013, sostiene che dalla civiltà egizia primitiva alle civiltà mesopotamiche e all'età del ferro nel Mediterraneo, durante la formazione delle città e il periodo di fioritura delle civiltà, con l'espansione delle reti politiche e commerciali, le immagini visive di creature fantastiche e complesse non realistiche sono state create e diffuse ovunque.
Immagini di creature fantastiche provenienti dai tumuli di Pazyryk e Tuekta, nella Russia meridionale
Descrizioni grafiche di mostri composti, come il grifone, con il corpo di un leone e la testa e le ali di un'aquila, o il Minotauro, con il corpo umano e la testa di un toro, sono state registrate da coloro che vivevano in quel periodo su diversi muri e documenti, e diffuse lungo i percorsi commerciali ampliati per legittimare il ruolo dell'élite. Questo fenomeno di separazione e ricombinazione di arti e altre caratteristiche di varie specie per creare immagini di entità che si riferiscono a un mondo espansivo invisibile riflette il cambiamento sociale dalla prospettiva di se stessi come "totalità" centrata sui legami familiari alla crescente divisione del lavoro con persone mai incontrate, riconoscendo se stessi come "parte" e portando a timore e paura. In altre parole, uno dei messaggi che Wengrow vuole trasmettere è che la relazione tra la scoperta della consapevolezza di sé e lo sviluppo tecnologico attraverso la creazione di compositi è correlata.
Già dall'anno scorso, attraverso programmi di generazione di immagini AI come Midjourney e DALL-E, abbiamo visto innumerevoli immagini interessanti e bizzarre che superano i limiti del corpo umano, come una statua di Spider-Man dell'epoca romana, un astronauta che cavalca la luna e un robot che disegna con tre braccia. E con il recente rilascio di Sora, la diffusione di più video generati dall'IA accelererà. La cosa importante è che la rappresentazione e la trasmissione sociale di mostri, ovvero compositi, si ripete nell'era della generazione di AI, così come nelle prime registrazioni della storia umana. Questa tendenza può essere definita "vibe" che avvolge il mondo di oggi, che è troppo pesante per essere espressa con la semplice parola "trend". Anche se questa espressione non è nuova, riteniamo che siamo al punto di svolta significativo nell'avvicinarsi all'era dell'IA, quindi dobbiamo prendere questa tendenza più seriamente.
Argomentazioni o spiegazioni lunghe sono impossibili in X, i video di YouTube e TikTok, che sono i più consumati e con la maggiore dipendenza, dimostranoil consumo sociale di immagini decontestualizzate. Le immagini poetiche istantanee e evocative stanno diventando sempre più importanti, il che significa chele prospettive esistenti relative all'interpretazione che ci dice cosa è considerato informazione sono state capovolte.
In breve,non si tratta di cosa guardare, ma di come guardare.
Dovremmo scegliere un approccio iniziale diverso, più semantico e analitico, per le tendenze o i fenomeni legati al corpo. In un periodo in cui la filosofia di un marchio di lingerie che celebra i corpi diversi nella loro integrità è riconosciuta, in contrapposizione all'estetica delle legioni di modelle nelle campagne pubblicitarie di Guess e Calvin Klein, e in cui l'immagine di un rossetto rosa sulle labbra di una persona il cui sesso non è chiaro è diventata l'emblema di una strategia efficace per raggiungere gli adolescenti, il corpo umano è sempre presente quando si immagina il futuro della tecnologia e si discute dello sviluppo tecnologico. La domanda su come guardare il corpo umano diventerà sempre più complessa e importante in futuro.
Riferimenti