Akhir pekan lalu, Open AI meluncurkan layanan baru bernama Sora. Sora memungkinkan pembuatan video AI dengan memasukkan teks, dan sejak peluncurannya, telah menuai pujian dari para reviewer. Video demo yang dirilis dengan beberapa baris teks sederhana menunjukkan tingkat realisme yang setara dengan adegan yang direncanakan, disutradarai, dan difilmkan untuk iklan atau film, seperti video slow motion seorang pria paruh baya yang sedang makan burger, atau bidikan sudut tinggi yang menampilkan dua orang berjalan di jalanan Jepang.
Open AI, dalam laporan teknis yang dirilis pada hari yang sama, menyebut Sora sebagai world simulator.Jika abstraksi yang realistis seperti ini dimungkinkan melalui abstraksi berbasis teks dan koneksi dengan ruang parameter, maka hal ini akan berdampak luar biasa pada kemampuan penalaran model GPT di masa depan, dan maknanya akan sangat besar dari perspektif pengaruh AI yang muncul di masyarakat manusia.
Prompt: Adegan seseorang berlari dengan teknik step-printing, direkam dengan film sinematik 35mm.
Namun, Sora masih memiliki banyak keterbatasan. Misalnya, jejak gigitan pada kue yang hilang setelah seseorang menggigitnya, atau seseorang yang berlari di atas treadmill tetapi menghadap ke belakang alih-alih ke panel kontrol dengan gerakan lengan dan kaki yang aneh. Hal ini menunjukkan bahwa Sora masih belum sepenuhnya mampu memahami dan menampilkan detail spasial dalam prompt pengguna, atau perubahan yang terjadi seiring waktu. Ketidakmampuan untuk menampilkan contoh hubungan sebab-akibat dan implementasi fisika dalam adegan kompleks merupakan bukti bahwa AI masih belum sepenuhnya memahami dunia. Namun, mengingat pengumuman tahun 2023 tentang rencana Open AI untuk melatih lebih lanjut AI-nya selama 6 tahun ke depan melalui kontrak dengan Shutterstock yang memiliki 35 juta foto dan video resolusi tinggi, tidak sulit untuk memprediksi bahwa gambar dan video yang dihasilkan AI di masa depan akan semakin mendekati kualitas yang dihasilkan manusia di dunia nyata.
Arkeolog Inggris, David Wengrow, dalam bukunya yang diterbitkan pada tahun 2013, 'The Origins of Monsters', menyatakan bahwa sejak peradaban Mesir kuno, peradaban Mesopotamia, hingga zaman besi di Mediterania, ketika kota-kota terbentuk, peradaban berkembang pesat, dan jaringan politik serta perdagangan meluas, tidak ada wilayah yang terlepas dari penyebaran citra visual makhluk fantastis dan kompleks yang tidak nyata.
Gambar makhluk fantastis dari makam Pazyryk dan Tuekta, Rusia Selatan
Deskripsi grafis makhluk gabungan seperti griffin (dengan tubuh singa, kepala dan sayap elang) atau minotaurus (dengan tubuh manusia dan kepala banteng) dicatat oleh orang-orang yang hidup pada masa itu di berbagai lukisan dinding dan dokumen, dan disebarluaskan melalui jalur perdagangan yang diperluas untuk melegitimasi status elit saat itu. Fenomena memisahkan berbagai anggota tubuh atau ciri khas dari spesies yang berbeda dan menggabungkannya kembali untuk menciptakan citra entitas yang merespons dunia yang diperluas dan tidak terlihat dapat diartikan sebagai hasil dari perubahan sosial yang meluas, di mana perspektif kelompok keluarga yang menganggap diri mereka sebagai 'keseluruhan' dalam aktivitas produksi berubah menjadi kesadaran diri sebagai 'bagian' akibat peningkatan pembagian kerja dengan orang-orang yang belum pernah mereka temui, yang disertai dengan rasa takut. Dengan kata lain, penemuan hubungan antara penciptaan komposit dan kesadaran diri yang dikonfirmasi melalui kemajuan teknologi merupakan salah satu pesan yang ingin disampaikannya.
Kita telah melihat banyak sekali gambar menarik namun aneh yang dihasilkan oleh program pembangkit gambar AI seperti Midjourney dan DALL-E sejak tahun lalu, seperti patung Spider-Man zaman Romawi, astronot yang menunggangi kuda di permukaan bulan, atau robot dengan tiga lengan yang melukis. Dan dengan Sora yang baru saja dirilis, penyebaran video yang dihasilkan AI akan semakin cepat. Yang penting adalah penggambaran monster atau komposit, yang berulang dalam catatan sejarah manusia sejak awal, sedang terjadi kembali di era AI generatif saat ini.Tren ini sulit untuk dijelaskan hanya sebagai tren semata, dan dapat digambarkan sebagai 'suasana' (vibe) yang menyelimuti dunia pada zaman ini.Meskipun istilah ini tidak baru, kita tampaknya berada pada titik balik yang patut diperhatikan dalam perjalanan menuju era AI, sehingga kita perlu menanggapi tren ini dengan lebih serius.
Konten video YouTube dan TikTok Shorts yang sangat banyak dikonsumsi dan bersifat adiktif, yang tidak memungkinkan adanya argumen atau penjelasan yang panjang, menunjukkan fenomena konsumsi sosial gambar yang terbebas dari konteksnyaIni membuktikan bahwa citra puitis yang bersifat sesaat dan asosiatif menjadi semakin penting, yang berujung pada perubahan perspektif terkait interpretasi yang menunjukkan apa yang dianggap sebagai informasi.
Singkatnya, bukan tentang apa yang harus kita lihat, tetapi bagaimana kita harus melihat.
Kita perlu memilih pendekatan awal yang berbeda, yang lebih bermakna dan analitis, untuk tren dan fenomena yang berkaitan dengan tubuh manusia. Di era di mana filosofi merek pakaian dalam yang menampilkan berbagai bentuk tubuh dengan percaya diri mendapatkan pengakuan, bukannya estetika model dalam kampanye pemasaran Guess atau Calvin Klein, dan di mana citra lipstik merah muda di bibir yang tidak jelas gendernya menjadi representasi strategi yang efektif untuk menjangkau remaja. Saat membayangkan masa depan teknologi dan membahas perkembangan teknologi, tubuh manusia selalu ada. Pertanyaan tentang bagaimana kita memandang tubuh manusia akan menjadi semakin kompleks dan penting di masa depan.
Referensi
Komentar0