เมื่อสุดสัปดาห์ที่ผ่านมา Open AI ได้เปิดตัวบริการใหม่ชื่อ Sora Sora เป็นบริการที่สามารถสร้างวิดีโอ AI ได้โดยการป้อนข้อความ ทำให้ได้รับคำชมจากผู้วิจารณ์ตั้งแต่เปิดตัว วิดีโอสาธิตที่สร้างขึ้นจากข้อความสั้นๆ เพียงไม่กี่บรรทัด เช่น วิดีโอสโลว์โมชั่นของชายวัยกลางคนกำลังกินแฮมเบอร์เกอร์ หรือภาพมุมสูงของถนนในญี่ปุ่นที่มีคนสองคนเดินอยู่ แสดงให้เห็นถึงความสมจริงในระดับสูงเทียบเท่ากับฉากที่วางแผน ถ่ายทำ และกำกับในโฆษณาหรือภาพยนตร์
Open AI ได้ใช้คำว่า World Simulator ในการอธิบาย Sora ในรายงานทางเทคนิคที่เผยแพร่ในวันเดียวกันหากการทำให้เกิดภาพนามธรรมที่สมจริงระดับนี้เป็นไปได้ด้วยการเชื่อมโยงระหว่างการทำให้เป็นนามธรรมผ่านข้อความและพื้นที่พารามิเตอร์ นั่นหมายความว่ามันจะส่งผลกระทบอย่างมหาศาลต่อความสามารถในการอนุมานของแบบจำลอง GPT ในอนาคต และนัยสำคัญของมันนั้นยิ่งใหญ่ในแง่ของอิทธิพลของ AI ที่ปรากฏในสังคมมนุษย์
คำสั่ง: ฉากการวิ่งของบุคคลแบบพิมพ์ลายเท้า ภาพยนตร์ซีเนม่าติกถ่ายทำด้วยฟิล์ม 35 มม.
แต่ Sora ก็ยังมีข้อจำกัดอยู่มาก เช่น ฉากที่คนกัดคุกกี้ แต่รอยกัดกลับหายไป หรือฉากที่คนวิ่งบนลู่วิ่ง แต่กลับหันหน้าไปทางด้านหลังแทนที่จะหันไปทางแผงควบคุม พร้อมกับการเคลื่อนไหวแขนขาที่ดูแปลกๆ ซึ่งแสดงให้เห็นว่า Sora ยังไม่สามารถเข้าใจและแสดงรายละเอียดเชิงพื้นที่ในพรอมต์ของผู้ใช้ รวมถึงการเปลี่ยนแปลงที่เกิดขึ้นตามเวลาได้อย่างแม่นยำ สิ่งเหล่านี้สะท้อนให้เห็นว่า AI ยังคงประสบปัญหาในการเชื่อมโยงเหตุและผล รวมถึงการแสดงผลทางฟิสิกส์ในฉากที่ซับซ้อน ซึ่งเป็นหลักฐานที่แสดงว่า AI ยังไม่เข้าใจโลกได้อย่างแท้จริง อย่างไรก็ตาม เมื่อพิจารณาจากการประกาศในปี 2566 ที่ว่า Open AI ได้ทำสัญญากับ Shutter Stock ซึ่งเป็นบริษัทที่เก็บภาพถ่ายและวิดีโอความละเอียดสูง 35 ล้านภาพ เพื่อฝึกฝน AI ต่อไปอีก 6 ปี เราจึงคาดหวังได้ไม่ยากว่าภาพและวิดีโอที่สร้างโดย AI ในอนาคตจะเข้าใกล้ระดับความสมจริงที่มนุษย์สร้างขึ้นได้ในไม่ช้า
เดวิด เวนก์โรว์ นักโบราณคดีชาวอังกฤษ ได้โต้แย้งในหนังสือ 'The Origins of Monsters' (괴물의 기원) ที่ตีพิมพ์ในปี 2013 ว่า ตั้งแต่ยุคอียิปต์โบราณไปจนถึงอารยธรรมเมโสโปเตเมีย และยุคเหล็กในทะเลเมดิเตอร์เรเนียน ในช่วงที่เมืองต่างๆ ก่อตัวขึ้น อารยธรรมเจริญรุ่งเรือง และเครือข่ายการเมืองและการค้าขยายตัวออกไปนั้น ไม่มีพื้นที่ใดเลยที่ไม่มีภาพลักษณ์ของสิ่งมีชีวิตเหนือจริงที่น่าทึ่งและซับซ้อน
ภาพสิ่งมีชีวิตมหัศจรรย์จากเนินฝังศพ Pazyryk และ Tuekta ทางตอนใต้ของรัสเซีย
ภาพวาดและเอกสารต่างๆ ในยุคนั้นได้บันทึกภาพกราฟิกของสัตว์ประหลาดผสม เช่น กริฟฟิน (Griffin) ซึ่งมีลำตัวของสิงโต หัวและปีกของนกอินทรี หรือมิโนทอร์ (Minotaur) ซึ่งมีร่างกายของมนุษย์และหัวของวัว และภาพเหล่านี้ถูกเผยแพร่ไปตามเส้นทางการค้าที่ขยายตัวเพื่อเป็นการยืนยันสถานะของชนชั้นสูงในสมัยนั้น การแยกส่วนของอวัยวะหรือลักษณะเฉพาะของสิ่งมีชีวิตหลากหลายชนิด และการนำมาประกอบกันใหม่เพื่อสร้างภาพของสิ่งมีชีวิตที่สอดคล้องกับโลกที่ขยายตัวที่มองไม่เห็น สามารถตีความได้ว่าเป็นผลมาจากการเปลี่ยนแปลงทางสังคมที่ทำให้มุมมองของกลุ่มชนที่มีความสัมพันธ์ทางสายเลือดซึ่งเคยคิดว่าตนเองเป็น 'ทั้งหมด' ต้องขยายออกไป ส่งผลให้เกิดการแบ่งงานกันทำมากขึ้นกับผู้คนมากมายที่ไม่เคยพบเจอมาก่อน ทำให้เกิดความตระหนักในตนเองในฐานะ 'ส่วนหนึ่ง' และความกลัวที่เกิดขึ้นจากความตระหนักนั้น กล่าวอีกนัยหนึ่ง การค้นพบความสัมพันธ์ระหว่างการสร้างสิ่งผสมและการพัฒนาเทคโนโลยีกับการรับรู้ตนเองเป็นหนึ่งในข้อความที่เขาต้องการสื่อสาร
เรากำลังเห็นภาพที่น่าสนใจแต่แปลกประหลาดมากมายผ่านโปรแกรมสร้างภาพ AI เช่น Midjourney และ DALL-E ที่เปิดตัวมาตั้งแต่ปีที่แล้ว เช่น รูปปั้นสไปเดอร์แมนในยุครอมาน รูปปั้นนักบินอวกาศขี่ม้าบนดวงจันทร์ หรือหุ่นยนต์ที่มีแขนสามแขนกำลังวาดรูป ซึ่งเป็นภาพที่เกินขีดจำกัดของร่างกายมนุษย์ และด้วยการเปิดตัวของ Sora ในครั้งนี้ การแพร่กระจายของวิดีโอที่สร้างโดย AI จะเร็วขึ้นไปอีก สิ่งสำคัญคือการที่ภาพลักษณ์ของสัตว์ประหลาดหรือสิ่งผสมซึ่งเป็นภาพที่ซ้ำแล้วซ้ำเล่าในประวัติศาสตร์ของมนุษย์ตั้งแต่ยุคเริ่มแรก ได้กลับมาปรากฏในยุค AI ในปัจจุบันกระแสนี้ไม่ใช่แค่เพียงเทรนด์ แต่สามารถเรียกได้ว่าเป็น 'บรรยากาศ' (바이브) ที่ครอบคลุมโลกในยุคปัจจุบันแม้ว่าคำนี้อาจจะไม่ใช่คำใหม่ แต่เรากำลังอยู่ในช่วงเวลาที่น่าสนใจซึ่งเป็นจุดเปลี่ยนสำคัญในยุค AI ดังนั้นเราจึงจำเป็นต้องตระหนักถึงกระแสนี้ให้มากขึ้น
วิดีโอ YouTube และ TikTok Shorts ที่ได้รับความนิยมมากที่สุดและเสพติดง่าย ซึ่งเป็นรูปแบบที่ไม่มีการให้เหตุผลหรืออธิบายอย่างยาวนานเป็นการพิสูจน์ถึงปรากฏการณ์การบริโภคภาพในสังคมที่แยกออกจากบริบทภาพเชิงเปรียบเทียบที่ชั่วขณะและเกิดขึ้นเองตามธรรมชาติมีความสำคัญมากขึ้นเรื่อยๆ ซึ่งหมายถึงมุมมองเกี่ยวกับการตีความที่บอกเราว่าอะไรคือข้อมูลนั้นได้พลิกกลับไปแล้วนั่นเอง
สรุปแล้วเราจำเป็นต้องเปลี่ยนแปลงจากการถามว่าจะดูอะไรไปเป็นการถามว่าจะมองอย่างไร
เราจำเป็นต้องเลือกวิธีการเข้าถึงที่แตกต่างและมีนัยสำคัญมากขึ้นในการวิเคราะห์แนวโน้มและปรากฏการณ์ที่เกี่ยวข้องกับร่างกายมนุษย์ ในยุคที่ปรัชญาของแบรนด์ชุดชั้นในที่แสดงออกถึงความหลากหลายของร่างกายได้รับการยอมรับแทนที่จะเป็นความงามของเหล่าบรรดาแบบในแคมเปญการตลาดของ Guess หรือ Calvin Klein และภาพลิปสติกสีชมพูบนริมฝีปากที่ไม่ทราบว่าเป็นผู้ชายหรือผู้หญิงเป็นตัวแทนของกลยุทธ์ที่มีประสิทธิภาพในการเข้าถึงวัยรุ่น เทคโนโลยีและอนาคตของเทคโนโลยีนั้นย่อมมีร่างกายมนุษย์เป็นส่วนประกอบเสมอ คำถามที่ว่าเราจะมองร่างกายมนุษย์อย่างไรจะยิ่งซับซ้อนและมีความสำคัญมากขึ้นในอนาคต
เอกสารอ้างอิง
ความคิดเห็น0