No fim de semana passado, a Open AI lançou um novo serviço chamado Sora. O Sora permite a criação de vídeos de IA a partir da entrada de texto, e desde o seu lançamento tem sido elogiado por críticos. Os vídeos de demonstração lançados com apenas algumas linhas de texto simples demonstram um alto nível de realismo, comparável a cenas planejadas, dirigidas e filmadas para comerciais ou filmes, como um vídeo em câmera lenta de um homem de meia-idade comendo um hambúrguer ou uma vista aérea de duas pessoas caminhando por uma rua japonesa.
No relatório técnico publicado no mesmo dia, a Open AI descreveu o Sora como um simulador de mundo.Se a abstração por meio de texto e a conexão com o espaço de parâmetros permitem essa abstração tão realista, isso terá um impacto enorme na capacidade de raciocínio futuro dos modelos GPT, e seu significado, do ponto de vista da influência da IA na sociedade humana, pode ser considerado imenso.
Prompt: Cena de uma pessoa correndo em estilo step-printing, filmada em 35mm com estética de filme cinematográfico.
No entanto, o Sora ainda apresenta muitas limitações. Por exemplo, em uma cena em que uma pessoa morde um biscoito, a marca da mordida desaparece em seguida; ou em uma cena em que uma pessoa está correndo em uma esteira, ela está olhando para trás, em vez de para a frente, onde está o painel de controle, e seus membros se movem de maneira estranha. Essas cenas mostram que o Sora ainda não consegue entender e representar com precisão detalhes espaciais, mudanças ao longo do tempo, e outros aspectos contidos no prompt do usuário. Essa dificuldade em lidar com relações de causa e efeito e a física em cenas complexas demonstra que a IA ainda não consegue compreender o mundo de forma completa. No entanto, considerando o anúncio de 2023 sobre o contrato da Open AI com a Shutter Stock, que detém 35 milhões de fotos e vídeos de alta resolução, para treinar ainda mais a IA pelos próximos seis anos, não é difícil prever que, em breve, as imagens e vídeos gerados por IA se aproximarão do nível de qualidade dos produzidos por humanos no mundo real.
O arqueólogo britânico David Wengrow, em seu livro "The Origins of Monsters", publicado em 2013, argumenta que, desde o Egito primitivo, passando pelas civilizações da Mesopotâmia até a Idade do Ferro no Mediterrâneo, em períodos de formação de cidades e florescimento da civilização, com a expansão de redes políticas e comerciais, imagens visuais de criaturas fantásticas e complexas, irreais, surgiram e se espalharam por todos os lugares.
Imagens de criaturas fantásticas dos túmulos de Pazyryk e Tuekta, sul da Rússia
Representações gráficas de criaturas híbridas, como a grifo, com corpo de leão, cabeça e asas de águia, ou o Minotauro, com corpo humano e cabeça de touro, foram registradas em pinturas murais e documentos por pessoas da época e, segundo o autor, disseminadas ao longo das rotas comerciais expandidas para justificar o status de elite. O ato de separar e recombinar diferentes membros ou características de espécies, para criar a imagem de uma entidade que corresponde a um mundo expandido e invisível, pode ser interpretado como uma consequência da mudança social, em que a visão de que o grupo familiar era o "todo" se expandiu. Com o aumento da divisão do trabalho entre pessoas desconhecidas, as pessoas perceberam a si mesmas como "partes", o que gerou medo e insegurança. Em outras palavras, a descoberta da relação entre a criação de compostos, o avanço tecnológico e a autoconsciência é uma das mensagens que ele quer transmitir.
Desde o ano passado, com o uso de programas de geração de imagens de IA como Midjourney e DALL-E, temos visto inúmeras imagens interessantes e estranhas que extrapolam os limites do corpo humano, como uma estátua do Homem-Aranha da era romana, um astronauta a cavalo na superfície da lua, ou um robô com três braços pintando. E com o lançamento do Sora, a proliferação de vídeos gerados por IA aumentará ainda mais. O ponto importante é que a representação de monstros, ou seja, compostos, e sua disseminação social, que se repete ao longo da história da humanidade, está sendo reproduzida na era atual da IA generativa.Essa tendência pode ser descrita como uma "vibe" que permeia o mundo em nossos tempos, uma expressão que vai além da simples definição de tendência.Embora essa expressão não seja nova, consideramos que estamos em um ponto de inflexão significativo em nossa jornada para a era da IA, e por isso devemos levar essa tendência a sério.
Vídeos curtos e viciantes do YouTube, TikTok e outras plataformas, em que a argumentação ou explicação detalhada são impossíveis, sãouma prova do fenômeno de consumo social de imagens descontextualizadas.Imagens poéticas, instantâneas e associativas se tornaram cada vez mais importantes, o que significa quea perspectiva tradicional de interpretação que define o que é considerado informação foi revertida.
Em resumo,não se trata mais de o que ver, mas sim de como ver.
Devemos adotar uma abordagem semântica e analítica diferente para as tendências e fenômenos relacionados ao corpo humano. Em uma época em que a filosofia de marcas de lingerie que celebram a diversidade corporal e a expressão autêntica do corpo ganham reconhecimento, em oposição à estética dos modelos das campanhas de marketing da Guess e da Calvin Klein, e em que a imagem de um batom rosa em lábios andróginos se torna a representação de uma estratégia eficaz para atingir o público adolescente, é fundamental refletir sobre essa mudança. Ao imaginar e discutir o futuro da tecnologia, o corpo humano sempre estará presente. A questão de como vemos o corpo humano se tornará cada vez mais complexa e crucial no futuro.
Referências
Comentários0