Ferramenta de IA do Google transforma imagens em "mundos" de games

Nova versão de IA do Google, voltada para o mundo dos games, gera ambientes interativos a partir de imagens

André Nicolau, colaboração para a CNN Brasil
Com a tecnologia, os usuários podem criar mundos interativos e diversos a partir de um simples prompt de texto  • Divulgação/Google
Compartilhar matéria

Já pensou criar ambientes 3D onde os usuários e agentes de IA podem interagir em tempo real? É com esta premissa que o Google DeepMind, divisão de pesquisa de Inteligência Artificial do Google, lançou o Genie 3, versão atualizada do seu modelo de inteligência artificial de novos mundos.

Com a tecnologia, os usuários podem criar mundos interativos e diversos a partir de um simples prompt de texto, gerando ambientes dinâmicos que podem ser explorados em tempo real, rodando a 24 quadros por segundo em 720p.

Pioneira em pesquisas sobre ambientes simulados, o novo projeto lança mão de sistemas de IA que podem usar sua compreensão do mundo para simular aspectos dele, permitindo que os agentes prevejam como um ambiente evoluirá e como suas ações o afetarão.

Os modelos de mundo também são um trampolim fundamental para o futuro da IA, uma vez que possibilitam o treinamento de agentes de IA em um currículo ilimitado de ambientes de simulação complexos.

"No ano passado, introduzimos os primeiros modelos de mundo básicos com o Genie 1 e o Genie 2 , que podem gerar novos ambientes para agentes. Também continuamos a aprimorar o estado da arte na geração de vídeos com nossos modelos Veo 2 e Veo 3, que demonstram um profundo conhecimento da física intuitiva", destaca o texto de apresentação da ferramenta.

Avanço na criação de mundos interativos

O investimento da empresa representa um progresso em diferentes capacidades de simulação de mundos. "O Genie 3 é o nosso primeiro modelo de mundo a permitir interação em tempo real, ao mesmo tempo que melhora a consistência e o realismo em comparação com o Genie 2", comemora a nota.

Se a versão anterior permitia a manutenção do mundo gerado por um período entre 10 e 20 segundos, o Genie 3 propõe memória de longo prazo, propondo autonomia de "múltiplos minutos".   

Ainda de acordo com o Google, o lançamento será disponível inicialmente para “um pequeno grupo de acadêmicos e criadores”, garantindo que os desenvolvedores compreendam os riscos e sugiram melhorias.