Sora: quem pode usar a ferramenta da OpenAI para gerar vídeos?

O novo modelo de inteligência artificial, capaz de criar vídeos através de instruções de texto, ainda está em fase de testes

Gabriela Maraccini, da CNN
Nova York fica submersa como Atlântida em vídeo gerado por Sora, novo modelo da OpenAI  • OpenAI/Divulgação
Compartilhar matéria

A OpenAI, empresa de inteligência artificial responsável pelo ChatGPT, lançou um novo modelo chamado Sora, que transforma texto em vídeos de até um minuto de forma "realista" e "criativa". A novidade foi anunciada na quarta-feira (14) e está em fase de testes, sendo disponibilizada para um grupo seleto de usuários.

Segundo a OpenAI, a ferramenta está disponível para "red teamers", um grupo de profissionais especializados em ameaças cibernéticas, para avaliarem riscos e garantirem que a inteligência artificial não produza conteúdo prejudicial ou inapropriado. Além disso, a empresa também está concedendo acesso a artistas visuais, designers e cineastas para obter feedback sobre como deixar o modelo mais útil para esses profissionais.

"Estamos compartilhando o progresso de nossa pesquisa antecipadamente para começar a trabalhar e obter feedback de pessoas fora da OpenAI e para dar ao público uma noção de quais recursos de IA estão no horizonte", escreveu a empresa em anúncio.

O que é Sora e como funcionará o modelo?

De acordo com a OpenAI, Sora é capaz de criar vídeos de até 60 segundos a partir de instruções em textos, com cenas complexas com personagens, tipos específicos de movimentos e detalhes precisos. "O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico", diz o anúncio da ferramenta.

Para gerar essas imagens, Sora tem um "profundo conhecimento de linguagem", o que permite a interpretação precisa das instruções e a geração de personagens atraentes que são capazes de expressar emoções. É possível conferir vídeos criados com a IA aqui.

Por outro lado, a empresa ressalta que Sora ainda é um trabalho em curso com "pontos fracos" e pode ter dificuldade em simular com precisão detalhes de profundidade e espaço, podendo confundir esquerda e direita e compreender situações de causa e efeito. Por exemplo: uma pessoa pode pedir para o modelo criar um vídeo de alguém dando uma mordida em um cookie, mas o biscoito pode não ficar com marca de mordida.

Além disso, a OpenAI afirma que tomará diversas medidas de segurança antes de disponibilizar a Sora nos produtos da empresa. Além dos testes feitos por red teamers, também estão sendo construídas ferramentas para detectar conteúdo falso e avisar que o vídeo foi gerado por Sora.

Outra medida de segurança anunciada pela empresa é o classificador de texto que verificará e rejeitará solicitações que violem as políticas de uso, como incitação à violência, conteúdo sexual, imagens de ódio, semelhança de celebridades ou IP de terceiros. Também foram desenvolvidos classificadores de imagens para revisar os frames de cada vídeo gerado para garantir o cumprimento das políticas de uso antes de ser publicado.

"Iremos envolver decisores políticos, educadores e artistas de todo o mundo para compreender as suas preocupações e identificar casos de utilização positivos para esta nova tecnologia", afirma a empresa.