Menu

OpenAI agora permitirá criar vídeos a partir de dicas verbais

21/02/2024 às 06:55
Tempo de leitura
3 min
Esta imagem gerada por IA, de um vídeo OpenAI Sora, mostra mamutes peludos pisando na neve - Imagem: Sora/OpenAI
Esta imagem gerada por IA, de um vídeo OpenAI Sora, mostra mamutes peludos pisando na neve - Imagem: Sora/OpenAI

O líder de inteligência artificial OpenAI introduziu um novo modelo de IA chamado Sora, que afirma ser capaz de criar vídeos “realistas” e “imaginativos” de 60 segundos a partir de prompts de texto rápidos.

Em uma postagem no blog na quarta-feira, a empresa disse que Sora é capaz de gerar vídeos de até 60 segundos de duração a partir de instruções de texto, com a capacidade de exibir cenas com vários personagens, tipos específicos de movimento e detalhes detalhados de fundo.

“O modelo entende não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico”, disse o post do blog.

A OpenAI disse que pretende treinar os modelos de IA para que possam “ajudar as pessoas a resolver problemas que exigem interação no mundo real”.

Este é o esforço mais recente da empresa por trás do chatbot viral ChatGPT , que continua a impulsionar o movimento de IA generativa. Embora os “modelos multimodais” não sejam novos e já existam modelos de texto para vídeo, o que os diferencia é a duração e a precisão que a OpenAI afirma que Sora tem, de acordo com Reece Hayden, analista sênior da empresa de pesquisa de mercado ABI Research .

Hayden disse que esses tipos de modelos de IA podem ter um grande impacto nos mercados de entretenimento digital, com novos conteúdos personalizados sendo transmitidos através dos canais.

“Um caso de uso óbvio é na TV; criando cenas curtas para apoiar narrativas”, disse Hayden. “O modelo ainda é limitado, mas mostra a direção do mercado.”

Ao mesmo tempo, a OpenAI disse que Sora ainda é um trabalho em andamento com “fraquezas” claras, especialmente quando se trata de detalhes espaciais de um prompt – misturando esquerda e direita – e causa e efeito. Deu o exemplo da criação de um vídeo de alguém dando uma mordida em um biscoito, mas sem deixar marca de mordida logo em seguida.

Por enquanto, as mensagens da OpenAI continuam focadas na segurança. A empresa disse que planeja trabalhar com uma equipe de especialistas para testar o modelo mais recente e examinar atentamente várias áreas, incluindo desinformação, conteúdo de ódio e preconceito. A empresa disse que também está construindo ferramentas para ajudar a detectar informações enganosas.

O Sora será disponibilizado primeiro para professores de segurança cibernética, chamados de “red teamers”, que podem avaliar o produto quanto a danos ou riscos. Também concede acesso a vários artistas visuais, designers e cineastas para coletar feedback sobre como os profissionais criativos poderiam utilizá-lo.

A atualização mais recente ocorre no momento em que a OpenAI continua avançando no ChatGPT.

No início desta semana, a empresa informou que está testando um recurso no qual os usuários podem controlar a memória do ChatGPT, permitindo-lhes pedir à plataforma para lembrar dos chats para tornar as conversas futuras mais personalizadas ou dizer para esquecer o que foi discutido anteriormente.

COMENTÁRIOS