Sora é a mais nova e inesperada revelação da OpenAI de uma ferramenta que permite aos usuários dar vida às suas palavras transformando prompts de texto em vídeos.
Outras empresas, de gigantes como o Google a startups como a Runway, já revelaram projetos de IA de texto para vídeo. Mas a OpenAI diz que Sora se distingue por seu fotorrealismo impressionante
Neste artigo, vamos dar uma olhada mais de perto no que é Sora e o que está por vir.
O que é Sora e Como funciona?
Sora é um modelo de IA que pode criar cenas realistas e imaginativas a partir de prompts de texto.
Em vez de substituir a criatividade, Sora está diminuindo a barreira de entrada e permitindo que qualquer pessoa dê vida às suas ideias de vídeo.
Em um post da OpenAI em seu Blog, Sora foi mostrado gerando clipes detalhados, semelhantes a filmes, com base em breves prompts. Isso incluiu imagens arrebatadoras de uma cidade da Califórnia da era da Corrida do Ouro, e um SUV clássico rasgando ao longo de uma trilha de montanha empoeirada, e uma mulher caminhando por uma rua de Tóquio.
Veja um vídeo amostra que a OpenAI postou no X do que Sora é capaz.
O vídeo foi gerado com o seguinte Prompt de texto: “A linda e nevada cidade de Tóquio está movimentada. A câmera se move pelas movimentadas ruas da cidade, acompanhando diversas pessoas aproveitando o lindo clima de neve e fazendo compras nas barracas próximas. Lindas pétalas de sakura estão voando ao vento junto com flocos de neve.”
Há também exemplos mais abstratos, como um canguru de desenho animado dançante e dois navios piratas lutando dentro de uma xícara de café.
Sora se baseia em pesquisas anteriores em modelos DALL·E e GPT. Ele usa a técnica de relegendagem de DALL· E 3, que envolve a geração de legendas altamente descritivas para os dados de treinamento visual.
Como resultado, o modelo é capaz de seguir as instruções de texto do usuário no vídeo gerado com mais fidelidade.
Como usar o Sora da OpenAI?
Embora a OpenAI tenha revelado a estreia pública de Sora, ela está atualmente em um estágio de red-teaming, onde a ferramenta está passando por testes para evitar a geração de conteúdo prejudicial ou inadequado.
De acordo com a discussão no fórum de desenvolvedores da OpenAI, não há como solicitar acesso no momento.
Mas a OpenAI afirmou que o beta está aberto a “cineastas, artistas visuais e designers”, porém a falta de qualquer processo de inscrição sugere que o beta é apenas para convidados.
Até o momento, a empresa não listou nenhum tipo de cronograma delineando planos para uma rodada pública ou expandida de testes beta.
Em seu perfil no X, a OpenAI postou: “Tomaremos várias medidas de segurança importantes antes de disponibilizar o Sora nos produtos da OpenAI. Estamos trabalhando com red teamers – especialistas em áreas como desinformação, conteúdo de ódio e preconceito – que estão testando o modelo de forma adversa.“.
Sora e direitos autorais de terceiros
Outra questão potencial é se o conteúdo do vídeo produzido por Sora infringirá o trabalho protegido por direitos autorais de terceiros. “Os dados de treinamento são de conteúdo que licenciamos e também de conteúdo disponível publicamente“, disse Bill Peebles, um pesquisador do projeto.
Além disso, Sora não se apropriará de pessoas reais ou do estilo de um artista nomeado, mas seu uso de conteúdo “disponível publicamente” para treinamento de IA pode levar a ações judiciais contra a OpenAI enfrentou de empresas de mídia, atores e autores por violação de direitos autorais.
“Os dados de treinamento são de conteúdo que licenciamos e também de conteúdo disponível publicamente“, disse a empresa.
A OpenAI disse que está desenvolvendo ferramentas que podem discernir se um vídeo foi gerado por Sora – aplacando preocupações crescentes sobre ameaças como a potencial influência da GenAI nas eleições de 2024.
Não haverá mais barreiras para Sora e programas como ele transformarem o TikTok, o Reels e outras plataformas sociais. “Para fazer um filme profissional, você precisa de muitos equipamentos caros“, diz Peebles. “Esse modelo vai capacitar a pessoa média que faz vídeos nas redes sociais a fazer conteúdo de altíssima qualidade.”
Como muitos aplicativos de IA, o OpenAI Sora não pode ser usado para gerar vídeos retratando violência, conteúdo adulto ou de pessoas reais ou no estilo de artistas nomeados.
Você também pode gostar do nosso artigo das 10 melhores geradores de imagem por IA em 2024.