Tldr
- O GPT-4O do OpenAI inclui um poderoso novo gerador de imagens de IA que se tornou viral para criar imagens no estilo do estúdio ghibli
- A ferramenta pode replicar estilos de estúdio como o Studio Ghibli, mas levanta preocupações com direitos autorais, pois os tribunais debatem se o treinamento de IA em obras protegidas por direitos autorais é legal
- Vários processos contra empresas de IA, como a OpenAI, reivindicam violação de direitos autorais para treinamento em obras sem permissão
- O novo gerador de imagens se destaca na renderização de texto, um rápido a seguir e manter a consistência em várias imagens
- A ferramenta do OpenAI produz réplicas de estilo mais precisas do que concorrentes como o Google Gemini e Xai’s Grok
O OpenAI lançou recentemente um novo gerador de imagens como parte de seu modelo GPT-4Oe rapidamente se tornou viral nas mídias sociais. Os usuários inundaram seus feeds com imagens geradas pela IA, imitando o estilo distinto do Studio Ghibli, o famoso estúdio de animação japonesa por trás de filmes amados como “My Neighbor Totoro” e “Spirited Away”.
Em apenas 24 horas desde que o artigo foi lançado, as pessoas criaram imagens mostrando as versões do estúdio Ghibli de Elon Musk, “O Senhor dos Anéis”, e o presidente Donald Trump. Até o CEO da OpenAI, Sam Altman, parece ter mudado sua imagem de perfil para uma imagem no estilo Ghibli provavelmente criada com a nova ferramenta.
O recurso permite que os usuários simplesmente enviem imagens existentes no ChatGPT e peça ao sistema que as recrie em vários estilos. Essa facilidade de uso contribuiu para sua rápida propagação nas plataformas de mídia social.
Esta versão segue o recurso semelhante do Google em seu modelo flash Gemini, que provocou seu próprio momento viral no início de março, quando os usuários descobriram que poderiam remover marcas d’água das imagens. Ambas as ferramentas tornam mais fácil do que nunca recriar os estilos de obras protegidas por direitos autorais com instruções simples de texto.
Essas novas ferramentas de imagem de IA reacenderam preocupações sobre a violação de direitos autorais. Vários processos contra empresas de IA afirmam que esses sistemas foram treinados em obras protegidas por direitos autorais sem permissão ou compensação adequada.
AI Art e áreas cinzas legais
Evan Brown, advogado de propriedade intelectual da Neal & McDevitt, explica que esses geradores de imagens de IA operam em uma área cinzenta legal. Embora o estilo em si não esteja explicitamente protegido pela lei de direitos autorais, a maneira como esses sistemas aprendem esses estilos pode ser problemática.
“Acho que isso levanta a mesma pergunta que estamos nos pedindo há alguns anos”, disse Brown em entrevista. “Quais são as implicações de violação de direitos autorais de sair, rastejar a web e copiar esses bancos de dados?”
O New York Times e vários editores têm ações ativas contra o Openai. Eles afirmam que a empresa treinou seus modelos de IA em obras protegidas por direitos autorais sem atribuição ou pagamento adequado. Reivindicações semelhantes foram feitas contra outras empresas de IA, incluindo Meta e Midjourney.
O Openai afirmou que, embora o Chatgpt se recusa a replicar “O estilo de artistas vivos individuais”, permite recriar “estilos mais amplos de estúdio”. No entanto, essa distinção se torna embaçada ao considerar que artistas vivos como Hayao Miyazaki, co-fundador do Studio Ghibli, foram pioneiros nos estilos únicos de seus estúdios.
Studio Ghibli está fora, o Dr. Seuss está em pic.twitter.com/4ecxwllkoj
– Jordi Hays (@jordiHays) 26 de março de 2025
Os usuários também conseguiram recriar estilos de outras fontes conhecidas. Exemplos incluem retratos no estilo do Dr. Seuss e Fotos de Casamento reimaginados no visual distinto da Pixar.
Jornalistas de tecnologia compararam vários geradores populares de imagens de IA, incluindo Gemini do Google, Xai’s Grok e Playground.ai. Eles descobriram que a nova ferramenta do Openai criou as réplicas mais precisas do estilo de animação do Studio Ghibli.
Segundo o Openai, o novo gerador de imagens foi projetado para ser “bonito e útil”. A empresa afirma que sua ferramenta se destaca em renderizar com precisão o texto, seguindo com precisão e alavancando a base de conhecimento do GPT-4O.
Uma vantagem importante é a capacidade do gerador de manter a consistência em várias imagens em uma conversa. Isso facilita a refinar as imagens por meio de diálogo natural, garantindo que elementos como caracteres permaneçam coerentes à medida que os usuários fazem ajustes.
O modelo também demonstra forte “instrução a seguir”, lidando com instruções detalhadas com até 10 a 20 objetos diferentes, mantendo suas características e relacionamentos. Isso permite um melhor controle do que os sistemas anteriores, que normalmente lutavam com mais de 5-8 objetos.
O OpenAI implementou medidas de segurança na nova ferramenta. Todas as imagens geradas incluem metadados c2PA, identificando-os como a-i-i-criados. A empresa também bloqueia os pedidos que podem violar suas políticas de conteúdo, com restrições elevadas quando pessoas reais estão envolvidas.
O novo gerador de imagens agora está disponível para usuários Plus, Pro, Team e Free como o gerador de imagens padrão no ChatGPT. O acesso para usuários de empresas e educação está chegando em breve. Os desenvolvedores poderão gerar imagens com o GPT-4O através de uma API nas próximas semanas.
O OpenAI reconheceu algumas limitações com o sistema atual, incluindo problemas ocasionais de corte de imagens, imprecisões com renderização multilíngue de texto e desafios com edição precisa. A empresa diz que está trabalhando para abordar essas limitações em atualizações futuras.
O sucesso desse novo gerador de imagens parece estar gerando alta demanda. O OpenAI atrasou o lançamento para os usuários de nível livre na quarta-feira, citando o número esmagador de pessoas que tentam usar o recurso.
Embora a tecnologia represente um grande avanço no que a IA pode criar, teremos que aguardar decisões judiciais para determinar se esses sistemas violam as leis de direitos autorais.