No final do ano, o Google apresenta seus novos modelos de geração de imagens e vídeos, Imagen 3 e Veo 2. Este último se apresenta como um sério concorrente do Sora, da OpenAI.
A guerra pela inteligência artificial generativa toma um novo rumo com os recentes anúncios de GoogleGoogle. A empresa californiana se orgulha de ter desenvolvido o modelo de geração de vídeo mais eficiente do momento com o Veo 2.
É preciso dizer que oferece progressos espectaculares, nomeadamente com uma melhor compreensão do físicofísicono movimentomovimento corpos e objetos e a expressão humana em geral.
Hoje estamos anunciando o Veo 2: nosso modelo de geração de vídeo de última geração que produz clipes realistas e de alta qualidade a partir de prompts de texto ou imagem. ????
Também estamos lançando uma versão melhorada do nosso modelo de texto para imagem, Imagen 3 – disponível para uso no ImageFX através… pic.twitter.com/h6ejHaMUM4
-Google DeepMind (@GoogleDeepMind) 16 de dezembro de 2024
Qualidade de imagem superior de acordo com o Google
Segundo o Google, o modelo pode se adaptar a uma infinidade de efeitos cinematográficos (plano fechado ou amplo, visualizações em ângulo baixo, plano de rastreamento frontal ou traseiro, etc.) para criar sequências únicas em ultra-alta definiçãoultra-alta definição (4K) de um duraçãoduração que pode durar vários minutos. No papel, é ainda mais impressionante do que o que OpenAI oferece com Sora, uma ferramenta certamente impressionante, mas que às vezes carece de fluidez e também pode ter dificuldade em coordenar determinados movimentos.
Ao mesmo tempo, o Google apresenta o Imagen 3, a versão mais recente do seu geradorgerador de imagens. Garante imagens mais brilhantes e geralmente melhor compostas, em estilosestilos estilos artísticos mais variados, do fotorrealismo ao impressionismo, passando pelo abstrato e pelo animado.
Eu decidi colocar @GoogleDeepMind Imagen 3 para o teste com uma série de instruções que aumentam sua compreensão da linguagem fotográfica.
A sugestão: “Fotografia ao nível da rua de uma movimentada rua de Londres em um dia chuvoso, pessoas segurando guarda-chuvas enquanto os reflexos brilham na calçada molhada,… pic.twitter.com/2q9mAlgwKF
-Ryan Morrison (@RyanMorrisonJer) 17 de dezembro de 2024
Whisk: o novo gerador de imagens de IA baseado na criatividade
Por fim, o Google está lançando o Whisk, uma nova ferramenta capaz de gerar imagens sem prompt, mas sim a partir de outros elementos, fotos ou desenhos, como fontes de inspiração. Ao combinar diversos recursos visuais, como retrato e paisagem por exemplo, a ferramenta cria imagens novas, únicas e personalizadas.
Conheça o Whisk! ???? Use imagens como prompts para visualizar suas ideias rapidamente: https://t.co/vu2ec0Uq9Q Insira uma imagem para o assunto, cena, estilo e pronto!
Desenvolvido pelo novo modelo Imagen 3 do Google. pic.twitter.com/Gwh8i9YmI6
-Addy Osmani (@addyosmani) 16 de dezembro de 2024
Veo 2 e Imagen3 estão atualmente reservados para criadores YouTubeYouTube e para empresas que utilizam VideoFX e ImageFX do Google Labs, ainda não acessíveis na França. Por sua vez, o Whisk está disponível em fase experimental, também através do Google Labs e apenas nos Estados Unidos.