O Google acaba de lançar uma nova ferramenta de inteligência artificial chamada Whisk, que promete revolucionar a criação de imagens. Com o Whisk, os usuários podem carregar fotos e gerar composições visuais sem precisar inserir texto. Essa novidade busca incentivar a criatividade, permitindo que as pessoas combinem suas imagens de forma rápida e intuitiva.
De acordo com informações da CNN, ao usar o Whisk, os usuários podem enviar fotos que representam temas, cenários e estilos, que serão misturados para criar uma nova composição gerada pela IA. Embora seja possível incluir texto para direcionar detalhes específicos, a ferramenta funciona perfeitamente sem essa necessidade.
O Whisk não se apresenta como um editor de imagens convencional, mas sim como uma “ferramenta criativa” que promove uma exploração visual ágil. Thomas Iljic, diretor de gerenciamento de produto do Google Labs, afirmou que a proposta é proporcionar uma experiência acessível e divertida, diferenciando-se das soluções voltadas para trabalhos profissionais mais refinados.
A tecnologia que sustenta o Whisk é baseada no modelo de IA Gemini, em conjunto com o avançado sistema de geração de imagens Imagen 3, desenvolvido pela DeepMind, um laboratório de IA adquirido pelo Google. Quando os usuários fazem o upload de suas imagens, o modelo Gemini gera uma legenda que serve como entrada para o Imagen 3, capturando a “essência” do tema, mas sem replicar os detalhes exatos. Isso oferece uma liberdade maior na criação, embora possa resultar em variações inesperadas no produto final, como diferentes alturas, tons de pele ou estilos de cabelo.
Além disso, os usuários têm a possibilidade de “remixar” a imagem final, editando as entradas ou ajustando categorias para criar versões diversas, como brinquedos de pelúcia, broches ou adesivos. O Whisk está atualmente disponível como um site no Google Labs, inicialmente acessível apenas para usuários nos Estados Unidos, e ainda está em fase de desenvolvimento.
Essa ferramenta se junta à crescente linha de produtos de IA do Google, que também inclui o Gemini para geração de texto e imagem. O lançamento do Whisk ocorre em um cenário de intensa concorrência no setor de inteligência artificial, onde outras empresas, como a OpenAI, estão lançando novos produtos, como o Sora, um gerador de vídeos a partir de texto. Dan Ives, analista da Wedbush Securities, destacou que o Whisk representa uma estratégia importante do Google no mercado de IA, enfatizando o papel vital do DeepMind nas inovações que a empresa planeja para 2025.