Sexta-feira, 26 de setembro de 2025
Por Redação O Sul | 22 de setembro de 2025
O Google lançou um novo modelo de inteligência artificial (IA) do DeepMind, o Gemini 2.5 Flash Image, mais conhecido como “Nano banana”. A IA – que é capaz de gerar e editar imagens de forma muito realista – passou a estar disponível no app do Gemini no início do mês.
“Reimagine suas fotos com comandos de IA”, é como a empresa define a nova tecnologia. Com ela, o usuário é capaz de editar o fundo de uma imagem, mudar peças de roupas de uma foto, criar histórias em quadrinhos, imagens em 3D, memes e até projetar a própria imagem daqui há 50 anos. A ferramenta chama atenção pelo perfeccionismo com que edita e produz as imagens.
A tecnologia está disponível de forma gratuita com um limite de 100 imagens por dia. Já os assinantes do Gemini podem criar até mil imagens por dia. Segundo o Google, a IA já acumula mais de 200 milhões de imagens editadas.
No entanto, a veracidade das imagens geradas por IA podem confundir o usuário sobre o que é real ou não. Segundo David Sharon, líder de geração multimodal do Gemini, todas as imagens geradas com a Nano banana possuem uma marca d’água visível e outra invisível – a SynthID – que não pode ser “destruída” nem que as imagens sejam cortadas, o que garante a indicação da produção por IA.
“Estamos comprometidos em fazer o certo e o responsável pela sociedade, queremos melhorar a cada dia”, disse Sharon em coletiva de imprensa. Embora o Google ainda não possua uma ferramenta de checagem de imagens feitas por IA, o executivo afirma que uma tecnologia desse tipo, acessível para todos, está nos planos da empresa.
“Além da consistência de personagens, o modelo também é excelente em seguir modelos visuais. Já vimos desenvolvedores explorarem áreas como anúncios de imóveis, crachás uniformes para funcionários ou mockups dinâmicos de produtos para um catálogo inteiro, tudo a partir de um único modelo de design”, afirma a empresa.
Edição de imagens
“Edição de imagens baseada em prompts: O Gemini 2.5 Flash Image permite a transformação direcionada e edições locais precisas com linguagem natural. Por exemplo, o modelo pode desfocar o fundo de uma imagem, remover uma mancha em uma camiseta, remover por completo uma pessoa de uma foto, alterar a pose de um assunto, adicionar cor a uma foto em preto e branco ou fazer qualquer outra coisa que você possa imaginar com um simples prompt”, diz o Google.
Fusão de várias imagens
“O Gemini 2.5 Flash Image pode entender e mesclar várias imagens de entrada. Você pode colocar um objeto em uma cena, redecorar uma sala com um esquema de cores ou uma textura e fundir imagens com um único prompt.”