Gemini 3.5 Flash é lançado no Google I/O 2026 com foco em agentes de IA e programação
Índice
- O que é o Gemini 3.5 Flash
- Desempenho nos benchmarks
- O contexto competitivo
- Quanto custa para desenvolvedores (e o que mudou no preço)
- Antigravity 2.0 e a demo que “rodou Doom”
- Gemini Spark e o novo visual do aplicativo
- Gemini Omni e criação de vídeo
- Novas assinaturas e preços para consumidores
- Segurança reforçada
- Gemini 3.5 Pro chega no próximo mês
- Conclusão
A Google anunciou, nesta terça-feira (19), o Gemini 3.5 Flash durante a conferência anual Google I/O 2026, realizada em Mountain View. O novo modelo de inteligência artificial promete desempenho superior ao Gemini 3.1 Pro em programação e agentes autônomos, além de operar até quatro vezes mais rápido que outros modelos de fronteira. A empresa também revelou um redesign completo do aplicativo Gemini, o agente pessoal Gemini Spark, o modelo de criação de vídeo Gemini Omni e mudanças nos planos de assinatura. Confira a seguir.
O que é o Gemini 3.5 Flash

O Gemini 3.5 Flash é o primeiro modelo da nova família Gemini 3.5 e já substitui o modelo anterior como padrão do aplicativo Gemini e do Modo IA na busca do Google em todo o mundo. Na prática, qualquer pessoa que usar o Gemini a partir de hoje, inclusive a versão gratuita do aplicativo, já estará interagindo com ele.
Para entender o que muda, vale uma explicação rápida. No universo de modelos de IA, existem diferentes “tamanhos” de modelo. Os maiores (chamados Pro ou flagship normalmente) costumam ser mais inteligentes, mas também mais lentos e caros. Os menores (como os da linha Flash) são mais rápidos e baratos, mas podem não entregar uma qualidade tão alta.
O que a Google afirma com o 3.5 Flash é que essa diferença diminuiu drasticamente (pelo menos até chegar o próximo Pro). O modelo entrega desempenho comparável a modelos maiores e mais caros, tanto da própria Google quanto de concorrentes como a OpenAI e a Anthropic, mantendo a velocidade da linha Flash.
Segundo a empresa, o 3.5 Flash é o modelo mais forte da Google em duas frentes específicas. A primeira é para código, ou seja, a capacidade de escrever, corrigir e manter código de programação. A segunda são tarefas agênticas, que é quando a IA não apenas responde a uma pergunta, mas toma uma sequência de ações para resolver um problema completo.
Um exemplo prático seria pedir à IA para analisar uma planilha financeira, identificar inconsistências, cruzar com dados de e-mails e gerar um relatório final, tudo sem intervenção humana entre cada etapa.
O modelo conta com janela de contexto de 1 milhão de tokens (o equivalente a processar cerca de 750 mil palavras de uma vez, algo como dez livros inteiros), suporta entradas multimodais (texto, imagem, áudio e vídeo) e já está disponível globalmente via Gemini API, Google AI Studio, Android Studio, a plataforma de agentes Google Antigravity e Gemini Enterprise.
Desempenho nos benchmarks

Para sustentar essas afirmações, a Google divulgou resultados em diversos benchmarks, que são testes padronizados usados pela indústria para medir o desempenho de modelos de IA em tarefas específicas. Os testes mais relevantes do Gemini 3.5 Flash são focados em programação e automação.
Os principais números apresentados pela empresa foram 76,2% no Terminal-Bench 2.1 (teste que mede a capacidade da IA de resolver tarefas reais em um terminal de programação, como instalar pacotes, corrigir erros e manipular arquivos), 83,6% no MCP Atlas (avalia o uso coordenado de múltiplas ferramentas por agentes de IA) e 84,2% no CharXiv Reasoning (teste de compreensão de gráficos e figuras de artigos científicos).

O modelo também atingiu 1.656 Elo no GDPval-AA, benchmark que simula tarefas de valor econômico real, como análise de documentos financeiros.
Segundo o site LLM Stats, o modelo supera o Gemini 3.1 Pro nos benchmarks que se parecem com trabalho real, como programação, uso de ferramentas e automação financeira. No entanto, o 3.5 Flash fica atrás do 3.1 Pro em benchmarks de raciocínio acadêmico puro, como o Humanity’s Last Exam (40,2% contra 44,4%) e o ARC-AGI-2 (72,1% contra 77,1%).

Na prática, isso significa que para perguntas complexas de ciência ou matemática abstrata, o modelo Pro continua superior, mas para tarefas do dia a dia de trabalho, como escrever código ou automatizar processos, o 3.5 Flash leva vantagem.
Além disso, a Google destacou bastante que o modelo gera texto quatro vezes mais rápido que outros modelos topo de linha do mercado.
O contexto competitivo

O lançamento acontece em um momento de pressão para a Google. Apesar de ter recursos financeiros muito maiores que seus rivais, a empresa ficou atrás na corrida da IA aplicada a negócios. Segundo a Financial Times, analistas estimam que a Google detém entre 10% e 15% do mercado de desenvolvedores e automação com IA, enquanto concorrentes menores como Anthropic e OpenAI dominam cerca de 40% juntos.
A Anthropic, criadora do Claude, informou a investidores que está a caminho de faturar US$ 45 bilhões anualizados, um crescimento de cinco vezes em relação ao fim do ano passado, impulsionado principalmente pela popularidade de suas ferramentas de codificação.
Já o aplicativo ChatGPT, da OpenAI, tem 900 milhões de usuários semanais, enquanto o Gemini atingiu a mesma marca, mas em usuários mensais, o que indica um engajamento por sessão menor.
O CEO da Google, Sundar Pichai, abordou o ponto diretamente durante a conferência, dizendo que a empresa quer ampliar o uso de agentes para além do público corporativo e de desenvolvedores. Quem assistiu à apresentação, percebeu como a Google está apostando e dobrando a aposta em agentes agora.
Quanto custa para desenvolvedores (e o que mudou no preço)

A Google posiciona o Gemini 3.5 Flash como uma opção de custo-benefício para empresas, afirmando que ele executa tarefas agentic “por menos da metade do custo de outros modelos topo de linha”. Mas essa comparação precisa de um contexto importante.
Primeiro, uma explicação rápida. Tokens são as unidades de texto que os modelos de IA processam. Cada palavra em português equivale a aproximadamente 1,5 token. Quando uma empresa usa a API do Gemini (a interface que permite integrar a IA em seus próprios sistemas), ela paga por milhão de tokens processados, tanto na entrada (o que você envia para o modelo) quanto na saída (o que o modelo responde).

O preço do Gemini 3.5 Flash na API é de US$ 1,50 por milhão de tokens de entrada e US$ 9 por milhão de tokens de saída. Comparado ao Gemini 3.1 Pro (US$ 2,50/US$ 15), o novo modelo é de fato cerca de 40% mais barato em ambas as direções.
No entanto, quando comparamos com a versão Flash anterior, no caso o Gemini 3 Flash, que muitos desenvolvedores usam em produção atualmente, custa US$ 0,30 por milhão de tokens de entrada e US$ 3,00 por milhão de tokens de saída.
Com isso, para equipes que já usavam o 2.5 Flash em pipelines de alta escala, a migração para o 3.5 Flash representa um aumento significativo de custo, mesmo que o desempenho seja consideravelmente superior.
| Modelo | Entrada (por 1M tokens) | Saída (por 1M tokens) |
|---|---|---|
| Gemini 2.5 Flash | US$ 0,30 | US$ 2,50 |
| Gemini 3.5 Flash | US$ 1,50 | US$ 9,00 |
| Gemini 3.1 Pro | US$ 2,50 | US$ 15,00 |
Antigravity 2.0 e a demo que “rodou Doom”

Um dos momentos de destaque do Google I/O foi a apresentação do Antigravity 2.0, a plataforma de desenvolvimento da Google projetada desde o início para criar e orquestrar agentes de IA.
Varun Mohan, chefe da plataforma, subiu ao palco e demonstrou o poder do sistema com uma proposta ambiciosa, já que a equipe colocou o Antigravity e seus agentes para construir o núcleo de um sistema operacional do zero.
Os números divulgados pela Google nesse processo impressionam. Criar o sistema operacional utilizou 93 subagentes (agentes menores, cada um responsável por uma tarefa específica, como escrever um módulo do sistema, testar um componente ou resolver uma dependência) trabalhando em paralelo.

Segundo a Google, os agentes de IA geraram 2,6 bilhões de tokens e concluíram o núcleo funcional do sistema operacional em cerca de 12 horas, com custo estimado inferior a US$ 1.000. Durante a demonstração no palco, o sistema inicialmente não conseguiu executar o jogo Doom por falta de drivers de teclado, mas o problema foi corrigido em tempo real pelo agente Antigravity, tornando o game jogável ao vivo.

Vale pontuar que, pelo que as fontes indicam, o sistema operacional criado não é comparável a um Windows ou Linux completo. Trata-se apenas de um núcleo funcional de um sistema experimental, suficiente para demonstrar boot e execução.
Da mesma forma, o “Doom” apresentado é mais um clone do origonal codado para o sistema, não necessariamente o executável original. Ainda assim, a demonstração definitivamente impressiona.
Gemini Spark e o novo visual do aplicativo

Além do modelo, a Google apresentou mudanças significativas na experiência do usuário. O aplicativo Gemini agora conta com mais de 900 milhões de usuários mensais ativos em mais de 230 países e 70 idiomas, mais que o dobro dos 400 milhões reportados no I/O do ano passado. Segundo Pichai, o número de consultas diárias cresceu sete vezes no período.
Neural Expressive: o novo design

O redesign do aplicativo adota uma linguagem visual chamada Neural Expressive, com animações fluidas, tipografia renovada, cores vibrantes e feedback tátil. A mudança mais perceptível está na forma como o Gemini apresenta suas respostas.
Até agora, a experiência era semelhante à de outros chatbots de IA, com respostas entregues como longos blocos de texto corrido. No entanto, com o Neural Expressive, o Gemini passa a montar respostas visualmente adaptadas ao tipo de pergunta, ou ao menos é o que a Google promete.
Se o usuário perguntar sobre os melhores destinos de viagem, por exemplo, a resposta pode vir com imagens integradas, mapas interativos e vídeos narrados, em vez de apenas uma lista de nomes. As informações mais importantes aparecem em destaque no topo, e o restante se organiza em camadas visuais que o usuário pode explorar conforme a necessidade.

O Gemini Live, recurso de conversa por voz, também foi integrado diretamente à interface principal do chat. Agora o usuário pode alternar entre digitação e conversa por voz sem trocar de tela. A Google também anunciou suporte futuro para dialetos regionais na voz do Gemini. O redesign já está disponível globalmente no Android, iOS e na web.
Gemini Spark: um agente pessoal 24/7

O Gemini Spark é possivelmente a novidade mais ambiciosa do evento para o consumidor comum. Trata-se de um agente pessoal de IA que roda 24 horas por dia em máquinas virtuais dedicadas do Google Cloud, utilizando o Gemini 3.5 Flash como motor e o Antigravity como plataforma de execução. Diferente do Gemini atual, que responde quando perguntado, o Spark opera de forma proativa e contínua, executando tarefas em segundo plano sob direção do usuário.
O usuário pode configurar tarefas recorrentes, como pedir ao Spark para analisar automaticamente o extrato do cartão de crédito todo mês e sinalizar cobranças novas ou taxas escondidas.
Também é possível ensiná-lo a monitorar a caixa de entrada em busca de atualizações da escola dos filhos, extrair prazos importantes e enviar um resumo consolidado diariamente para o usuário e o parceiro.

Em fluxos mais complexos, o Spark pode cruzar anotações de reuniões espalhadas por e-mails e chats, criar um documento organizado no Google Docs e até rascunhar o e-mail de acompanhamento do projeto.
O Spark se integra inicialmente com serviços da própria Google, como Gmail, Docs e demais apps do Workspace, e deve expandir para ferramentas de terceiros via MCP (Model Context Protocol) ao longo do verão.
No celular, o agente terá uma interface dedicada chamada Android Halo, que mostra atualizações ao vivo e o progresso das tarefas em andamento. A Google informou que ações de alto impacto, como envio de e-mails ou compras, exigem confirmação do usuário antes de serem executadas.
O agente começa a ser liberado para testadores confiáveis nesta semana e deve chegar como beta para assinantes do Google AI Ultra nos Estados Unidos na semana que vem.
Gemini Omni e criação de vídeo

Outra novidade anunciada junto ao 3.5 Flash foi o Gemini Omni, um modelo focado em criação e edição de vídeo diretamente dentro do aplicativo Gemini. O Omni combina a inteligência do Gemini com modelos generativos de mídia para transformar texto, imagens e vídeos em conteúdo visual de alta qualidade.
Na prática, o usuário pode enviar um clipe gravado no celular e editá-lo por comandos de voz ou texto, aplicando efeitos como zoom cinematográfico, troca de cenários ou ajustes de iluminação. A Google também demonstrou a criação de um avatar personalizado de IA que reproduz a aparência e a voz do usuário, permitindo inseri-lo em cenas geradas.
O Gemini Omni começa a ser liberado hoje para assinantes dos planos AI Plus, Pro e Ultra em todo o mundo.
Novas assinaturas e preços para consumidores

Outra novidade que vale destacar é que o Google reestruturou seus planos de assinatura. A principal novidade é um novo plano AI Ultra de US$ 100 por mês, voltado para desenvolvedores e criadores avançados, com limite de uso cinco vezes maior que o plano Pro. O antigo plano AI Ultra, que custava US$ 250, caiu para US$ 200 por mês, mantendo limite 20 vezes maior que o Pro, Project Genie, YouTube Premium e 30 TB de armazenamento.
A mudança coloca a Google em paridade direta com os concorrentes. A OpenAI cobra US$ 200 pelo plano premium do ChatGPT, e a Anthropic cobra US$ 100 e US$ 200 pelas faixas superiores do Claude. A diferença é que a Google embute no pacote serviços extras como YouTube e armazenamento em nuvem.

No Brasil, os novos preços já estão refletidos na página do Google One. O plano AI Ultra agora aparece em duas faixas: R$ 779,90/mês (com 20 TB de armazenamento) e R$ 999,90/mês (com 30 TB), valores abaixo dos R$ 1.209,90 cobrados anteriormente pela faixa única. Os demais planos seguem disponíveis no país: AI Plus por R$ 24,99/mês, AI Premium por R$ 49,99/mês e AI Pro a partir de R$ 96,99/mês.
A empresa também substituiu os limites diários de prompts por um sistema chamado “compute-used“, que mede a complexidade de cada requisição em vez de contar mensagens. Uma pergunta simples consome pouca cota, enquanto geração de vídeo ou sessões longas de programação consomem mais. Os limites se renovam a cada cinco horas, e se o usuário esgotar a cota nos modelos maiores, o sistema migra para modelos menores automaticamente em vez de bloquear o acesso.
Para quem não quer pagar, o Gemini 3.5 Flash também está disponível gratuitamente no aplicativo Gemini e no Modo IA do Google Search, com limites de uso mais restritos.
Segurança reforçada

A Google também destacou melhorias nas proteções de segurança do Gemini 3.5. O modelo foi desenvolvido seguindo o Frontier Safety Framework da empresa, com reforço nos mecanismos contra geração de conteúdo perigoso nas áreas cibernética e CBRN (químico, biológico, radiológico e nuclear).
Segundo a empresa, as novas proteções incluem ferramentas de interpretabilidade, que na prática permitem aos engenheiros “olhar dentro” do raciocínio da IA antes que ela forneça uma resposta, verificando se o modelo está seguindo uma linha de pensamento segura.
O objetivo é reduzir tanto a geração de conteúdo prejudicial quanto as recusas incorretas a perguntas seguras, um problema comum em modelos anteriores, que às vezes se recusavam a responder perguntas inofensivas por excesso de cautela.
Gemini 3.5 Pro chega no próximo mês

A Google também confirmou que o Gemini 3.5 Pro, o modelo maior e mais capaz da nova família, já está sendo usado internamente por funcionários da empresa. A previsão é de que o novo modelo seja lançado ao público em junho de 2026.
O 3.5 Pro deve entregar melhor desempenho em tarefas que exigem raciocínio profundo e compreensão de contextos longos, áreas onde o 3.5 Flash faz concessões em troca de velocidade, apesar de ainda impressionar.
Conclusão

Enfim, em resumo, fica claro que o Gemini 3.5 Flash marca um avanço importante da Google na corrida dos modelos de inteligência artificial, especialmente no cenário em que programação assistida por IA e agentes autônomos se tornaram o principal campo de batalha entre as empresas.
Com participação de mercado ainda abaixo de rivais como OpenAI e Anthropic nesse segmento, a Google aposta em velocidade, preço competitivo frente a modelos Pro e integração com seu ecossistema de bilhões de usuários para recuperar terreno.
A demonstração com o Antigravity 2.0 e de outros usos do Gemini 3.5 Flash impressionam bastante, e o modelo provavelmente vai ajudar muito os usuários pais casuais do Gemini, pelo aplicativo, ou mesmo com os planos mais básicos da Google.
No entanto o aumento de preço na API em comparação com o 2.5 Flash é um ponto que desenvolvedores devem avaliar com cuidado antes de migrar, ainda mais considerando o lançamento recente do DeepSeek V4 Pro e Flash, com preços absurdamente baratos por token considerando o tamanho dos modelos.
E você já testou o novo Gemini 3.5 Flash? O que achou da velocidade e dos novos recursos? Conte nos comentários e nas redes sociais do Showmetech!
Com informações: Google Blog | Engadget | Android Authority | The Verge | Financial Times | India Today | 9to5Google | LLM Stats
Veja também:
Descubra mais sobre Showmetech
Assine para receber nossas notícias mais recentes por e-mail.