Google anuncia gemini 1. 5 com desempenho 87% superior. Atualização do modelo de linguagem será testada por desenvolvedores antes de chegar aos serviços e aplicativos do google

Google anuncia Gemini 1.5 com desempenho 87% superior

Avatar de victor pacheco
Atualização do modelo de linguagem será testada por desenvolvedores antes de chegar aos serviços e aplicativos do Google

Cerca de um mês e meio após o lançamento de seu modelo de linguagem para o público geral, o Google anunciou hoje a atualização para o Gemini 1.5. Entre as novidade, ele está mais rápido e tem capacidade para ler conteúdos mais longos. O Gemini 1.5 estará disponível para desenvolvedores com até um milhão de tokens. Confira o que foi anunciado.

O que chega com a atualização

Logo de atualização do gemini 1. 5, a inteligência artificial do google
Novidade foi anunciada hoje (15) (Foto: Divulgação/Google)

O anúncio do Google para seu modelo de linguagem é mais uma mudança incremental que um novo lançamento. Em comparação com o modelo anterior, o Gemini 1.5 chega à internet com nova arquitetura que leva o nome de Mixture-of-Experts (MoE). Na prática, os modelos de linguagem serão divididos em pequenas redes neurais para melhor processamento e por meio de redes “especializadas”, em vez de serem lidas por gigantes parâmetros.

Tal novidade impacta diretamente no processamento de tarefas, que agora está mais rápido e pronto para realizar tarefas mais complexas. O Google também ressalta que o treinamento do Gemini está mais rápido. É importante lembrar que essa IA tem três variantes: Nano (nos smartphones Pixel),  Pro (disponível no chatbot Gemini) e Ultra (disponível no Gemini Advanced para desenvolvedores).

O Google afirma que o Gemini 1.5 Pro tem poder de desempenho que se assemelha ao Ultra 1.0, e que ele está 87% mais rápido do que o foi apresentado no final do ano passado. A empresa afirma que, segundo os testes feitos internamente, ele está mais rápido e pode processar mais informações que a geração anterior.

Quando testado em um painel abrangente de avaliações de texto, código, imagem, áudio e vídeo, o 1.5 Pro supera o 1.0 Pro em 87% dos benchmarks usados para desenvolver nossos LLMs.

Google sobre novo lançamento do Gemini 1.5.

Maior capacidade de processamento

Detalhes da atualização do gemini do google
Modelo de linguagem pode ler documentos com até 700 páginas (Foto: Divulgação/Google)

A janela de contexto é basicamente o local em que as informações são processadas em tokens. É importante lembrar que um token não é exatamente um parâmetro, mas sim blocos de dados utilizados para processar informações. A versão de dezembro de 2023 tinha suporte para até 32 mil tokens, o que já era muita coisa.

Porém, o Gemini 1.5 passou a ter uma janela de contexto de até 1 milhão de tokens. O poder de processamento é tão grande que, em testes divulgados pela empresa, a inteligência artificial conseguiu ler todo um arquivo PDF de 402 páginas sobre a missão Apolo 11, que levou o homem à Lua, e trazer três momentos cômicos, em apenas alguns segundos. Assista ao vídeo abaixo:

Outro exemplo mostrado foi a revisão de um filme mudo de 44 minutos de Buster Keaton. Ao receber o arquivo, a inteligência artificial do Google conseguiu identificar uma cena específica e dar mais informações sobre o momento do filme. Confira:

Com essa quantidade máxima de 1 milhão de tokens, a atualização do Gemini permitirá que a inteligência artificial analise até 1h de vídeo, 11h de áudio, 30 mil linhas de código ou mais de 700 mil palavras. E, como você percebeu nos exemplos, isso será feito em apenas alguns segundos.

Disponibilidade para público geral

Logo do gemini 1. 5, modelo de linguagem do google
Por agora, novidade será testada por desenvolvedores (Foto: Divulgação/Google)

Para este primeiro momento, apenas desenvolvedores devem aproveitar a atualização do Gemini, haja vista que ela estará disponível apenas pelo AI Studio ou Vertex AI em um contexto limitado.

Também é importante lembrar que a atualização do modelo de linguagem do Google ainda está em desenvolvimento e a empresa garante aos desenvolvedores com acesso antecipado 128 mil tokens para testes — os lotes de 1 milhão de tokens terão acesso restrito e serão liberados gradativamente.

Os primeiros testadores podem experimentar a janela de contexto de 1 milhão de tokens sem nenhum custo durante o período de teste, embora devam esperar tempos de latência mais longos com esse recurso experimental.

Google sobre novo lançamento do Gemini 1.5.

Em um futuro não tão distante, o modelo de linguagem será implementado aos serviços do Google, incluindo o assistente pessoal e o chatbot , que deixou de se chamar Bard e agora leva o nome de Gemini. Em quanto tempo você acredita que iremos usar a nova atualização do Gemini? Diga pra gente nos comentários!

Veja também

Como criar imagens no Bard, a IA do Google

Com informações: Google Blog l Google Brasil l The Verge

Revisado por Glauco Vital em 15/2/24.

Inscreva-se para receber nossas notícias:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts Relacionados