VEJA-TAMBÉM Mais Lidas

Os melhores jogos do xbox series s|x

Os melhores jogos do xbox series s|x

Os 40 melhores jogos de Xbox Series S|X

Crítica: fallout é muito melhor do que o esperado. Nova produção do prime video e bethesda consagra “era de ouro” das adaptações de videogames. Confira a análise completa!

CRÍTICA: Fallout é MUITO melhor do que o esperado

71 visualizações

Grok-1. 5 vision preview: nova versão da ia analisará imagens, planilhas e documentos. Com a nova atualização, a ia de elon musk agora pode processar uma ampla variedade de informações visuais, incluindo documentos, diagramas, gráficos, capturas de tela e fotografias

Grok-1.5 Vision Preview: nova versão da IA analisará imagens, planilhas e documentos

13 visualizações

EM ALTA Tags

Google anuncia gemini 1. 5 com desempenho 87% superior. Atualização do modelo de linguagem será testada por desenvolvedores antes de chegar aos serviços e aplicativos do google

Notícias

70 visualizações

3 minutos de leitura

Google anuncia Gemini 1.5 com desempenho 87% superior

15 de fevereiro de 2024

Atualização do modelo de linguagem será testada por desenvolvedores antes de chegar aos serviços e aplicativos do Google

Índice

O que chega com a atualização
Maior capacidade de processamento
Disponibilidade para público geral

Cerca de um mês e meio após o lançamento de seu modelo de linguagem para o público geral, o Google anunciou hoje a atualização para o Gemini 1.5. Entre as novidade, ele está mais rápido e tem capacidade para ler conteúdos mais longos. O Gemini 1.5 estará disponível para desenvolvedores com até um milhão de tokens. Confira o que foi anunciado.

O que chega com a atualização

Novidade foi anunciada hoje (15) (Foto: Divulgação/Google)

O anúncio do Google para seu modelo de linguagem é mais uma mudança incremental que um novo lançamento. Em comparação com o modelo anterior, o Gemini 1.5 chega à internet com nova arquitetura que leva o nome de Mixture-of-Experts (MoE). Na prática, os modelos de linguagem serão divididos em pequenas redes neurais para melhor processamento e por meio de redes “especializadas”, em vez de serem lidas por gigantes parâmetros.

Tal novidade impacta diretamente no processamento de tarefas, que agora está mais rápido e pronto para realizar tarefas mais complexas. O Google também ressalta que o treinamento do Gemini está mais rápido. É importante lembrar que essa IA tem três variantes: Nano (nos smartphones Pixel), Pro (disponível no chatbot Gemini) e Ultra (disponível no Gemini Advanced para desenvolvedores).

Gemini 1.5 Pro – A highly capable multimodal model with a 10M token context length

Today we are releasing the first demonstrations of the capabilities of the Gemini 1.5 series, with the Gemini 1.5 Pro model. One of the key differentiators of this model is its incredibly long… pic.twitter.com/2KLro4VwLT
— Jeff Dean (@🏡) (@JeffDean) February 15, 2024

O Google afirma que o Gemini 1.5 Pro tem poder de desempenho que se assemelha ao Ultra 1.0, e que ele está 87% mais rápido do que o foi apresentado no final do ano passado. A empresa afirma que, segundo os testes feitos internamente, ele está mais rápido e pode processar mais informações que a geração anterior.

Quando testado em um painel abrangente de avaliações de texto, código, imagem, áudio e vídeo, o 1.5 Pro supera o 1.0 Pro em 87% dos benchmarks usados para desenvolver nossos LLMs.
Google sobre novo lançamento do Gemini 1.5.

Maior capacidade de processamento

Detalhes da atualização do gemini do google — Modelo de linguagem pode ler documentos com até 700 páginas (Foto: Divulgação/Google)

A janela de contexto é basicamente o local em que as informações são processadas em tokens. É importante lembrar que um token não é exatamente um parâmetro, mas sim blocos de dados utilizados para processar informações. A versão de dezembro de 2023 tinha suporte para até 32 mil tokens, o que já era muita coisa.

Porém, o Gemini 1.5 passou a ter uma janela de contexto de até 1 milhão de tokens. O poder de processamento é tão grande que, em testes divulgados pela empresa, a inteligência artificial conseguiu ler todo um arquivo PDF de 402 páginas sobre a missão Apolo 11, que levou o homem à Lua, e trazer três momentos cômicos, em apenas alguns segundos. Assista ao vídeo abaixo:

Outro exemplo mostrado foi a revisão de um filme mudo de 44 minutos de Buster Keaton. Ao receber o arquivo, a inteligência artificial do Google conseguiu identificar uma cena específica e dar mais informações sobre o momento do filme. Confira:

Com essa quantidade máxima de 1 milhão de tokens, a atualização do Gemini permitirá que a inteligência artificial analise até 1h de vídeo, 11h de áudio, 30 mil linhas de código ou mais de 700 mil palavras. E, como você percebeu nos exemplos, isso será feito em apenas alguns segundos.

Disponibilidade para público geral

Por agora, novidade será testada por desenvolvedores (Foto: Divulgação/Google)

Para este primeiro momento, apenas desenvolvedores devem aproveitar a atualização do Gemini, haja vista que ela estará disponível apenas pelo AI Studio ou Vertex AI em um contexto limitado.

Também é importante lembrar que a atualização do modelo de linguagem do Google ainda está em desenvolvimento e a empresa garante aos desenvolvedores com acesso antecipado 128 mil tokens para testes — os lotes de 1 milhão de tokens terão acesso restrito e serão liberados gradativamente.

Os primeiros testadores podem experimentar a janela de contexto de 1 milhão de tokens sem nenhum custo durante o período de teste, embora devam esperar tempos de latência mais longos com esse recurso experimental.
Google sobre novo lançamento do Gemini 1.5.

Em um futuro não tão distante, o modelo de linguagem será implementado aos serviços do Google, incluindo o assistente pessoal e o chatbot , que deixou de se chamar Bard e agora leva o nome de Gemini. Em quanto tempo você acredita que iremos usar a nova atualização do Gemini? Diga pra gente nos comentários!

Veja também

Como criar imagens no Bard, a IA do Google

Como criar imagens no Bard, a IA do Google

Com informações: Google Blog l Google Brasil l The Verge

Revisado por Glauco Vital em 15/2/24.

Deixe um comentário Cancelar resposta