Fotos criadas pela ia do google

Imagen, IA do Google, cria imagens a partir de texto

Avatar of victor pacheco
O Imagen é uma ferramenta que consegue gerar uma imagem apenas com a descrição em texto, por mais aleatório que isso seja

Você digita um texto com detalhes, espera um pouco e então, uma imagem nunca vista na internet é gerada com base na descrição escrita. É desta forma que podemos explicar a Imagen, nova IA do Google que foi anunciada pela empresa como uma opção interessante e que deve ajudar a indústria a entender mais sobre machine learning (aprendizado de máquina). 

A novidade se junta às outras opções de inteligência artificial que já fazem o mesmo trabalho, mas os avanços da empresa de navegadores são maiores e o resultado é realmente impressionante. Confira os primeiros detalhes compartilhados agora mesmo. 

Machine learning avançado

Com base em sistemas de inteligência artificial, o Google Research, braço de pesquisa do Google, apresentou os primeiros resultados que foram criados – ainda em fase de protótipo – com a Imagen. Ao digitar um texto, basta esperar que a ferramenta crie uma imagem do zero, sem a necessidade de enviar uma referência gráfica. A ideia é permitir que por meio dos recursos de inteligência artificial, a ferramenta consiga fotos em alta qualidade apenas tendo a digitação em texto como base.

Exemplo de imagem criada pelo google imagen
Trabalho do Google Research resultou em primeiro protótipo do Google Imagen (Captura de tela: Victor Pacheco/Showmetech)

Em testes realizados com “concorrentes” como o DALL-E, VQ-GAN+CLIP e Latent Diffusion Model, o Google ressaltou que a Imagen conseguiu entregar melhores resultados, o que coloca a ferramenta em destaque, pelo menos por agora. O trabalho da IA do Google acontece em 4 passos, que vão desde a criação da imagem até a adaptação para uma maior resolução. 

Processo de criação de foto na ia de texto para imagem
Fotos são criadas em quatro passos para que resultado final seja atingido (Foto: Reprodução/Google)

Os resultados são impressionantes, uma vez que os testes foram feitos com palavras aleatórias como “Ursinhos de pelúcia nadando nos Jogos Olímpicos 400m Borboleta”. Alguns testes foram mais além e foi possível perceber que os desenvolvedores se divertiram nos testes com o Imagen, confira mais algumas imagens geradas: 

  • Foto gerada pela ia de texto para imagem do google
  • Um cérebro montando um foguete indo em direção à lua.
  • Foto de cachorro gerada pelo imagen do google
  • Um pato cromado com um bico dourado discutindo com uma tartaruga furiosa em uma floresta.

O Google é uma das empresas que mais tem investido em soluções de inteligência artificial nos últimos anos e basta olhar os avanços no Google Assistente para ter uma pequena prévia. Mais do que uma simples ferramenta que ativa ou desativa funções em seu smartphone, o assistente pessoal já consegue fazer ligações em tom natural, assim como em alguns aparelhos, não é mais necessário dizer “Ok Google” para continuar uma conversa com a assistente. 

Durante o Google I/O 2022, uma novidade que levou o nome de Pathways Language Model (PaLM) conseguiu resolver problemas matemáticos com texto, entregando o resultado e explicação sobre como as informações foram obtidas. 

Google palm
Google apresentou recurso de IA que consegue resolver problemas matemáticos no começo de maio (Foto: Reprodução/Google)

A empresa espera que o PaLM possa ser utilizado em diversos campos e por meio do machine learning, até mesmo aprender novos idiomas que não tem alta fluência. 

Quem pode usar o Imagen?

Por agora, o uso da IA do Google não está liberado para o público, devido à empresa ter certo receio sobre como os resultados serão aproveitados. Como os dados para criar imagens foram retirados de “uma escala web não curada”, de acordo com a própria empresa, há o risco da IA de texto para imagem acabar entregando resultados que podem ser ofensivos para algumas minorias, ainda mais se for solicitada a criação de fotos com pessoas. Nos resultados divulgados, não há imagens com pessoas, então não sabemos ainda como isso aconteceria na prática. 

Exemplo de foto criada pelo google imagen
Ferramenta não será liberada para público, pelo menos durante este primeiro momento (Foto: Reprodução/Google)

Ao mesmo tempo, o Google Research ressalta que os filtros de treinamentos foram filtrados para que ruídos e conteúdos inapropriados, como pornografia, insultos racistas e esteriótipos sociais. Em outras palavras: como o treinamento de inteligência artificial foi realizado com base do que está na internet, o Google teme que o Imagen seja utilizado para criar imagens que despertem gatilhos de ansiedade ou outros problemas. 

Exemplo de foto criada pelo google imagen
Empresa tem receio em como IA pode ser utilizada para gerar fotos desconfortáveis (Foto: Reprodução/Google)

Na publicação que divulgou os resultados da IA, o Google também mandou um recado para seus concorrentes para que tomem o mesmo cuidado ao realizar o treinamento de suas inteligências artificiais na criação de fotos com pessoas. 

O que você achou dos primeiros resultados divulgados? Diga pra gente nos comentários

Veja também 

Confira todos os detalhes sobre novos produtos do Google que foram apresentados durante o Google I/O 2022


Fontes: Google Research l CNET l Google Blog

Inscreva-se para receber nossas notícias:

Total
1
Shares
Deixe um comentário

O seu endereço de e-mail não será publicado.

Posts Relacionados