Nerf in the wild

Pesquisadores do Google criam software que usa fotos da internet para recriar grandes estruturas em 3D

Avatar de rafael arbulu
Batizado de “NeRF-W”, projeto usa interpolação e inteligência artificial para criar modelos fiéis de qualquer objeto, desde pontos turísticos até o planeta Terra

Uma equipe de seis pesquisadores do Google Research, uma divisão de pesquisas em software do Google, desenvolveu um programa que utiliza várias fotos comuns da internet para recriar modelos em 3D de diversos objetos, como pontos turísticos em várias cidades do mundo.

Batizado de “NeRF-W” (sigla em inglês para “Campos de Radiação Neural Selvagens” em referência às fotos “soltas” pela rede mundial de computadores), o projeto emprega técnicas de interpolação de imagens e inteligência artificial (IA) para “desenhar”, com alto grau de fidelidade, uma série de locais de alta atração turística, como o Portão de Brandemburgo (Berlim, Alemanha), a Basílica do Sagrado Coração (Paris, França) e a Fontana di Trevi (Roma, Itália).

O nome é chique, mas a “interpolação de imagens” é simples de ser compreendida: imagine que você tem duas ou mais fotos de um mesmo objeto, de vários ângulos diferentes. O que essa técnica faz é “unir” todas essas fotos e reposicioná-las de forma que o resultado final seja uma espécie de maquete do objeto a ser retratado.

O portão de brandeburgo, digitalmente reconstruído pelo projeto nerf-w, do googlePesquisadores do google criam software que usa fotos da internet para recriar grandes estruturas em 3d. Batizado de “nerf-w”, projeto usa interpolação e inteligência artificial para criar modelos fiéis de qualquer objeto, desde pontos turísticos até o planeta terra
O Portão de Brandeburgo, em versão digitalmente reconstruída pelo Projeto NeRF-W (esquerda), versus o ponto turístico de fato, em Berlim, na Alemanha (direita) (Imagens: Reprodução/NeRF-W e Reprodução/Visit Berlim)

A técnica em si não é bem uma novidade, embora pouco conhecida. Mas é o primeiro caso onde ela é empregada por meio de inteligência artificial e uma equipe reduzida, já que o time completo do Google conta com “apenas” seis pesquisadores: Ricardo Martin-Brualla, Noha Radwan, Mehdi S. M. Sajjadi, Jonathan T. Barron, Alexey Dosovitskiy e Daniel Duckworth se dividiram no desenvolvimento remotamente, já que três deles estão situados em Berlim, enquanto os outros três estão em Seattle (Washington, EUA) e São Francisco (Califórnia, EUA).

Também novo é o método como eles chegaram a esses resultados mais precisos: segundo a página oficial, eles basicamente criaram três linhas de captura de imagem, sendo uma para as fotos em si, outra para a remoção de “ruídos” (pedestres nas imagens, carros passando nos arredores etc.) e uma terceira para a iluminação ambiente. As três faixas servem como margem de erro para que a inteligência artificial empregada por eles pudesse trabalhar com maior precisão na hora de criar o modelo em 3D.

“O NeRF-W faz a separação da iluminação em relação à geometria da cena 3D sob ela. [Desta forma] Esta última permanece constante, mesmo quando a iluminação muda”. Em outras palavras, o que os autores estão dizendo é que, independente das mudanças na iluminação, como os vídeos mostram nas variações entre e noite, o objeto registrado — no caso, os pontos turísticos — não se alteram, o que comprova a precisão de todo o sistema.

O projeto todo ainda segue em uma fase experimental, mas os autores do Google já estão traçando planos ambiciosos para ele. A expectativa é que “logo” (eles não especificam uma data) eles consigam disponibilizá-lo para o público a fim de que outras pessoas os ajudem a fazer uma criação fidedigna do planeta Terra. Enquanto esperamos eles chegarem a esse ponto, veja abaixo mais alguns exemplos das criações do software:

Fonte: NeRF in the Wild

Inscreva-se para receber nossas notícias:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts Relacionados