O Google anunciou nesta segunda-feira (19/05) a integração do seu modelo de mundo generativo, o Project Genie, com o banco de imagens do Google Street View. A novidade, revelada durante o Google I/O 2026, permite que usuários e agentes de inteligência artificial explorem simulações interativas baseadas em locais reais, utilizando os mais de 280 bilhões de registros fotográficos capturados ao redor do planeta.
Funcionalidades e acesso
O Project Genie, que utiliza o motor Genie 3 para criar ambientes navegáveis, agora oferece suporte à ferramenta Maps Imagery Grounding. Com essa atualização, o sistema consegue converter descrições de texto e coordenadas geográficas em mundos virtuais dinâmicos. Os usuários podem selecionar uma localização nos Estados Unidos através de um alfinete no mapa, escolher um estilo visual — como cenários históricos ou condições climáticas específicas — e inserir a descrição de um personagem para iniciar a navegação em tempo real.
Atualmente, a funcionalidade está disponível exclusivamente para assinantes do plano Google AI Ultra nos Estados Unidos. A empresa confirmou que o acesso será expandido para outras regiões nos próximos meses. As sessões de exploração são limitadas a 60 segundos, operando com uma taxa de 20 a 24 quadros por segundo, exigindo alto poder de processamento para renderizar as sequências visuais com fidelidade espacial.
Impacto na robótica e treinamento de IA
A integração entre o Street View e o Genie resolve um desafio crítico no desenvolvimento de sistemas autônomos conhecido como lacuna de realidade. Ao basear as simulações em dados geográficos reais, pesquisadores de robótica podem treinar agentes em cenários que reproduzem fielmente as variações de iluminação, geometria urbana e obstáculos complexos encontrados no mundo físico, sem a necessidade de deslocamento geográfico constante para testes de campo.
Para desenvolvedores de jogos e especialistas em ambientes virtuais, a tecnologia representa uma alternativa à criação manual de ativos 3D. Em vez de modelar edifícios ou texturas individualmente, o sistema utiliza a base de dados global do Google para construir ambientes interativos de forma automatizada. Essa abordagem permite que startups e laboratórios de tecnologia acelerem a criação de infraestruturas espaciais com precisão visual aumentada, marcando uma evolução na forma como modelos generativos interagem com dados do mundo real.



