BitcoinWorld Google DeepMind fusionne Street View avec Genie 3 pour créer des mondes interactifs pilotés par l'IA Google DeepMind a franchi une étape importante en établissant un pont entre le monde physiqueBitcoinWorld Google DeepMind fusionne Street View avec Genie 3 pour créer des mondes interactifs pilotés par l'IA Google DeepMind a franchi une étape importante en établissant un pont entre le monde physique

Google DeepMind fusionne Street View avec Genie 3 pour créer des mondes IA interactifs

2026/05/20 02:15
Temps de lecture : 6 min
Pour tout commentaire ou toute question concernant ce contenu, veuillez nous contacter à l'adresse suivante : crypto.news@mexc.com

BitcoinWorld

Google DeepMind Fusionne Street View avec Genie 3 pour Créer des Mondes IA Interactifs

Google DeepMind a franchi une étape importante dans la connexion des mondes physique et numérique en intégrant ses images Street View directement dans le Projet Genie, le modèle mondial polyvalent de l'entreprise. Annoncée lors de la conférence développeurs Google I/O, cette intégration permet aux utilisateurs de générer des environnements interactifs et explorables ancrés dans des lieux réels capturés au cours de deux décennies de données Street View.

De Street View à la Réalité Simulée

Depuis 20 ans, Google a collecté plus de 280 milliards d'images dans 110 pays grâce à des voitures équipées de caméras et des trackers portés à dos. Désormais, cet immense ensemble de données alimente Genie 3, un modèle mondial capable de générer des environnements 3D diversifiés et interactifs à partir de textes ou d'images. Jack Parker-Holder, chercheur scientifique au sein de l'équipe open-endedness de DeepMind, a expliqué à Bitcoin World que la combinaison de données du monde réel avec la simulation générative ouvre des cas d'usage puissants tant pour la robotique que pour l'exploration humaine.

« C'est vraiment puissant aussi bien pour le cas d'usage des agents [et de la robotique] que pour les humains qui souhaitent s'amuser avec », a déclaré Parker-Holder. Il a décrit un scénario où un robot déployé à Londres — une ville qui voit rarement le soleil — pourrait être entraîné sur des journées ensoleillées simulées générées à partir de données Street View, afin que le reflet soudain du soleil sur les habitations de l'ère victorienne ne perturbe pas ses capteurs. De même, un voyageur planifiant un séjour à New York en hiver pourrait utiliser l'outil pour visualiser une version enneigée d'un quartier précis, en ajustant les conditions météorologiques à la demande.

Formation en Robotique et Conduite Autonome

Genie 3 est déjà utilisé par Waymo, la filiale de voitures autonomes de Google, pour simuler des événements extrêmement rares — tels que des tornades ou des rencontres inattendues avec des animaux — pour la formation des véhicules autonomes. Parker-Holder a noté que si Waymo dispose de son propre simulateur axé sur le point de vue de la voiture, l'intégration de Street View permet de déplacer la perspective vers d'autres agents, comme les piétons ou les robots de livraison, permettant ainsi des scénarios de formation plus complets.

La capacité d'ancrer les simulations à des emplacements géographiques réels pourrait accélérer l'expansion de Waymo dans de nouvelles villes à travers le monde, exposant son conducteur IA à des agencements de routes, des panneaux de signalisation et des conditions environnementales variées sans nécessiter le déploiement d'une flotte physique.

Encore une Expérience avec une Marge de Progression

Malgré des démonstrations impressionnantes — dont une simulation sous-marine d'un quartier — la technologie reste expérimentale. Diego Rivas, chef de produit chez DeepMind, a averti que Street View dans Genie est encore en cours de développement. Dans les échantillons présentés aux journalistes, les environnements étaient reconnaissables mais de qualité jeu vidéo plutôt que photoréalistes. Les modèles manquent également de conscience physique : dans une simulation, une femme courant dans une scène enneigée de Joshua Tree traversait directement les cactus et les buissons.

Parker-Holder a reconnu cet écart, comparant la précision actuelle de Genie à celle des modèles de génération vidéo d'il y a six à douze mois. « Je pense que c'est quelque chose que nous résoudrons », a-t-il déclaré, notant que la compréhension de la physique émerge intuitivement par observation passive, de la même façon que les êtres vivants apprennent.

Jonathan Herbert, directeur de Google Maps et vétéran de Street View depuis 12 ans, a souligné que la véritable percée est la continuité spatiale. Lorsqu'un utilisateur effectue une rotation à 360 degrés, l'IA mémorise et simule correctement l'environnement derrière lui, puis construit de nouveaux environnements sur la base de cette compréhension. « Nous avons longtemps réfléchi à la façon dont nous pourrions construire le modèle le meilleur et le plus riche du monde sur la base des données Street View », a déclaré Herbert.

Disponibilité et Prochaines Étapes

Google lance Street View dans Genie pour une sélection d'utilisateurs Ultra aux États-Unis à compter d'aujourd'hui, avec un accès plus large aux États-Unis qui sera déployé progressivement. Les utilisateurs Ultra à l'échelle mondiale y auront accès dans les prochaines semaines. L'objectif des chercheurs, selon Rivas, est de mettre cette capacité entre le plus grand nombre de mains possible, bien qu'il ait souligné que l'amélioration de la précision reste une priorité.

Conclusion

En connectant deux décennies d'images du monde réel avec l'IA générative, Google DeepMind pose les bases d'une nouvelle catégorie de simulations interactives. Bien qu'encore à ses débuts, l'intégration de Street View dans Genie 3 représente une étape significative vers des systèmes d'IA capables de comprendre, simuler et interagir avec le monde physique — avec des implications pour la robotique, la conduite autonome, l'urbanisme et l'éducation immersive.

FAQs

Q1 : Qu'est-ce que Genie 3 ?
Genie 3 est le modèle mondial polyvalent de Google DeepMind capable de générer des environnements 3D interactifs et explorables à partir de textes ou d'images. Il est conçu pour la formation en robotique, le jeu vidéo et les expériences éducatives.

Q2 : Comment fonctionne l'intégration de Street View ?
L'intégration permet à Genie 3 d'utiliser l'immense ensemble de données d'images Street View de Google — plus de 280 milliards d'images provenant de 110 pays — comme base pour générer des simulations ancrées dans des lieux réels. Les utilisateurs peuvent explorer ces environnements de manière interactive et ajuster des conditions telles que la météo.

Q3 : La simulation est-elle physiquement précise ?
Pas encore. La version actuelle manque de conscience physique, ce qui signifie que les objets peuvent ne pas interagir de manière réaliste (par exemple, un personnage traversant des objets solides). Google s'attend à ce que cela s'améliore au cours des 6 à 12 prochains mois, à mesure que le modèle apprend la physique intuitivement grâce à davantage de données.

Cet article Google DeepMind Fusionne Street View avec Genie 3 pour Créer des Mondes IA Interactifs est apparu en premier sur BitcoinWorld.

Opportunité de marché
Logo de Gensyn
Cours Gensyn(AI)
$0.03405
$0.03405$0.03405
-2.40%
USD
Graphique du prix de Gensyn (AI) en temps réel
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter crypto.news@mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.

Pas de skills ? C'est pas grave

Pas de skills ? C'est pas gravePas de skills ? C'est pas grave

Copiez les meilleurs traders en 3 secondes !