Home Bots & BrainsEenvoudig te genereren virtuele wereld traint robots en AI Agents

Eenvoudig te genereren virtuele wereld traint robots en AI Agents

door Pieter Werner

Ant Group heeft zijn multimodale AI-assistent LingGuang uitgebreid met een nieuwe functie waarmee gebruikers vanaf een smartphone een interactieve, AI-gegenereerde 3D-omgeving kunnen maken op basis van één afbeelding. De functie, onder de naam “Experience World Model”, is gebaseerd op LingBot-World-Fast, een open-source wereldmodel van Robbyant, de embodied-AI-tak van Ant Group. Dergelijke virtuele werelden kunnen worden gebruikt om robots of AI-agenten te laten oefenen met scènebegrip, navigatie en taakuitvoering voordat ze in fysieke omgevingen worden ingezet.

Robbyant positioneert LingBot-World-Fast dan ook als technologie voor onder meer robottraining, interactieve simulatie, gameprototyping en visuele contentontwikkeling. Met de nieuwe toepassing kan een gebruiker een foto uploaden in LingGuang, waarna de app een korte, verkenbare wereld genereert. Volgens Ant Group kan de gebruiker deze omgeving vervolgens vanuit een first-person perspectief betreden en er in realtime doorheen bewegen, vergelijkbaar met de besturing in een videogame. De gegenereerde ervaring duurt maximaal zestig seconden en vereist geen lokale installatie of technische configuratie.

De aankondiging is vooral relevant omdat Ant Group wereldmodeltechnologie hiermee niet alleen beschikbaar maakt voor ontwikkelaars en onderzoekers, maar ook voor consumenten via een mobiele app. Wereldmodellen worden binnen AI-onderzoek gebruikt om digitale representaties van omgevingen te genereren en te voorspellen hoe die omgevingen zich ontwikkelen wanneer een gebruiker of agent erin beweegt. Dat maakt de technologie interessant voor toepassingen in gaming, contentcreatie en robotica.

Volgens Ant Group haalt LingBot-World-Fast realtime generatie op 16 frames per seconde bij een resolutie van 480P, met een interactielatentie van minder dan één seconde. Robbyant heeft daarvoor een optimalisatieschema toegepast waarbij de rekenkracht vooral wordt gericht op nieuwe visuele elementen in de scène, in plaats van op delen die stabiel blijven. De LingGuang-app voegt daar streamingtechnologie aan toe om de responstijd voor mobiele gebruikers te verlagen.

Naast de mobiele toepassing is LingBot-World-Fast ook als open-source model beschikbaar gesteld via Hugging Face. Daarmee kunnen ontwikkelaars en onderzoekers het model lokaal inzetten en verder ontwikkelen. In een lokale omgeving ondersteunt het model continue generatie, besturing via toetsenbord en muis en aanpassing van omgevingen met tekstprompts, bijvoorbeeld voor weer, stijl of andere scène-eigenschappen.

De nieuwe functie volgt op de eerdere open-sourcing van LingBot-World-Base in januari 2026. Daarmee bouwt Robbyant verder aan een reeks modellen voor embodied AI, waaronder technologie voor wereldsimulatie, ruimtelijk begrip en robotbesturing. Voor Ant Group betekent de integratie in LingGuang dat deze technologie nu ook als directe gebruikerservaring op mobiele apparaten wordt getest.

Misschien vind je deze berichten ook interessant