Gartner verwacht dat in 2028 zo’n 80% van de generatieve AI-toepassingen (GenAI) binnen organisaties ontwikkeld zal worden op bestaande datamanagementplatformen. Deze verschuiving moet de ontwikkeltijd en complexiteit van GenAI-toepassingen met ongeveer 50% terugdringen.
Op dit moment vraagt het bouwen van GenAI-toepassingen doorgaans om de integratie van grote taalmodellen (LLM’s) met interne bedrijfsdata, in combinatie met technologieën zoals vector search, metadata-beheer, promptontwerp en embedding. Volgens Prasad Pore, Senior Director Analyst bij Gartner, leidt een gebrek aan samenhang tussen deze componenten tot langere doorlooptijden en mogelijk inefficiënt gebruik van middelen.
Nu steeds meer organisaties GenAI-oplossingen implementeren, zullen dataplatformen zich volgens Gartner moeten ontwikkelen om deze toepassingen te ondersteunen. Dit betekent onder meer dat ze functionaliteiten moeten bevatten die AI-integratie mogelijk maken.
Retrieval-augmented generation (RAG) wordt daarbij genoemd als een essentieel onderdeel van GenAI-implementaties. Deze architectuur verrijkt taalmodellen met context door gegevens uit zowel gestructureerde als ongestructureerde bronnen te combineren. Volgens Gartner zorgt dit voor meer flexibiliteit, transparantie en modulaire opbouw van GenAI-systemen.
Pore licht toe dat LLM’s, die doorgaans zijn getraind op openbare datasets, vaak onvoldoende zijn toegesneden op specifieke zakelijke behoeften. Door ze te combineren met eigen bedrijfsdata via het RAG-model, neemt hun effectiviteit echter aanzienlijk toe. Daarbij speelt metadata, vastgelegd in datacatalogi, een belangrijke rol in het creëren van context en traceerbaarheid.
Gartner adviseert organisaties om hun huidige datamanagementplatformen te evalueren op hun potentieel als RAG-as-a-service-platform. Deze kunnen dan fungeren als primaire kennisbron voor GenAI-toepassingen, in plaats van losse document- of datastores. Daarnaast wordt geadviseerd om RAG-technologieën te omarmen, zoals vector search en op grafen gebaseerde chunking, hetzij binnen de bestaande infrastructuur, hetzij via technologiepartners. Het gebruik van zowel technische als operationele metadata wordt aanbevolen om misbruik, privacyproblemen en risico’s rond intellectueel eigendom te beperken.