AI-agents worden in steeds meer bedrijven getest, maar veel projecten stranden nog voordat ze echt op schaal worden ingezet. Een belangrijke oorzaak is dat deze systemen wel informatie kunnen ophalen, maar vaak onvoldoende begrijpen welke informatie op dat moment werkelijk van toepassing is. Daardoor kunnen ze verkeerde beslissingen nemen, oude regels gebruiken of eerdere goede oplossingen weer vergeten.
Veel enterprise-oplossingen maken gebruik van RAG, Retrieval Augmented Generation. Daarbij haalt een AI-systeem relevante documenten op uit bijvoorbeeld databases, logbestanden, beleidsstukken of ERP-systemen. Die documenten worden vervolgens aan het taalmodel aangeboden, zodat het antwoord beter aansluit op de beschikbare bedrijfsinformatie. Voor chatbots kan dat goed werken, maar voor agents die zelfstandig beslissingen moeten nemen of acties uitvoeren, blijkt het vaak onvoldoende.
Vergeten
Het probleem is dat RAG vooral documenten terugvindt, maar geen volledig besliskader biedt. Een document zegt niet automatisch of een regel nog geldig is, of een uitzondering inmiddels is verlopen, of dat een andere afspraak zwaarder weegt. In complexe bedrijfsomgevingen kan dat grote gevolgen hebben. Een AI-agent kan dan overtuigend handelen op basis van informatie die verouderd, onvolledig of tegenstrijdig is.
Daarom wordt gekeken naar zogeheten decision context graphs. Zo’n besliscontextgrafiek legt gestructureerd vast welke regels, uitzonderingen en beslissingen in welke situatie gelden. Ook tijd speelt daarbij een belangrijke rol. Een systeem moet immers kunnen onderscheiden wat op een eerder moment waar was en wat nu nog steeds geldt. Dat maakt beslissingen beter uitlegbaar en beter controleerbaar.
Non-regressiviteit
Startup Rippletide, actief binnen het Neo4j-ecosysteem, werkt aan zo’n aanpak. Volgens medeoprichter Yann Bilien draait het vooral om non-regressiviteit: voorkomen dat een AI-agent eerder geleerde en gevalideerde stappen weer kwijtraakt wanneer hij nieuwe taken leert. Als een bepaalde reeks handelingen goed is bevonden, kan die als stabiele basis worden vastgelegd. Nieuwe oplossingen worden dan niet telkens vanaf nul gezocht, maar gebouwd op eerder bewezen gedrag.
Dat is belangrijk voor sectoren waar fouten nauwelijks acceptabel zijn. In bijvoorbeeld banken, verzekeraars, klantenservice of compliance-omgevingen is een betrouwbaarheid van 95 procent vaak niet genoeg. Een klein foutenpercentage kan bij duizenden of miljoenen transacties grote gevolgen hebben.
Beter auditeerbaar
De belofte van decision context graphs is dat AI-agents niet alleen informatie ophalen, maar ook leren wanneer die informatie relevant, geldig en toepasbaar is. Daarmee kunnen ze consistenter, beter uitlegbaar en beter auditeerbaar worden. De grote vraag blijft wel of bedrijven hun vaak rommelige en versnipperde data daadwerkelijk automatisch genoeg kunnen structureren om deze aanpak breed toepasbaar te maken.