Le concept de RAG a été introduit avec l’objectif de surmonter les limites des modèles IA entraînés sur des données fixes. Cependant, les premières implémentations étaient statiques et dépendaient d’entrées utilisateur pour activer la récupération.
L’émergence des agents IA autonomes a permis d’intégrer cette approche dans des systèmes plus dynamiques, donnant naissance à l’Agentic RAG. Les premiers cas d’usage ont été observés dans des domaines exigeant une haute précision, comme la recherche scientifique ou la finance.
Les avancées récentes en fine-tuning et en apprentissage par renforcement (Reinforcement Learning) ont accéléré le développement de ces systèmes, rendant les agents RAG plus autonomes et polyvalents.