RAG: Retrieval-Augmented Generation

Wat is RAG?

Retrieval-Augmented Generation (RAG) is een AI-techniek waarbij een taalmodel niet alleen antwoord genereert op basis van zijn training, maar ook relevante informatie ophaalt uit externe bronnen, zoals documenten, kennisbanken of databases. Hierdoor worden de antwoorden nauwkeuriger en relevanter.

Waarom RAG handig is

Context window probleem

LLMs hebben een beperkt context window: ze kunnen maar een bepaald aantal tokens tegelijk verwerken. Alles wat buiten dit window valt, kan door het model “vergeten” worden.

Voorbeeld: je zegt Mijn naam is Marco van Basten aan het begin van een lange sessie. Later kan de AI dit niet meer onthouden zonder RAG.

Concrete use-case: bijles met PDF

Stel: je bent student en wilt AI gebruiken voor bijles. Je kunt een PDF van je boek uploaden en vragen stellen zoals voor een toets of om uitleg over specifieke hoofdstukken te krijgen.

Andere relevante use-cases

Samengevat