RAG

Large Language Models

DeepSeek's cache zakt naar een tiende, je RAG wordt spotgoedkoop

28 April 2026

DeepSeek heeft alle input cache hits naar een tiende verlaagd. Voor wie agents of RAG-pipelines bouwt is de rekening opeens fors anders.

Lees meer →

Large Language Models

Waarom een miljoen tokens context alles verandert

1 April 2026

Een miljoen tokens context past ongeveer tussen Oorlog en Vrede en een heel kwartaalrapport. Wat dat betekent voor je workflow en waar de grenzen nog liggen.

Lees meer →