Large Language Models
DeepSeek's cache zakt naar een tiende, je RAG wordt spotgoedkoop
DeepSeek heeft alle input cache hits naar een tiende verlaagd. Voor wie agents of RAG-pipelines bouwt is de rekening opeens fors anders.
Lees meer →