<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Rag on kaschnai</title><link>https://kaschnai.ch/tags/rag/</link><description>Recent content in Rag on kaschnai</description><generator>Hugo</generator><language>de</language><lastBuildDate>Thu, 28 May 2026 11:30:00 +0200</lastBuildDate><atom:link href="https://kaschnai.ch/tags/rag/index.xml" rel="self" type="application/rss+xml"/><item><title>RAG (Retrieval-Augmented Generation), einfach erklärt</title><link>https://kaschnai.ch/konzepte/2026-05-28-rag-retrieval-augmented-generation-erklaert/</link><pubDate>Thu, 28 May 2026 11:30:00 +0200</pubDate><guid>https://kaschnai.ch/konzepte/2026-05-28-rag-retrieval-augmented-generation-erklaert/</guid><description>&lt;p>RAG ist seit 2023 das dominante Pattern wenn du LLMs mit eigenen Daten arbeiten lassen willst, ohne fine-tuning. Trotz neuer Long-Context-Modelle bleibt es 2026 das verbreitetste Architecture-Pattern in Produktion. Hier knapp erklärt was es ist, wie es funktioniert, und wo die ehrlichen Grenzen liegen.&lt;/p>
&lt;h2 id="in-einem-satz">In einem Satz&lt;/h2>
&lt;p>RAG ist ein Pattern bei dem ein LLM vor der Antwort relevante Dokumente aus einer eigenen Wissensbasis sucht (typisch via Vector-Search), diese in den Context lädt und dann antwortet.&lt;/p></description></item></channel></rss>