Lexikon RAG

Definition RAG

RAG steht für Retrieval-Augmented Generation und meint die Kombination vorhandener Daten (Foundation) mit Daten aus neuen, externen Dokumenten. Dadurch soll sich die Datenbasis deutlich verbessern, was Antworten hilfreicher, aktueller sowie spezifischer ausfallen lassen kann.

RAG ist besonders nützlich für Unternehmenswissen, aktuelle Informationen und Compliance. Es reduziert Halluzinationen und macht Antworten nachvollziehbarer, wenn die Quellen passen. Daher versucht man als smarter Anwender beim Einsatz von KI-Lösungen die Nutzung von RAG gezielt einzusetzen.

Inhaltsübersicht

RAG kann Web, Intranet, PDFs, Tickets, Handbücher oder Datenbanken nutzen. Die Antwort wird dadurch mit einem definierten, kontrollierten Wissensraum fokussiert bzw. „geerdet“.

/files/dateien/bilder/lexikon/rag/rag.png
RAG verbindet Suche (Retriever) und Generierung (LLM), damit Antworten auf Ihrer Wissensbasis beruhen.

RAG Typischer Ablauf

1
Inhalte aufbereiten

Dokumente sammeln, bereinigen, versionieren

2
Index bauen

In „Chunks“ teilen, Embeddings erzeugen, speichern

3
Retrieval

Passende Chunks zur Frage suchen (Ranking!)

4
Generation

LLM antwortet mit den gefundenen Textstellen als Kontext

5
Optional

Quellen ausgeben, Zitate markieren, Feedback speichern

RAG Vorteile

  • Aktuelles Wissen ohne Modell-Neutraining
  • Bessere Faktentreue (weniger Halluzinationen)
  • Mehr Transparenz durch Quellenhinweise
  • Ideal für Richtlinien, Produkte, Prozesse, Support, interne Wissensdatenbanken

RAG Typische Fehler

  • Schlechte Chunking-Strategie: Kontext reißt auseinander.
  • Veraltete Dokumente: RAG liefert „alte Wahrheit“.
  • Falsches Ranking: Die Suche findet nicht das Relevante, sondern das Naheliegende.
  • Zu viel Kontext: Das Modell verliert Fokus (oder „mischt“ Quellen).

RAG Best Practices

  1. „Single Source of Truth“ definieren: Welche Dokumente sind verbindlich?
  2. Dokumente pflegen: Ownership, Aktualität, Versionen.
  3. Rechte beachten: Zugriff nach Rollen, nicht „alles für alle“.
  4. Qualität messen: Testfragen, Trefferquote, Antwortqualität, Fehlerraten.
  5. Ausgabe standardisieren: z. B. „Antwort + Quellen + Unsicherheiten“.

FAQ Häufige Fragen zu RAG

Was ist RAG in einem Satz?

RAG lässt die KI vor der Antwort relevante Dokumente abrufen, damit sie auf Ihrer Wissensbasis antwortet.

Macht RAG Antworten immer korrekt?

Nein – aber deutlich häufiger. Qualität hängt stark von Datenpflege, Retrieval und Prompt-Regeln ab.

Welche Daten eignen sich besonders?

Handbücher, FAQs, Richtlinien, Produktdaten, Support-Tickets, Prozessdokumentation – also alles, was „nachschlagbar“ ist.

Brauche ich dafür viele Daten?

Nicht zwingend. Lieber wenige, saubere Dokumente als viele veraltete oder widersprüchliche.

Kann RAG Quellen angeben?

Ja, wenn Sie das Setup darauf auslegen (z. B. Abschnitt/Datei/Link-ID je Chunk speichern).

Quellen, weiterführende Links

Suche
insert coin
Katzen YouTube Thumbnail

Mit dem Aufruf des Videos erklären Sie sich einverstanden, dass Ihre Daten an YouTube übermittelt werden und Sie die Datenschutzerklärung akzeptieren.