Kann KI Halluzination komplett vermeiden?

Nein. Auch Retrieval-Augmented Generation (RAG) reduziert Halluzination nur, eliminiert sie nicht: eine Stanford-RegLab-Studie (2024) maß bei führenden juristischen RAG-Tools 17-33 % Halluzination. Quanta setzt deshalb auf mehrere Schichten: grounden, wo eine Quelle existiert; bei hochriskanten Behauptungen ohne Quelle nichts ausliefern; und unabhängig (Cross-Model) prüfen statt dem Modell selbst zu vertrauen.

Warum prüft Quanta nicht einfach das Modell sich selbst?

Weil Selbst-Einschätzung nachweislich unzuverlässig ist: Anthropics eigene Arbeit (Kadavath et al., 2022) zeigt, dass das Selbstwissen eines Modells out-of-distribution nicht kalibriert. Ein Modell, das sich selbst benotet, teilt seinen blinden Fleck. Quanta prüft KI-Wissen-Karten daher mit einem anderen Modell als Devil’s Advocate.

Was bedeutet „Quanta-verifiziert" genau?

Das grüne Siegel bedeutet QUELLENTREUE: der Beleg-Satz der Karte wurde durch einen deterministischen Quote-Match (kein zweites KI-Urteil) wörtlich oder normalisiert in der angebundenen Quelle gefunden. Es bedeutet „belegt", nicht „garantiert wahr" — die Korrektheit ist damit an der Quelle nachprüfbar statt behauptet.

Wie Quanta Halluzination strukturell verhindert

Die Forschungslage

Grounding allein genügt nicht

Der akzeptierte Standard für Faktentreue ist Retrieval-Augmented Generation (RAG): die Antwort wird an extern abgerufenen Quellen verankert statt aus dem Modellgedächtnis erfunden (Lewis et al., NeurIPS 2020, arXiv:2005.11401). Das ist richtig , aber als alleinige Maßnahme nachweislich unzureichend:

RAG halluziniert weiter. Die Stanford-RegLab-Studie (Magesh et al., 2024, arXiv:2405.20362) maß bei führenden juristischen RAG-Tools 17-33 % Halluzination , trotz Quellenanbindung. RAGTruth (Niu et al., ACL 2024) belegt: Modelle behaupten auch mit Quelle Dinge, die nicht im Abruf stehen.
Selbst-Einschätzung ist das falsche Signal. Anthropics eigene Arbeit (Kadavath et al., 2022, arXiv:2207.05221) zeigt, dass das Selbstwissen eines Modells out-of-distribution nicht kalibriert. Der gefährlichste Fehler ist die selbstsicher-falsche Aussage , die ein Selbst-Check gerade nicht fängt.
Was empirisch wirkt: unabhängige Prüfung (Cross-Model statt Selbst-Urteil), Konsistenz-/Entropie-Signale (semantische Entropie, Farquhar et al., Nature 2024, doi:10.1038/s41586-024-07421-0) und Abstention , lieber nichts ausliefern als Ungeprüftes.

Was wir daraus gebaut haben

Eine Pipeline, fünf Schichten

Aus dieser Forschung leitet Quanta eine bewusste Architektur ab , kein Versprechen, das man brechen kann, sondern ein Stapel sich ergänzender Sicherungen:

Grounding-first. Jedes Thema versucht zuerst, aus geprüften, offen lizenzierten Bildungsquellen zu grounden. Gelingt das, trägt jede Karte einen deterministischen Quote-Match , ihr Beleg-Zitat wird zeichengenau in der Quelle wiedergefunden (kein zweites KI-Urteil). Nicht belegbare Karten werden verworfen.
Abstention als Default. Findet sich keine Quelle, liefert Quanta standardmäßig einen ehrlichen Hinweis statt erfundener Inhalte. KI-Wissen entsteht nur nach ausdrücklicher Wahl.
Unabhängige zweite Schicht. Wird KI-Wissen bewusst erzeugt, prüft es ein anderes Modell (nicht der Generator selbst) auf fachliche Korrektheit und Informativität , bricht die Fehler-Korrelation der Selbst-Benotung.
Claim-Risiko-Gate. Hochriskante Spezifika ohne Quelle , Dosierungen, konkrete Zahlen mit Einheit, Paragrafen, Fristen , werden ungegroundet nie ausgeliefert. Fach-agnostisch am Inhalt erkannt, nicht per Fächer-Blocklist.
Ehrliches Siegel + gemessene Rate. Quellentreue Karten tragen das grüne Siegel, KI-Wissen ein graues „ungeprüft". Die Trefferquote ist gemessen und im offenen Datensatz nachrechenbar , nicht behauptet (siehe Studie).

Die wichtigste Unterscheidung

Quellentreue ist nicht Faktenrichtigkeit

Der grüne Haken bedeutet „belegt", nicht „garantiert wahr". Quote-Match beweist, dass eine Aussage so in der angebundenen Quelle steht , die Verantwortung für die Korrektheit liegt damit nachprüfbar bei der Quelle statt bei einer Behauptung der KI. Das ist die ehrlichste Form, die für maschinell erzeugtes Lernmaterial überhaupt erreichbar ist, und sie ist an jeder Karte zur Quelle rückverfolgbar.

Ehrlichkeit

Was wir bewusst NICHT behaupten

Es gibt keine Methode, die die Korrektheit einer ungegroundeten KI-Aussage garantiert , das ist eine fundamentale Grenze, kein Quanta-Problem. Deshalb verspricht Quanta nicht „immer korrekt". KI-Wissen ist ein bewusst gewählter, mehrschichtig geprüfter und klar gekennzeichneter Notnagel für quellenlose Themen , kein Ersatz für eine belegte Karte. Der gegroundete Pfad ist und bleibt der Standard.

Die Zahlen zu Quantas eigener Quellentreue , 100 % der ausgelieferten Karten mit Beleg-Zitat, Quote-Match-Rate, offener Roh-Datensatz , stehen in der Mess-Studie „KI ohne Halluzination". Recherchiert und gebaut von Amos Matzke, Gründer von Quanta , die RAG-Halluzinations-Forschung geprüft und die Architektur bewusst daraus abgeleitet.

Amos Matzke·Gründer & Full-Stack Architect · ehem. MINT-EC Schüler·Juni 2026

Wie Quanta Halluzination strukturell verhindert

Grounding allein genügt nicht

Eine Pipeline, fünf Schichten

Quellentreue ist nicht Faktenrichtigkeit

Was wir bewusst NICHT behaupten

Häufige Fragen zur Architektur

Lernkarten, deren Korrektheit du nachprüfen kannst