Bevor die Maschine „wahr“ sagt

19. Juni 2026

Bevor die Maschine „wahr“ sagt

„KI prüft Fakten“ klingt nach einer Maschine, die einen Satz liest und „stimmt“ oder „stimmt nicht“ antwortet. So funktioniert es nicht. Bevor irgendetwas geprüft wird, muss ein verschachtelter Satz erst zerlegt werden — in einzelne, je für sich prüfbare Aussagen. Aus „Müller, seit 2019 im Amt, hob die Gebühr um 12 Prozent an“ werden drei Behauptungen, die man getrennt gegen die Welt halten kann. Dieser erste Schritt ist unsichtbar, und an ihm hängt alles Spätere.

Ein Preprint von gestern schraubt genau dieses Fundament auf — und findet darunter zwei Dinge, die man nicht erwartet, wenn man dem Begriff „Faktencheck“ vertraut.

Erstens die Messlatte. Wie gut eine Zerlegung ist, wurde bislang über die Wort-Überlappung mit einer Musterlösung gemessen. Das heißt: „Die Gebühr stieg“ und „Die Abgabe wurde erhöht“ gelten als verschieden, weil kaum ein Wort gleich ist — obwohl sie dasselbe sagen. Eine Methode, die Umformulierungen bestraft, misst beim Sprach-Zerlegen ausgerechnet das Falsche. Die Autoren ersetzen sie durch einen Bedeutungs-Vergleich und gewinnen je nach Datensatz 15 bis 32 Prozentpunkte. Nicht weil die Maschinen besser wurden — sondern weil das Lineal vorher krumm war.

Zweitens die Selbstkorrektur. Es gilt als Fortschritt, ein Sprachmodell seine eigene Arbeit nachbessern zu lassen: zerleg den Satz, schau drüber, repariere. Das Paper zeigt formal, dass diese Schleife sich verschlimmbessern kann — in rund vier Prozent der Fälle baut das Modell beim Nachbessern neue Fehler ein. Ohne eine Notbremse, die den Vorgang zwangsweise abbricht, dreht sich die selbstkorrigierende KI potenziell im Kreis. Das langweilige, regelbasierte Verfahren daneben hat genau die Garantie, die dem glänzenden Modell fehlt: Es hält nachweislich nach endlich vielen Schritten an und macht die Sache dabei nie schlechter.

Das ist das eigentlich Erhellende. Der Apparat, der hier zuverlässig terminiert, ist nicht das große Sprachmodell, sondern ein Satz nüchterner Regeln. Und die Modelle, mit denen das alles ordentlich läuft, sind klein — 3,8 bis 12 Milliarden Parameter, Sachen, die auf eigener Hardware laufen. Für das Zerlegen eines Satzes braucht es keinen Konzern-Frontier-Dienst in einem fremden Rechenzentrum.

Ein einzelner, noch nicht begutachteter Preprint widerlegt keine Industrie, und so soll das hier nicht klingen. Aber er macht den unsichtbaren Schritt sichtbar — und wer das nächste Mal hört, eine KI habe etwas „als Falschinformation eingestuft“, darf die Frage stellen, was darunter eigentlich läuft. Meistens steht unter dem Urteil eine Zerlegung, eine Metrik und eine Schleife. Und mindestens zwei davon waren wackliger als das Wort „Faktencheck“ vermuten lässt.

Quelle: arXiv 2606.19819 (Tran, Mai, Le)

▸ Souveränität · ▸ KI & Macht