Warum LLMs kein Schema nutzen

„Der gesamte Ansatz von LLMs besteht darin, Wissen aus freiformuliertem Text zu gewinnen – nicht aus strukturierten Daten.“ Mit diesem Satz brachte Michael Curtis auf den Punkt, was viele in der SEO-Szene nur ungern hören: Schema-Markup mag Suchmaschinen helfen, Sprachmodellen jedoch nicht.

Und doch hält sich die gegenteilige Behauptung hartnäckig. Auf Konferenzen oder in Fachgruppen wird sie immer wieder wiederholt: Wer seine Website mit Schema anreichert, habe bessere Chancen, in AI-Antworten aufzutauchen. Was plausibel klingt, verliert jede Grundlage, sobald man sich anschaut, wie Sprachmodelle funktionieren.

LLMs wie ChatGPT oder Gemini verarbeiten Texte durch Tokenisierung. Dabei werden Zeichenfolgen in kleinste Einheiten zerlegt – Tokens. Aus Milliarden solcher Sequenzen lernen die Modelle Wahrscheinlichkeiten: welches Fragment auf welches folgt.

Ein Beispiel verdeutlicht das:
"@type": "Organization"
Beim Tokenisieren wird diese Angabe auseinandergebrochen. Es entstehen separate Tokens für „@“, „type“ und „Organization“. Die semantische Explizitheit des Schemas verschwindet. Für das Modell bleibt nur Text.

Genau deshalb können strukturierte Daten im Training keine Rolle spielen. Ihr Wert liegt in der Eindeutigkeit – und diese wird durch Tokenisierung zerstört.

Tests von Forschenden bestätigen das Bild. Zwei Produktseiten eines fiktiven Artikels wurden erstellt: eine mit sichtbarem Text plus Schema-Markup, die andere ausschließlich mit Schema. Bei hunderten Abfragen konnten Modelle wie Gemini oder ChatGPT Preise oder SKUs nur aus der Seite mit normalem Text wiedergeben. Die rein auf Schema basierende Seite blieb unverständlich.

Das Fazit: Strukturierte Daten bleiben für klassische SEO unverzichtbar. Sie verbessern Rankings und damit indirekt auch die Chancen, in AI-Antworten zitiert zu werden. Doch das ist ein indirekter Effekt. Korrelation ist nicht Kausalität.

Der Glaube, Schema-Markup führe direkt zu Erwähnungen in AI-Kanälen, ist deshalb weniger technische Wahrheit als ein Mythos, der sich im SEO-Ökosystem hartnäckig hält.