Das Wichtigste in 30 Sekunden

  • KI-Systeme wie ChatGPT, Perplexity und Google AI Overview bevorzugen Texte, die eine Frage im ersten Satz direkt beantworten und die Antwort nicht erst im dritten Absatz nachreichen.
  • Das GEO-Paper (Aggarwal et al., Princeton/Georgia Tech, KDD 2024) zeigt: Durch Zitate, Statistiken und Quellenbelege steigt die KI-Sichtbarkeit um bis zu 40 % (kombiniert). Keyword-Stuffing ist die einzige gemessene Methode, die sie senkt.
  • Selbstständige Absätze, die ohne Kontext verständlich sind, werden häufiger zitiert als Absätze, die auf andere Teile des Textes verweisen.
  • Die Messgröße heißt Position-Adjusted Word Count (PAWC). Ohne Optimierung liegt die Baseline bei 19,5. Alle positiven Techniken aus dem Paper liegen zwischen 21,8 und 27,8.

ChatGPT, Perplexity und der Google AI Overview formulieren täglich Millionen von Antworten. Welche Quellen dabei auftauchen und welche nicht, entscheidet sich nicht am Zufall, sondern am Aufbau des Textes. Wer verstehen will, wie KI-Systeme Inhalte auswählen, landet schnell bei einer Erkenntnis: Es geht nicht ums Länger-Schreiben, sondern ums Anders-Schreiben. Dieser Ratgeber zeigt die konkreten Techniken: wie ein Satz aufgebaut sein muss, damit er übernommen wird, warum Zahlen mit Quellenbeleg besser funktionieren als Zahlen ohne, und wo die häufigsten Fehler liegen.

Wichtig für die Einordnung: Dieser Ratgeber behandelt das Schreib-Handwerk, also wie Sie Texte formulieren und strukturieren. Das übergeordnete Konzept GEO erklärt der GEO-Ratgeber, das technische Schema-Markup für FAQ zeigt der FAQ-Artikel, und die Frage, wie KI-Systeme überhaupt Quellen auswählen, behandelt der Artikel über die Quellenauswahl von KI.

Was „zitierfähig“ für KI-Systeme konkret bedeutet

Kurz gesagt: Ein Text ist für KI zitierfähig, wenn ein einzelner Absatz eine Frage vollständig beantwortet, diese Antwort durch eine belegbare Zahl oder eine benannte Quelle stützt und ohne den Rest des Artikels verständlich bleibt.

Generative KI-Systeme verarbeiten Texte in Abschnitten. Ein Sprachmodell, das eine Antwort zusammenstellt, sucht nach der Textstelle, die eine bestimmte Frage am direktesten beantwortet. Findet es einen Absatz, der genau das tut und sich dabei weder auf „wie oben beschrieben“ noch auf Tabellen in anderen Teilen des Dokuments bezieht, kann es ihn direkt übernehmen. Findet es nur Andeutungen, Verweise und allgemeine Formulierungen, weicht es auf eine andere Quelle aus.

Das unterscheidet zitierfähiges Schreiben von gutem Schreiben im allgemeinen Sinne: Gutes Schreiben für Menschen kann Spannung aufbauen, einen Bogen schlagen, den Leser durch ein Argument führen. Zitierfähiges Schreiben für KI-Systeme setzt die Auflösung an den Anfang, nicht ans Ende. Das Prinzip stammt aus dem Journalismus und heißt Inverted Pyramid: Die wichtigste Information zuerst, die Einordnung danach.

Was das GEO-Paper wirklich misst

Die bislang präziseste Messung stammt aus dem Paper „GEO: Generative Engine Optimization“ von Aggarwal et al. (Princeton University, Georgia Tech), akzeptiert auf der ACM KDD 2024. Das Forschungsteam erstellte GEO-Bench, eine Testsammlung aus 10.000 Suchanfragen, und prüfte systematisch, welche inhaltlichen Veränderungen die Sichtbarkeit in generierten Antworten erhöhen oder senken.

Die Metrik heißt Position-Adjusted Word Count: Sie misst, wie viel Text aus einer bestimmten Quelle in der generierten Antwort auftaucht, und gewichtet dabei, ob die Stelle früh oder spät in der Antwort steht. Das Ergebnis ist ein dimensionsloser Score, kein prozentualer Uplift. Die Baseline ohne Optimierung liegt bei 19,5; höhere Werte bedeuten mehr Präsenz in KI-Antworten.

GEO-Methoden und ihr PAWC-Score laut GEO-Paper (Aggarwal et al., KDD 2024)Balkendiagramm (PAWC-Score, Baseline 19,5): Zitate hinzufügen 27,8, Statistiken einbauen 25,9, Fluency Optimization 25,1, Quellenbelege 24,9, Verständlichkeit 22,2, Autoritativer Ton 21,8, Keyword-Stuffing 17,8 (unter Baseline).GEO-Methoden: PAWC-Score in KI-Antworten (Baseline: 19,5)Position-Adjusted Word Count (Score, kein %-Uplift), GEO-Bench (10.000 Queries), Aggarwal et al. KDD 2024Quotation Addition: 27,8Statistics Addition: 25,9Fluency Optimization: 25,1Cite Sources: 24,9Easy-to-understand: 22,2Authoritative Tone: 21,8Keyword Stuffing: 17,8 (unter Baseline)Quelle: arxiv.org/abs/2311.09735
Alle positiven Methoden liegen im PAWC-Score zwischen 21,8 und 27,8 (Baseline: 19,5). Keyword-Stuffing als einzige Methode fällt unter die Baseline. Quelle: Aggarwal et al., GEO: Generative Engine Optimization, KDD 2024.

Drei Befunde aus dem Paper sind besonders relevant für das Schreib-Handwerk:

  • Alle positiven Methoden (Zitate, Statistiken, Quellenbelege, Flüssigkeit, Verständlichkeit, autoritativer Ton) liegen im PAWC-Score zwischen 21,8 und 27,8 (Baseline: 19,5). Keine einzige Technik dominiert dramatisch.
  • Keyword-Stuffing ist die einzige gemessene Methode, die die Sichtbarkeit senkt: Der PAWC-Score fällt auf 17,8 und damit unter die Baseline von 19,5. Wer Texte mit Suchbegriffen überhäuft, schadet sich also aktiv.
  • Die Kombination mehrerer Methoden wirkt stärker als jede einzeln. Das Paper nennt Sichtbarkeitssteigerungen von bis zu 40 % für optimierte Dokumente.

Wichtige Einschränkung: Das Experiment arbeitete mit einem GPT-3.5-turbo-basierten System und Perplexity. Ob dieselben Werte für alle aktuellen Systeme gelten, ist nicht gesichert. Die Richtung ist aber konsistent: Präzision und Belegbarkeit helfen, Aufblähung schadet.

Die Direktantwort im ersten Satz

Kurz gesagt: Der erste Satz eines Absatzes sollte die Kernaussage dieses Absatzes vollständig enthalten. KI-Systeme gewichten den Anfang eines Textabschnitts stärker als das Ende.

79 % der Webnutzer scannen Seiten, statt sie zu lesen, zeigt die Studie von Nielsen Norman Group (Jakob Nielsen, 1997, aktualisiert). KI-Systeme verhalten sich ähnlich: Sie gewichten den Anfang eines Abschnitts höher als das Ende. Ein Absatz, dessen Kernaussage im dritten Satz versteckt ist, wird schlechter erfasst als einer, der mit der Aussage beginnt.

Das konkrete Muster: Überschrift stellt eine Frage, erster Satz beantwortet sie vollständig, der Rest des Absatzes erklärt und belegt. Dieses Muster ist nicht nur für KI-Systeme nützlich, sondern auch für Leser. Laut einer NNG-Studie (Nielsen Norman Group, 1997) erzielen prägnante, deutlich gekürzte Texte eine um 58 % höhere Usability als ausschweifende Versionen desselben Inhalts – ein Befund, der die Richtung bestätigt: Kürze und Direktheit helfen sowohl menschlichen Lesern als auch KI-Systemen.

Was in der Praxis oft falsch läuft: Der Absatz beginnt mit einer allgemeinen Einleitung, die Kontext aufbaut, und kommt erst am Ende auf den Punkt. Für einen Leser, der den ganzen Text liest, ist das verständlich. Für ein KI-System, das einen kurzen Ausschnitt übernehmen soll, ist es unbrauchbar.

Selbstständige Absätze: die wichtigste Einzeltechnik

Ein selbstständiger Absatz (englisch: self-contained paragraph) funktioniert ohne den Rest des Dokuments. Er enthält keine Rückverweise wie „wie oben erwähnt“, keine Vorverweise wie „dazu mehr im nächsten Abschnitt“ und keine Pronomen, deren Bezug erst aus dem Kontext klar wird. Er stellt sein Thema kurz ein und beantwortet es im selben Absatz.

Das klingt nach mehr Arbeit, führt aber zu kürzeren Absätzen, nicht längeren: Wer einen Absatz schreibt, der für sich allein stehen soll, zwingt sich dazu, alles Überflüssige herauszustreichen. Was nicht zur Kernaussage beiträgt, fliegt raus oder wandert in einen eigenen Absatz.

Ein konkretes Beispiel aus der Praxis: Ein Produktbeschreibungs-Absatz für eine Buchhaltungssoftware begann mit „Wie bereits in der Einleitung erwähnt, ist die Automatisierung von Standardprozessen ein wichtiger Faktor.“ Das KI-System hat diesen Absatz nicht zitiert, weil es die Einleitung nicht mitliest. Die überarbeitete Version begann mit: „Die Software automatisiert Mahnläufe, Kontoabgleiche und die Erstellung von Sammelrechnungen, ohne dass der Anwender eingreift.“ Diese Version wurde in mehreren Testanfragen aufgegriffen. Mehr dazu, wie sich das Prinzip auf Produktseiten überträgt, zeigt der Ratgeber Produktbeschreibungen, die KI findet.

Klare Definitionen im Text

KI-Systeme greifen auf Definitionen besonders gern zurück, weil sie direkt verwertbar sind. Eine Definition ist ein selbstständiger Satz, der erklärt, was ein Begriff bedeutet. Sie ist von Natur aus zitierfähig: Sie stellt sich selbst vor, ohne Kontext zu brauchen.

Die Anforderung ist nicht, akademisch zu definieren. Es reicht, in einem Satz zu sagen, was ein Begriff meint, wofür er verwendet wird und wie er sich von ähnlichen Begriffen abgrenzt. „GEO (Generative Engine Optimization) umfasst alle Maßnahmen, mit denen Inhalte so gestaltet werden, dass generative KI-Systeme sie in ihren Antworten zitieren oder empfehlen“ ist eine gute Definition: kurz, vollständig, abgrenzend.

Wo Definitionen fehlen oder zu vage sind, kann ein KI-System eine Quelle nicht als Autorität für diesen Begriff erkennen. Das ist besonders relevant für Fachbegriffe, die im eigenen Bereich standardisiert sind, aber im allgemeinen Sprachgebrauch unterschiedlich verwendet werden. Ein Steuerberater, der „Kleinunternehmerregelung“ nicht definiert, verliert die Chance, als Quelle für alle Fragen zu diesem Begriff aufzutauchen.

Zahlen und Quellenbelege direkt am Zitat

Kurz gesagt: Eine Zahl, die mit ihrer Quelle direkt im Satz steht, ist für KI-Systeme verwertbar. Eine Zahl ohne Quellenangabe ist es weniger, weil das System sie nicht gegenprüfen kann.

Das GEO-Paper weist für „Statistics Addition“ einen PAWC-Score von 25,9 aus, für „Cite Sources“ 24,9 (Baseline: 19,5). Beide Techniken wirken aus demselben Grund: Sie machen eine Aussage überprüfbar. Ein KI-System, das mehrere Quellen zusammenführt, kann einen belegten Wert mit anderen Quellen abgleichen. Stimmen sie überein, steigt das Vertrauen in die Quelle.

Konkret bedeutet das: Nicht „Viele Nutzer lesen Webseiten nicht vollständig“, sondern „79 % der Webnutzer scannen Seiten, statt sie zu lesen, zeigt die Nielsen-Norman-Group-Studie von 1997.“ Die Zahl ist konkret, die Quelle ist benannt, der Satz ist direkt zitierbar.

Zwei Fehler sollte man dabei vermeiden:

  • Zahlen ohne Quelle: „Studien zeigen, dass 80 % der Nutzer…“ ist wertlos, solange die Studie nicht benannt ist. KI-Systeme erkennen vage Autoritätsformeln wie „Studien zeigen“ oder „Experten sagen“ als Schwäche, nicht als Stärke.
  • Zahlen aus schlechten Quellen: Eine Statistik aus einem Anbieter-Blogbeitrag oder einer Eigenerhebung ohne Methodik ist schwächer als eine aus einer peer-reviewed Publikation oder einer Behörde. Die Quelle der Quelle zählt.

Bei Zahlen, für die es keine harte Primärquelle gibt, ist die ehrlichere Alternative: Die Einschätzung als eigene Projekterfahrung kennzeichnen. Das ist glaubwürdiger als eine vorgetäuschte Statistik, die ein Leser beim Nachsehen nicht findet.

Struktur mit Zwischenüberschriften

Zwischenüberschriften (H2, H3) haben zwei Funktionen: Sie helfen menschlichen Lesern zu scannen und KI-Systemen, Abschnitte thematisch einzuordnen. Beide profitieren von Überschriften, die aussagen, was der Abschnitt beantwortet, nicht nur benennen, worum es geht.

„Tipps für bessere Texte“ ist eine thematische Benennung. „Warum der erste Satz über die KI-Sichtbarkeit entscheidet“ ist eine Frage-Antwort-Überschrift. Die zweite Version lädt den KI-Algorithmus ein, in diesem Abschnitt genau nach einer Antwort auf diese Frage zu suchen.

Praktische Regel: Jede H2 sollte einer vollständigen Suchfrage entsprechen, die ein Nutzer tatsächlich stellen würde. H3 sind Unter-Aspekte dieser Frage. Überschriften wie „Einleitung“, „Fazit“ oder „Weiteres“ geben KI-Systemen nichts zu verarbeiten.

Für AEO, also das gezielte Optimieren für Antwort-Engines, ist die Verbindung zwischen Überschrift und erstem Satz besonders wichtig. Was das für die technische Auszeichnung bedeutet, erklärt der AEO-Ratgeber.

Schreibtechniken im Überblick

Schreibtechnik Wirkung auf KI-Zitierung Beleg
Direktantwort im ersten Satz KI gewichtet Absatz-Anfang höher; Antwort wird direkt übernommen GEO-Paper, Fluency/Easy-to-understand, +22–25 %
Selbstständiger Absatz ohne Querverweis Absatz kann aus Kontext herausgelöst und direkt zitiert werden GEO-Paper, Quotation Addition, Score 27,8 (Baseline 19,5)
Klare Definition im ersten Satz Quelle wird als Autorität für diesen Begriff erkannt Strukturprinzip aus GEO-Bench
Zahl + Quellenangabe direkt im Satz Aussage ist gegenprüfbar; Glaubwürdigkeit steigt Statistics Addition Score 25,9, Cite Sources Score 24,9 (Baseline 19,5)
Frage-Antwort-Überschriften (H2/H3) KI ordnet Abschnitt thematisch ein; Snippet-Potenzial steigt Easy-to-understand Score 22,2 (Baseline 19,5)
Keyword-Stuffing vermeiden Sichtbarkeit sinkt; KI bewertet überladene Texte negativ Keyword Stuffing Score 17,8, unter Baseline 19,5
Vage Autoritätsformeln vermeiden „Studien zeigen“ ohne Beleg ist für KI nicht verwertbar Authoritative Tone Score 21,8 (Baseline 19,5)

Vorher-Nachher: zitierfähig vs. nicht

Das Prinzip lässt sich am direkten Vergleich am besten zeigen. Beide Beispiele handeln vom selben Thema: der Ladezeit-Anforderung von Google.

Nicht zitierfähig:

Die Ladezeit einer Website spielt in der heutigen digitalen Welt eine immer wichtigere Rolle. Nutzer erwarten schnelle Seiten, und Suchmaschinen berücksichtigen die Performance bei der Bewertung. Es gibt verschiedene Metriken, die dabei eine Rolle spielen, unter anderem den Largest Contentful Paint. Google empfiehlt, bestimmte Schwellenwerte einzuhalten, um in dieser Hinsicht gut bewertet zu werden.

Dieser Absatz enthält keine einzige überprüfbare Aussage. Kein Wert, keine Quelle, kein Schwellenwert. Ein KI-System kann ihn nicht zitieren, weil er nichts Konkretes aussagt.

Zitierfähig:

Der Largest Contentful Paint (LCP) sollte unter 2,5 Sekunden liegen, damit Google eine Seite in dieser Core-Web-Vitals-Metrik als „gut“ einstuft. Seiten über 4 Sekunden gelten als „schlecht“. Google misst diesen Wert im Chrome User Experience Report und verwendet ihn als Ranking-Signal für die mobile Suche seit Juni 2021.

Dieser Absatz enthält drei konkrete Werte (2,5 s, 4 s, Juni 2021), eine Quelle (Chrome User Experience Report) und eine überprüfbare Aussage (Ranking-Signal). Er ist selbstständig verständlich und direkt zitierbar.

Der Unterschied ist nicht die Länge, sondern die Informationsdichte. Der zweite Absatz ist sogar kürzer.

Ein Beispiel aus der Praxis

In einem Projekt für einen regionalen Handwerksbetrieb haben wir eine Leistungsseite auf Zitierfähigkeit geprüft. Der ursprüngliche Text begann mit: „Als erfahrenes Unternehmen mit jahrelanger Tradition bieten wir Ihnen hochwertige Lösungen für alle Ihre Anforderungen im Bereich Heizung und Sanitär.“ Perplexity hat diese Seite auf keine einzige Anfrage zu Heizungsthemen in der Region zitiert.

Wir haben drei Änderungen vorgenommen: Die erste Sektion erhielt eine Direktdefinition des angebotenen Services mit konkreten Leistungen. Jede H2-Überschrift wurde als Frage formuliert. Und für die wichtigste Frage („Was kostet ein Heizungstausch?“) wurde ein Absatz geschrieben, der die Preisspanne mit Begründung direkt im ersten Satz nannte und auf die Grundlage dieser Schätzung verwies.

Nach der Überarbeitung tauchte die Seite bei drei verschiedenen lokalen Anfragen in Perplexity-Antworten auf. Das war keine Garantie und keine kontrollierte Studie, aber ein deutlicher Hinweis, dass die strukturellen Änderungen wirken. Die Grundlage war dieselbe wie im GEO-Paper: mehr Konkretheit, mehr Belegbarkeit, weniger Allgemeinformeln.

Sofort-Checkliste: Ist mein Text zitierfähig?

  • Beantwortet der erste Satz jedes Absatzes die Kernfrage dieses Absatzes vollständig?
  • Ist jeder Absatz ohne den Rest des Artikels verständlich (keine Rückverweise auf „wie oben“)?
  • Sind wichtige Begriffe im Text explizit definiert, nicht nur verwendet?
  • Steht hinter jeder Zahl eine benannte Quelle direkt im Satz?
  • Sind alle H2-Überschriften als Fragen oder beantwortbare Behauptungen formuliert?
  • Kommen Wörter wie „Studien zeigen“, „Experten sagen“ ohne konkreten Beleg vor? Wenn ja: streichen oder belegen.
  • Enthält der Text Keyword-Häufungen, die sich unnatürlich lesen? Wenn ja: reduzieren.
  • Hat die TL;DR-Box oder die erste Antwort-Box eine direkte, vollständige Aussage, die allein stehend Sinn ergibt?
Direkt umsetzbar: Absatz-Schablone für KI-Zitierbarkeit

Diese Vorlage lässt sich für jeden Ratgeber-Absatz oder FAQ-Eintrag direkt befüllen. Vier Felder, fertig zum Einfügen:

[THEMA/FRAGE als H2 oder H3, formuliert als echte Suchfrage]

[DIREKTANTWORT im ersten Satz: vollständige Kernaussage, ohne Einleitung]
[BELEG: konkrete Zahl oder benannte Quelle direkt im selben Satz,
 z.B. "laut GEO-Paper (Aggarwal et al., KDD 2024)" oder
 "laut Nielsen Norman Group, 1997"]
[EINORDNUNG: ein bis zwei Sätze, die den Befund einordnen oder
 auf Grenzen hinweisen, ohne Rückverweis auf andere Absätze]

Beispiel befüllt:

Wie lange darf der Largest Contentful Paint maximal sein?

Der Largest Contentful Paint (LCP) sollte unter 2,5 Sekunden liegen,
damit Google eine Seite als "gut" einstuft (Core Web Vitals,
Google Search Central, Stand 2024). Seiten über 4 Sekunden gelten als
"schlecht". Google verwendet diesen Wert als Ranking-Signal
für die mobile Suche seit Juni 2021.

Diese Schablone lässt sich auf jede Leistungsseite, jeden Ratgeber-Abschnitt und jede FAQ-Antwort anwenden. Wer die Texte systematisch nach diesem Muster umschreiben möchte, kann das als Teil unserer GEO-Beratung beauftragen.

Das Wichtigste zum Mitnehmen

  • Direktantwort zuerst: Der erste Satz beantwortet die Frage des Absatzes. Der Rest erklärt und belegt.
  • Selbstständige Absätze: Kein Rückverweis auf anderen Kontext. Der Absatz muss für sich allein funktionieren.
  • Zahlen mit Quelle: Eine Zahl ohne Quellenangabe ist für KI weniger verwertbar als eine mit.
  • Keyword-Stuffing schadet nachweislich: Der PAWC-Score fällt auf 17,8 und damit unter die Baseline von 19,5.

Häufige Fragen

Muss ich für jeden Artikel eine TL;DR-Box schreiben?

Nicht zwingend, aber sie ist die einfachste Methode, um zitierfähige Kurzantworten bereitzustellen. Eine gut formulierte TL;DR-Box enthält drei bis vier Sätze, die jede für sich eine vollständige Aussage darstellen. KI-Systeme greifen auf Zusammenfassungen besonders häufig zurück, weil sie ohne Kontext verständlich sind.

Hilft FAQ-Schema zusätzlich zum selbstständigen Absatz?

Ja, aus einem anderen Grund: FAQ-Schema (FAQPage nach Schema.org) teilt Suchmaschinen und abrufgestützten Systemen maschinenlesbar mit, dass ein Abschnitt aus Fragen und direkten Antworten besteht. Das ist eine technische Ergänzung zur inhaltlichen Qualität, ersetzt sie aber nicht. Ein schlecht formulierter FAQ-Absatz mit Schema ist schwächer als ein gut formulierter ohne. Alles zur technischen Umsetzung steht im FAQ-Artikel.

Wie viele Quellenbelege braucht ein Absatz?

Einen, wenn der Absatz eine konkrete Zahl oder eine normative Aussage enthält. Absätze ohne Zahlen oder überprüfbare Fakten brauchen keinen Beleg, solange sie inhaltlich korrekt sind. Die Faustregel: Jede Zahl und jede Aussage, die sich ein Leser nachprüfen würde, bekommt eine Quelle direkt im Satz, nicht nur im Quellenblock am Ende.

Schadet es, wenn mein Text für Menschen gut lesbar ist, aber KI-Strukturen fehlen?

Nicht direkt, aber es verschenkt Potenzial. Ein Text, der für Menschen gut ist, zieht Leser an. Ein Text, der zusätzlich zitierfähig ist, zieht auch KI-Systeme als Multiplikator an. Beides schließt sich nicht aus, weil die Techniken, die KI-Zitierbarkeit erhöhen (klare Struktur, Direktantworten, belegte Zahlen), auch für menschliche Leser besser sind.

Ist der Aufwand für kleine Unternehmen realistisch?

Ja, wenn man nicht alle Seiten auf einmal überarbeitet. Sinnvoll ist, mit den Seiten zu beginnen, auf denen die wichtigsten Kundenanfragen beantwortet werden: die Hauptleistungsseite, die Preisseite und der meistgesuchte Ratgeber-Artikel. Drei gut strukturierte Seiten bringen mehr als zwanzig mittelmäßige. Wie eine vollständige GEO-Strategie für KMU aussieht, zeigt der GEO-Ratgeber.