Wie und warum wir KI-Suchantworten systematisch beobachten

Was sagt ChatGPT eigentlich über deine Organisation? Und woher weiss es das? Über die Notwendigkeit eines systematischen Monitorings von KI-Suchantworten sprachen Moritz Zumbühl und Moritz Friess in einem Livestream und teilten dabei Erkenntnisse aus rund 300 automatisiert ausgewerteten Antworten zu konkreten Fragen.

Die klassische Google-Suche war über viele Jahre der Standard für die Informationsbeschaffung. Diese Logik wird gerade auf den Kopf gestellt: ChatGPT, Perplexity, Gemini und viele andere durchsuchen heute das Web und generieren direkt Antworten. Auch Google selbst hat mit seinen AI Overviews und dem KI-Modus zurückgeschlagen. Laut Digimonitor-Studie 2025 nutzen rund 2,7 Millionen Menschen in der Schweiz KI bereits aktiv als Suchmaschine. Die tatsächliche Zahl dürfte höher liegen, denn viele Menschen merken gar nicht, dass sie mit einer KI-generierten Antwort interagieren, wenn sie etwa eine Google AI Overview lesen.

Vier Arten der Suche – und ein neues Suchverhalten

Moritz Friess unterscheidet vier Formen der KI-gestützten Informationsbeschaffung: die klassische Google-Suche mit eingeblendeter KI-Antwort, die chatbasierte Suche im Dialog, die sogenannte Deep Research mit Research Agents und schliesslich die API-basierte Suche, die auch automatisiert von Software-Systemen ausgelöst werden kann.

In Bildern gesprochen: «Die klassische Suche ist wie ein Index in einem Buch. Die chatbasierte Suche ist eher wie ein Gespräch mit einer Expertin. Deep Research ist ein Recherche-Assistenzsystem – man gibt einen Auftrag und erhält später eine Sammlung von Quellen und Einordnungen.»

Verändert hat sich auch, wie wir suchen. Aus Stichworten wie «Ungleichheit Schweiz Statistik 2025» werden in KI-Interfaces ganze Sätze. Die bisherigen Daten zeigen: Je präziser die Frage formuliert ist, desto konsistenter fallen die Antworten auch aus.

Drei Beispiele, drei Befunde

Um zu verstehen, was KI-Systeme tatsächlich antworten, hat Moritz Fragen automatisiert wiederholt gestellt und die Antworten gespeichert.

Bei der Frage «Wann ist der Abstimmungstermin zur Halbierungsinitiative?» wurden knapp 300 Antworten gesammelt. Das Ergebnis ist ein bunter Strauss an Antwortmustern: mal hiess es, der Termin sei unklar, mal noch nicht festgelegt, mal wurden vorgelagerte politische Prozesse mit dem Abstimmungstermin verwechselt. «Entscheidend ist nicht, ob eine einzelne Antwort falsch ist», so Moritz. «Entscheidend ist, ob falsche oder verzerrte Antworten quantitativ relevant sind.»

Auch die scheinbar banale Frage «Wie vergrössere ich die Schriftgrösse auf dem iPhone?» liefert spannende Befunde. Inhaltlich waren die Antworten meist korrekt. Bemerkenswert ist allerdings: Obwohl in rund 90 Prozent der Antworten Apple.com als Domain zitiert wurde, kamen 31 verschiedene Apple-URLs vor. Selbst bei einfachen, gut dokumentierten Fragen zitieren KI-Systeme also nicht einfach «die naheliegendste Quelle».

Heikler wird es bei der Frage zur Brandkatastrophe in Crans-Montana. Hier zeigten sich in rund 240 Antworten fünf unterschiedliche Cluster. Diese reichen von Verweisen auf institutionelle Verantwortung über die Verwechslung mit dem Lawinenereignis von 2019 bis hin zu Antworten, die die Verantwortung primär bei den Betreibern verorten. «Für Organisationen, Behörden oder Komitees ist also entscheidend, ob bestimmte Narrative nur vereinzelt auftauchen oder systematisch reproduziert werden», sagt Moritz.

Reputationsrisiko Zero Click

Hinter dem Monitoring-Bedarf steht ein grösseres Thema: Plattformmacht und das sogenannte Zero-Click-Problem. KI-Antworten führen dazu, dass Menschen auf der Plattform bleiben, statt auf externe Websites zu klicken. Das betrifft Medien, Verbände, Verwaltungen, Unternehmen und damit deren Sichtbarkeit, Botschaften und Reputation.

Hinzu kommt: Was Google Search Console oder klassische SEO-Tools liefern, reicht nicht aus, um zu verstehen, welche Antworten KI-Systeme tatsächlich produzieren. Vielleicht ist ersichtlich, dass ein Klick von ChatGPT oder Perplexity stammt, aber nicht, welche Frage gestellt und welche Antwort gegeben wurde. «Darum braucht es eigene Datensammlungen», so Moritz.

Was Organisationen jetzt tun können

Aus den bisherigen Beobachtungen leiten Moritz und Moritz fünf konkrete Empfehlungen ab:

Systematisches Monitoring aufbauen: https://feinheit.ch/angebot/ki-angebote/
Klassische SEO nicht abschreiben: Sichtbarkeit, Aktualität und Autorität bleiben wichtig
Inhalte so strukturieren, dass Maschinen sie gut verstehen: klare FAQs, strukturierte Daten, eindeutige Quellen
Nicht in Panik-Content-Strategien verfallen, nur um KI-Systeme zu füttern
Mit echten Daten arbeiten: «Wer nur Blogposts liest, schwimmt an der Oberfläche. Wer eigene Daten sammelt, taucht in die Tiefe und lernt viel schneller, wie diese Systeme tatsächlich funktionieren.»

Fazit

Drei Erkenntnisse stechen hervor: Keine KI-Antwort ist identisch, denn selbst bei gleicher Frage variieren Formulierungen und zitierte Quellen erstaunlich stark. Die Anbieter unterscheiden sich deutlich darin, wie nahe sie an einer fachlichen Baseline bleiben. Und: Google ist keineswegs erledigt. «Im Gegenteil, Google schlägt stark zurück und wird im KI-Suchkontext weiterhin eine zentrale Rolle spielen», so Friess.

Für Organisationen bedeutet es, dass die Pflege der eigenen Website nicht mehrs ausreicht. Wer wissen will, was über die eigene Marke, das eigene Anliegen oder den eigenen Abstimmungskampf erzählt wird, muss zuhören. Auch dort, wo Maschinen sprechen.

Das ganze Gespräch kann hier nachgeschaut werden:

Wir möchten Ihnen gerne Inhalte des Anbieters YouTube anzeigen, aber respektieren Ihre Privatsphäre. Falls Sie mit der Datenschutzerklärung des Anbieters einverstanden sind, klicken Sie bitte den folgenden Button, um die Inhalte anzuzeigen.

Mehr Inputs von Feinheit zu generativer KI:

Ich bin Digital Innovation Facilitator bei Feinheit. Interesse an einer eigenen Analyse?

+41 78 664 10 94