Das Web Model Context Protocol (WebMCP) ist der technologische Standard, der das möglich macht. Von Google und Microsoft vorangetrieben und seit Februar 2026 als offizieller W3C-Entwurf veröffentlicht, gibt WebMCP Websites eine strukturierte, maschinenlesbare Schnittstelle, über die KI-Agenten direkt mit ihren Funktionen arbeiten können. Für uns als Digitalagentur VERDURE ist das kein abstraktes Zukunftsthema, sondern eine konkrete Anforderung für aktuelle Relaunch-Projekte.
Die Evolution der Interaktion: Vom menschlichen Interface zum maschinellen Protokoll
Die Geschichte des Webs ist eine Geschichte der Abstraktion. In den frühen Tagen war der Datenzugriff eng an die Serverstruktur gekoppelt. Grafische Benutzeroberflächen machten das Web für die breite Masse zugänglich, mit Designprinzipien wie visueller Hierarchie, Weißraum und Klick-Leads. Das Ergebnis sind heute hochkomplexe, interaktive Webanwendungen, die jedoch ein gemeinsames Problem haben: Sie sind für das menschliche Auge und den menschlichen Zeigefinger gebaut, nicht für automatisierte Systeme.
KI-Agenten, die heute das Web nutzen wollen, stoßen auf eine gläserne Wand. Sie müssen Webseiten wie ein Mensch interpretieren: Quellcode (DOM) analysieren, Barrierefreiheits-APIs auswerten, Screenshots per Computer Vision verarbeiten. Das ist fehleranfällig, langsam und teuer. Schon eine kleine CSS-Änderung oder ein verschobener „Kaufen“-Button kann dazu führen, dass ein Agent seine Aufgabe abbricht.
WebMCP löst das, indem es die Interaktion von der visuellen Oberfläche auf eine logische, vertragsbasierte Ebene verlagert. Alex Nahas (Amazon/MCP-B) entwickelte das Konzept ursprünglich als browserbasierte Erweiterung des Model Context Protocols. Im September 2025 nahm die W3C Web Machine Learning Community Group den Standard auf, am 10. Februar 2026 erschien der offizielle „Draft Community Group Report“.
Der konzeptionelle Unterschied ist erheblich. Statt dass ein Agent raten muss, was ein blaues Element mit der Aufschrift „Checkout“ bedeutet, stellt die Website über WebMCP ein explizites Werkzeug bereit, mit klaren Definitionen für Eingabewerte und erwartete Ausgaben. Das ähnelt der Revolution der APIs, mit einem entscheidenden Unterschied: Die Konsumenten dieser Schnittstellen sind keine menschlichen Entwickler, sondern autonome KI-Modelle, die diese Werkzeuge in Echtzeit im Browser des Nutzers entdecken und nutzen.
Die folgende Tabelle zeigt, was WebMCP im Vergleich zu herkömmlichen Methoden der Web-Automatisierung konkret verändert:
| Merkmal | Traditionelles Screen Scraping | API-Integration (REST/GraphQL) | WebMCP (W3C-Standard) |
|---|---|---|---|
| Interaktionsbasis | Visuelle Elemente / DOM | Strukturierte Daten-Endpunkte | Client-seitige Tool-Verträge |
| Robustheit | Gering (bricht bei Designänderungen) | Hoch (erfordert jedoch Wartung) | Hoch (logisch vom UI getrennt) |
| Entdeckung | Manuelle Programmierung / Heuristik | Dokumentation / Verzeichnisse | Dynamische In-Browser Discovery |
| Authentifizierung | Session-basiert (komplex für Bots) | Token-basiert (aufwendig) | Erbt aktive Nutzersitzung direkt |
| Kosten | Hoch (hoher Token-Verbrauch) | Mittel (Infrastrukturkosten) | Gering (optimierte Token-Nutzung) |
Technische Grundlagen: Die zwei Wege von WebMCP
WebMCP funktioniert so, dass eine geöffnete Webseite direkt im Browser-Tab als Anbieter von Kontext und Fähigkeiten auftritt. Der Agent erbt dabei automatisch die aktive Nutzersitzung, bestehende Cookies und Berechtigungen. Damit entfällt das größte Problem klassischer Backend-APIs: Es braucht keine komplexen OAuth-Flows und keine API-Keys, die Drittanbieter verwalten müssen.
Für Entwickler gibt es zwei Wege, eine Website agent-ready zu machen.
1. Die deklarative API (HTML-basiert)
Das ist der schnellste Weg für Websites, die bereits mit sauberen HTML-Formularen arbeiten. Wenige spezifische Attribute genügen, um ein herkömmliches Formular in ein maschinenlesbares WebMCP-Tool zu verwandeln:
- toolname & tooldescription: Direkt am <form>-Tag platziert, erklären sie dem Agenten Name und Zweck des Tools.
- toolparamtitle & toolparamdescription: Überschreiben auf Feldebene die herkömmlichen Labels und geben dem Agenten präzise Anweisungen, etwa ob ein Name getrennt in Vor- und Nachname erwartet wird.
- toolautosubmit: Erlaubt dem Agenten, das Formular nach dem Ausfüllen sofort abzusenden, ideal für reine Suchabfragen. Fehlt das Attribut, füllt der Browser das Formular nur aus und überlässt das finale Absenden dem menschlichen Nutzer.
2. Die imperative API (JavaScript-basiert)
Für hochdynamische Webanwendungen (SPAs) oder komplexe Client-seitige Workflows bietet das native Interface navigator.modelContext die volle programmatische Kontrolle. Über registerTool() lassen sich komplexe Tools mit präzisen JSON-Eingabeschemas registrieren:
if ('modelContext' in navigator) {
navigator.modelContext.registerTool({
name: "addToCart",
description: "Fügt ein Produkt über die SKU und die Anzahl dem Warenkorb hinzu.",
inputSchema: {
type: "object",
properties: {
sku: { type: "string", description: "Die eindeutige Artikelnummer" },
quantity: { type: "integer", minimum: 1 }
},
required: ["sku", "quantity"]
}
}, async (params) => {
return await updateCart(params.sku, params.quantity);
});
}
Agenten-Awareness und UI-Feedback
Die Spezifikation enthält einige Features, die für Entwickler besonders praktisch sind, wenn Mensch und Maschine gleichzeitig auf derselben Seite aktiv sind:
- SubmitEvent.agentInvoked: Dieses boolesche Flag verrät dem Formular-Handler beim Absenden, ob ein Mensch oder ein KI-Agent die Aktion ausgelöst hat.
- SubmitEvent.respondWith(Promise<any>): Damit lassen sich dem Agenten nach einem Formular-Submit direkt strukturierte JSON-Daten zurückgeben, während menschliche Nutzer wie gewohnt die visuelle Erfolgsseite sehen.
- CSS-Pseudo-Klassen und Events: Mit :tool-form-active auf Formularen und :tool-submit-active auf Submit-Buttons sowie den JavaScript-Events toolactivated und toolcancel lässt sich im UI sichtbar machen, wenn ein Agent gerade ein Feld ausfüllt. Der Nutzer sieht live, was seine KI tut.
WebMCP vs. Anthropic MCP: Wo liegt der Unterschied?
Das von Google und Microsoft geförderte WebMCP und Anthropics serverseitiges Model Context Protocol (MCP) sind zwei verschiedene Dinge. Beide Technologien ergänzen sich, aber sie bedienen unterschiedliche Architekturen:
| Merkmal | MCP (Anthropic) | WebMCP (W3C / Google & Microsoft) |
|---|---|---|
| Laufzeitumgebung | Backend-Server / Lokale Desktop-Apps | Frontend (direkt im Browser-Tab des Nutzers) |
| Schnittstelle | Client-Server-Verbindung via JSON-RPC | Natives Browser-API (navigator.modelContext) |
| Sicherheitskontext | API-Keys, separate OAuth-Verbindungen | Nutzt die aktive, authentifizierte Browser-Session |
| Fokus | Integration von Datenbanken, lokalen Dateisystemen | Consumer-Websites, SaaS-Dashboards, E-Commerce |
| Umfang | Tools, Ressourcen und vordefinierte Prompts | Aktuell fokussiert auf ausführbare Client-Tools |
Das klassische MCP bleibt das richtige Werkzeug für Server-zu-Server-Szenarien. WebMCP bringt die KI direkt in das aktive Browserfenster des Endnutzers.
Die wirtschaftliche Dimension: Token-Ökonomie und Effizienz
WebMCP zu implementieren ist für Unternehmen keine technologische Spielerei, sondern eine wirtschaftliche Entscheidung. KI-Agenten, die Webseiten heute visuell analysieren, treiben die Token-Kosten der LLM-Anbieter erheblich in die Höhe. Jedes gesendete Bildschirmfoto verbraucht tausende Token und verlangsamt die Interaktion auf mehrere Sekunden.
Mit WebMCP entfällt diese visuelle Übersetzungsebene. Die Kommunikation läuft über kompakte JSON-Aufrufe. Laut Analyse verbrauchen WebMCP-basierte Workflows bis zu 89 % weniger Token als rein visuelle Scraping-Verfahren. Gleichzeitig steigt die Erfolgsquote bei der Ausführung komplexer Aufgaben auf bis zu 98 %. Für uns als Agentur heißt das: Wenn ein digitaler Assistent für einen Nutzer ein Produkt sucht oder bucht, wird er die Webseiten bevorzugen, die ihm die Ausführung so einfach und kostengünstig wie möglich machen. Wer WebMCP anbietet, wird zum bevorzugten Ziel für KI-gesteuerte Transaktionen.
Sicherheit und Datenschutz
Das Sicherheitsmodell von WebMCP ist standardmäßig restriktiv. Die Befürchtung, dass Bots im Hintergrund unbemerkt Konten leerräumen oder Daten stehlen könnten, adressiert die Spezifikation durch drei Barrieren:
- HTTPS und Same-Origin-Policy: Das API navigator.modelContext steht ausschließlich über verschlüsselte HTTPS-Verbindungen zur Verfügung. Registrierte Tools unterliegen strikt der Same-Origin-Policy der aufrufenden Seite.
- Die tools Permissions Policy: Die Registrierung von Tools ist standardmäßig auf self, also die eigene Domain, beschränkt. Wer WebMCP-Tools innerhalb eines ursprungsübergreifenden Iframes erlauben will, muss das explizit über das HTML-Attribut allow=“tools“ freigeben.
- Menschliche Freigabe (Human-in-the-Loop): Der Browser blockiert kritische Aktionen standardmäßig. Bevor ein Agent ein Tool ausführt, zum Beispiel eine kostenpflichtige Buchung, muss der Nutzer die Aktion über einen Browser-Sicherheits-Prompt bestätigen. Für besonders sensible Aktionen können Entwickler über agent.requestUserInteraction() eine zusätzliche manuelle Zwischenbestätigung erzwingen.
Relaunch-Strategie: Schritt für Schritt zur Agent-Readiness
Wer in diesem Jahr einen Relaunch plant, hat ein gutes Zeitfenster. Google testet WebMCP seit Chrome Canary 146 (Februar 2026), und für Chrome 149 ist bereits ein großflächiger Origin Trial angekündigt. Wer jetzt baut, kann zukunftssichere Strukturen direkt einplanen.
[Analyse & Audit] ➔ [UX- & MX-Konzeption] ➔ [Technische Umsetzung] ➔ [KI-Sichtbarkeit] ➔ [Qualitätssicherung]
- Analyse & Audit: Wir identifizieren die wichtigsten Transaktionspunkte, also die Flows, die Agenten autonom ausführen sollen: Produkt-Konfiguration, Terminbuchungen, Checkouts.
- UX- und MX-Konzeption: Das Design muss zwei Zielgruppen bedienen. Die User Experience für Menschen und die Machine Experience (MX) für KI-Agenten. Das setzt eine saubere Trennung von UI-Design und funktionaler Logik voraus.
- Technische Umsetzung: Formulare erhalten deklarative Attribute. Dynamische Kernfunktionen werden über die imperative JavaScript-API angebunden. Wo der native Browser-Support noch fehlt, sichern standardkonforme Polyfills wie MCP-B (@mcp-b/global) die Kompatibilität sofort ab.
- KI-Sichtbarkeit erweitern: WebMCP kombinieren wir mit semantischer Auszeichnung über Schema.org und einer llms.txt-Datei im Root-Verzeichnis, damit KI-Crawler strukturierte Orientierungspunkte finden.
- Qualitätssicherung: Mit der offiziellen Entwickler-Erweiterung Model Context Tool Inspector aus dem Chrome Web Store testen wir die Implementierung. Der integrierte Audit-Tab führt einen 15-Punkte-Check durch, von HTTPS über die JSON-Schema-Validierung bis zur vorgeschlagenen /.well-known/webmcp-Manifest-Datei für die Agenten-Erkennung außerhalb der aktiven Navigation.
Fazit: Jetzt handeln, um im nächsten Jahr direkt dabei zu sein
Das Agentic Web ist keine ferne Zukunftsvision mehr. Mit dem W3C Draft-Report von Februar 2026 und dem bevorstehenden Chrome 149 Origin Trial schaffen Google und Microsoft vollendete Tatsachen. Wer seine Website heute relauncht, ohne WebMCP mitzudenken, baut ein System, das für KI-Agenten unsichtbar bleibt.
Für uns als Digitalagentur liegt hier die Chance, die digitale Präsenz unserer Kunden nicht nur ästhetisch und barrierefrei für Menschen zu gestalten, sondern als eine der ersten Agenturen im deutschsprachigen Raum auch fit für die Welt der autonomen Maschinen zu machen. Die Frage für dieses Jahr lautet nicht mehr nur: „Ist deine Website responsive?“ Sie lautet: „Verstehen Agents deine Website?“ Wer das heute mit Nein beantwortet, sollte das beim anstehenden Relaunch ändern.
