Microsoft_365_Copilot_mit_Anthropic_Claude_Sonnet_20260422_2157

von | Apr. 22, 2026 | CB-M365, Consulting Briefing | 0 Kommentare

Consulting Briefing: Thema des Tages

Microsoft 365 Copilot mit Anthropic Claude Sonnet

Consulting Briefing

22.04.2026 | boddenberg.de

 

AI / COPILOT

Microsoft 365 Copilot mit Anthropic Claude Sonnet

Microsoft hat das Monopol von OpenAI im eigenen Haus gesprengt. Claude sitzt jetzt neben GPT im Copilot-Chat – und dein Governance-Modell muss liefern, bevor der erste Praktikant Firmengeheimnisse in das freundliche orange Logo tippt.

Executive Summary

Microsoft 365 Copilot ist nicht mehr monogam. Seit Herbst 2025 schrittweise und mit Rollout-Abschluss Ende März 2026 können Anwender pro Prompt zwischen OpenAI-Modellen und Anthropic Claude Sonnet wechseln. Im Researcher-Agenten läuft Claude Opus 4.1, im regulären Chat Claude Sonnet 4.5, in Copilot Studio auch Sonnet 4.6. Für dich als Verantwortlichen bedeutet das: dasselbe Copilot-Icon, aber plötzlich zwei völlig verschiedene Datenreisen. Die eine endet in Microsofts Azure, die andere in AWS- und GCP-Rechenzentren, die Anthropic betreibt – primär in den USA.

Die gute Nachricht: Anthropic ist offizieller Microsoft-Subprozessor, das Data Processing Addendum greift, und es wird nichts auf Kundendaten trainiert. Die weniger gute: In EU, EFTA, UK, Government und Sovereign Clouds ist Claude standardmäßig aus. Und wenn du als Admin „ein“ sagst, dann für alle M365-Copilot-Lizenzen – granulare Security-Gruppen gibt es derzeit nicht. Wer bestellt, bekommt alles. Wer nichts bestellt, frustriert die Power-User und riskiert, dass sie zu claude.ai ausweichen – diesmal komplett außerhalb deiner Kontrolle.

Kurz: Modellvielfalt ist Fortschritt, aber Fortschritt ohne Prozess ist Chaos. Richte Leitplanken ein, bevor die Diskussion im Betriebsrat stattfindet – und nicht während.

Auf einen Blick

Claude Sonnet 4.5 im Chat, Claude Opus 4.1 im Researcher, Claude Sonnet 4.6 in Copilot Studio. Rollout schrittweise Ende März 2026 abgeschlossen. EU, EFTA und UK: off by default. Kein Aufpreis – im M365-Copilot-Preis enthalten. Keine SecGroup-Steuerung, nur tenant-weit ein oder aus.

 

 

Grafik 1: So läuft ein Prompt durch den Copilot-Modell-Selector – und wo deine Daten konkret landen.

Worum geht es im Detail?

Bis vor kurzem war Copilot im Grunde ein intelligentes Frontend zu GPT-4 beziehungsweise GPT-5. Microsoft hat OpenAI über Azure integriert, Enterprise Data Protection drumgewickelt, fertig. Das ist vorbei. Mit der Ankündigung „Expanding model choice in Microsoft 365 Copilot“ vom September 2025 wurde Anthropic offiziell in die Copilot-Welt geholt. Der erste Schritt war der Researcher-Agent, der bei komplexen Recherchen auf Claude Opus 4.1 ausweichen kann. Der zweite Schritt war Copilot Studio – dort baust du Agenten, die spezialisierte Modelle für spezialisierte Aufgaben nutzen. Der dritte Schritt, der bis Ende März 2026 ausgerollt wurde, ist der normale Copilot Chat im Frontier-Programm. Dort wählt der Nutzer per Modell-Selektor zwischen OpenAI-Modellen und Claude Sonnet.

Technisch passiert bei der Claude-Auswahl etwas Interessantes: Dein Prompt, inklusive des Grounding-Kontextes aus Microsoft Graph – also Mails, Chats, Meetings, Dateien – verlässt die Microsoft-Infrastruktur und reist zu Anthropic-Servern, die auf AWS und GCP laufen, primär in den USA. Microsoft stellt das Trust-Framework darum, Anthropic ist seit Januar 2026 offizieller Subprozessor, das DPA gilt, Kundendaten werden nicht für Modelltraining verwendet. Juristisch ist das sauber. Geografisch und datenschutzrechtlich ist es trotzdem ein Transfer – und genau deshalb ist die Einstellung in EU-, EFTA- und UK-Tenants ab Werk deaktiviert. Microsoft lässt dir bewusst die Entscheidung.

Die Modellauswahl selbst ist simpel: Der Nutzer klickt auf „Try Claude“ oder wählt das Modell aus einem Dropdown – je nach Oberfläche. Beim nächsten Prompt ist wieder GPT am Start, wenn nicht anders eingestellt. Das ist bewusst niederschwellig: Microsoft will, dass Modellvielfalt zum Alltag wird, nicht zum IT-Ticket. Für dich als Organisation bedeutet das aber auch: Jeder Anwender entscheidet selbst, ob gerade der Bericht über das letzte Management-Meeting durch Claude oder durch GPT läuft. Wer das nicht steuert, hat einen Blindflug.

Hintergrund-Anekdote

Ein Kunde fragte letzte Woche: „Warum gibt Microsoft überhaupt einen Konkurrenten in die eigene Plattform?“ Antwort: weil genau das die Microsoft-Strategie ist. Azure verkauft Infrastruktur, Microsoft 365 verkauft Produktivität. Je mehr Modelle unter dem Copilot-Label laufen, desto weniger hängt Microsoft davon ab, dass OpenAI die nächste Schlacht gewinnt. Für dich als Anwender ist das komfortabel. Für deine Compliance-Abteilung ist es Arbeit.

 

 

Grafik 2: Regionale Verfügbarkeit und Default-Verhalten – wer was tun muss, steht in Spalte vier.

Was sind Chancen? Was sind Risiken?

Chancen

Der erste offensichtliche Gewinn ist Qualität. Claude Sonnet 4.5 ist in langen Dokumenten, strukturierten Zusammenfassungen und Code-Reviews oft überlegen. Wenn dein Legal-Team einen 30-seitigen Vertrag durch Copilot jagt, liefert Claude häufig die klarere Struktur. Der Researcher mit Claude Opus 4.1 war in unseren Tests bei mehrstufigen Analysen – „vergleiche die letzten vier Quartalsberichte und leite drei strategische Optionen ab“ – sichtbar schlagfertiger als die GPT-Variante. Und das zum selben Preis, denn Anthropic ist in der M365-Copilot-Lizenz enthalten.

Zweite Chance: Agentenbau. In Copilot Studio kannst du Multi-Agenten-Systeme bauen, bei denen ein Claude-Agent recherchiert, ein GPT-Agent formatiert und ein dritter Agent den Output freigibt. Das ist kein Marketing-Gag, das ist die nächste Evolutionsstufe. Wer damit experimentiert, baut Vorsprung auf – wer wartet, copy-pastet in einem Jahr fremde Präsentationen.

Dritte Chance: Lock-In-Reduktion. Sobald du Modelle wechseln kannst, wird dein Prozess modellagnostisch. Das ist langfristig die wichtigste Architekturentscheidung dieses Jahrzehnts. Wer seine Prompts, Agenten und Workflows nur auf ein Modell zuschneidet, wird der erste sein, der beim nächsten Preisanstieg oder Modellwechsel alles neu baut.

Risiken

Erstes Risiko: Daten-Reise. Prompts und Grounding-Kontext wandern außerhalb der Microsoft-Cloud, primär in die USA. Das DPA fängt das juristisch auf, aber je nach Branche – Finanzdienstleister, Gesundheitswesen, öffentliche Hand – ist der Transfer ein rotes Tuch. Die DSGVO sagt nicht „nein“, sie sagt „dokumentiere, bewerte, rechtfertige“. Wer das ignoriert, hat spätestens beim nächsten Audit ein Problem.

Zweites Risiko: Der Alles-oder-nichts-Schalter. Es gibt keine Security-Gruppen-basierte Steuerung. Wenn du Claude aktivierst, nutzt ihn die ganze Belegschaft. Wenn du ihn sperrst, nutzt ihn niemand – auch nicht dein Research-Team, das ihn dringend braucht. Microsoft wird das nach und nach granular machen, aber heute ist es ein Holzhammer.

Drittes Risiko: Nutzer-Verwirrung. Mitarbeiter wissen in der Regel nicht, wofür welches Modell gut ist. Sie wählen das, was zuletzt an erster Stelle stand – oder das mit dem schöneren Namen. „Try Claude“ hat einen Call-to-Action-Charakter, der bei Bestandsprompts zu Frust führt, wenn das Output-Format plötzlich anders ist. Ohne Schulung wird deine Supportabteilung die Hauptleidtragende sein.

Viertes Risiko: Kostendynamik. Claude ist pro Token deutlich teurer als GPT-Modelle. Heute zahlst du das nicht extra, weil Microsoft den Preis pauschal hält. Aber fairerweise: Wenn die halbe Welt auf Claude umschwenkt, wird dieses Modell nicht ewig so bleiben. Rechne mittelfristig mit Lizenzanpassungen oder einem Nutzungsdeckel je Modell.

Achtung – schwarzer Galgenhumor

Der schönste Datenschutz-Incident ist der, den du niemandem erklären musst. Der schlimmste ist der, bei dem du deiner Rechtsabteilung erklären darfst, warum dein Einkauf den neuen Zuliefervertrag vorab in einen US-Chat gekippt hat, weil im Modell-Selector so ein freundliches oranges Icon geleuchtet hat.

 

Was müssen wir jetzt schon vorbereiten?

Der Rollout ist nicht aufzuhalten. Entweder du gestaltest die Einführung, oder sie passiert dir. Hier ist die Checkliste, die du in der nächsten Woche durcharbeiten solltest.

1. Entscheidung dokumentieren

Triff eine Tenant-Entscheidung und dokumentiere die Begründung. „On“ oder „Off“ ist das eine, aber der Grund dafür ist das, was im nächsten Audit zählt. Datenschutzrechtlich ist der Transfer in die USA dokumentiert und vertraglich abgesichert – das reicht für DSGVO in vielen Fällen, aber eben nicht in allen. Lass das deinen Datenschutzbeauftragten auf Papier schreiben.

2. Nutzer-Richtlinie erstellen

Definiere, welche Inhaltsarten durch welches Modell laufen dürfen. Beispiele: Internes Brainstorming und Textformatierung egal welches Modell. Personenbezogene oder vertrauliche Verhandlungsdaten nur über OpenAI im EU-Data-Boundary-Kontext. Forschung und externe Publikationen gern Claude. Kommuniziere das als einseitige Guideline, nicht als 40-seitiges Policy-Monster. Ein Praktikant muss sie in zwei Minuten verstehen können.

3. Data-Loss-Prevention für Copilot aktivieren

Microsoft Purview unterstützt mittlerweile Copilot-Kontext-DLP. Stelle sicher, dass Vertraulichkeits-Labels greifen, bevor Copilot sie in den Prompt-Kontext zieht. Das gilt unabhängig vom Modell – aber bei Claude ist der Schaden durch einen Leak größer, weil der Ausführungsort außerhalb deines Trust-Perimeters liegt.

4. Schulung und Awareness

Zwei 45-Minuten-Formate reichen für den Start: eins für Anwender („wann ist Claude besser, wann GPT“), eins für Führungskräfte („was ist das Risiko, was die Chance“). Teile eine kurze Liste mit drei Do's und drei Don'ts. Ohne diese Schulung entscheidet jeder Nutzer aus dem Bauch – und du hast keine Verteidigungslinie beim nächsten Compliance-Vorfall.

5. Pilotgruppe definieren

Wähle 20 bis 50 Nutzer aus Research, Legal, Produkt und IT. Lass sie vier Wochen lang dokumentiert mit beiden Modellen arbeiten. Am Ende hast du eigene Daten – nicht den Marketing-Flyer von Microsoft. Aus der Praxis: Wir haben in einem Industrieprojekt letzte Woche gesehen, dass Claude bei Stücklisten-Analysen doppelt so gute Ergebnisse liefert wie GPT-5 – in Gestaltungsfragen hingegen den Ton der Firma nicht trifft. Solche Details findest du nur mit echten Nutzern, nicht mit Benchmarks.

6. Governance-Review in sechs Monaten einplanen

Die Modellauswahl entwickelt sich monatlich. Sonnet 4.6 ist schon da, Opus 4.5 in der Roadmap, und Microsoft wird vermutlich granulare Security-Group-Steuerung nachreichen. Setze einen Termin für einen Review sechs Monate nach Go-Live. Ohne Review fossiliert deine erste Spontanentscheidung – und das ist selten die beste.

Tipp aus der Praxis

Die effektivste Governance in drei Zeilen: Tenant-Policy („wann darf Claude“), DLP im Hintergrund („was darf Claude sehen“), Schulung der Anwender („wann sollte ich Claude wählen“). Wer alle drei Ebenen hat, schläft ruhig. Wer zwei davon hat, schläft unruhig. Wer nur eine hat, hat einen Leak-Kandidaten im Kalender stehen – er weiß nur noch nicht, wann.

 

 

Grafik 3: Rollout-Timeline – wo wir gerade stehen und wohin die Reise geht.

Praxisbeispiel: ein mittelständischer Maschinenbauer

Ein Kunde aus dem Maschinenbau, rund 3.500 Mitarbeiter, EU-Tenant. Nach der Ankündigung im September hat der CIO den Schalter erstmal auf „off“ gelassen und in Ruhe bewertet. Wir haben dann im Februar einen Pilot mit 30 Mitarbeitern aus Engineering und Vertrieb gefahren. Claude war in der Aufbereitung von technischen Pflichtenheften messbar besser, GPT-5 hingegen in Kundenkorrespondenz und im internen Jargon. Die Empfehlung nach vier Wochen: Tenant-Opt-In, aber mit klarer Policy, dass personenbezogene Kundendaten weiterhin nur über OpenAI laufen. Die Policy ist ein einseitiges DIN-A4 mit drei Farben – grün, gelb, rot. Das versteht jeder Mitarbeiter. Seit dem 1. April ist Claude tenant-weit aktiv, die Nutzungsquote liegt bei etwa 18 Prozent aller Prompts. Keine Vorfälle. Noch nicht.

Anekdote vom selben Kunden: Die erste Frage eines Mitarbeiters an Claude lautete „Was kannst du besser als ChatGPT?“. Die Antwort von Claude war laut Screenshot so charmant-selbstkritisch, dass sie im Newsletter der IT-Abteilung gelandet ist. Akzeptanzförderung, kostenlos. Das kann OpenAI nicht.

Fazit

Du musst Claude nicht lieben. Du musst nur entscheiden, was er in deinem Tenant darf. Die technische Entscheidung ist ein Klick, die organisatorische Entscheidung ist Arbeit für einen Workshop. Wer diese Arbeit jetzt macht, hat in sechs Monaten einen Vorsprung – und keine Incident-Abschlussberichte auf dem Tisch.

Anmelden zum Consulting Briefing per Mail

Wenn Sie kostenlos das tägliche Consulting Briefing von Ulrich Boddenberg per Mail erhalten möchten, melden Sie sich auf dieser Seite an.

Die zehn letzten Consulting Briefings