Claude Opus 4.8 im Microsoft 365 Copilot verfügbar
Neues Anthropic-Flaggschiff im Copilot-Selector – und ein Governance-Schritt, den niemand überspringen sollteConsulting Briefing
01.06.2026 • boddenberg.de
|
KI & COPILOT |
|---|
Claude Opus 4.8 im Microsoft 365 Copilot verfügbar
Anthropic hat Claude Opus 4.8 am 28. Mai 2026 veröffentlicht – und Microsoft hat keine zwei Tage gebraucht, um das Modell in den Microsoft 365 Copilot zu schieben. Wer schon geahnt hat, dass die Tinte unter dem Opus-4.7-Rollout noch nicht trocken ist, lag richtig. Du darfst dich also wieder mit einem neuen Modell-Logo im Selector anfreunden, bevor die Anwender das alte überhaupt gefunden haben.
Executive Summary
Claude Opus 4.8 steht ab sofort im Modell-Selector des Microsoft 365 Copilot bereit: zuerst in Copilot Cowork (über das Frontier-Programm) und im Rollout für Copilot Chat, Excel, PowerPoint und Copilot Studio. Word-Unterstützung folgt laut Microsoft im Sommer 2026. Das Modell ist der neue Anthropic-Spitzenreiter für lange, agentische Aufgaben – also genau die Mehrschritt-Workflows, an denen die Vorgänger gern die Geduld verloren haben.
Technisch punktet Opus 4.8 mit sauberer Tool-Auswahl, deutlich strengerem Instruction Following und mehr Ehrlichkeit – laut Anthropic ist es rund viermal seltener bereit, eigene Code-Fehler kommentarlos durchzuwinken. Auf SWE-Bench Pro klettert es auf 69,2 Prozent. Für dich im Tenant ist die spannendere Zahl aber eine andere: Anthropic-Modelle laufen weiterhin außerhalb der Microsoft-EU-Data-Boundary. Bevor du also die Modellauswahl freigibst, gehört der Admin-Schalter im Microsoft 365 Admin Center bewertet und die AI-Governance-Policy nachgezogen. Sonst entscheidet die Voreinstellung – und das ist selten die Person, die nachher den Datenschutzbeauftragten beruhigen muss.
|
◆ Das Wichtigste in 20 Sekunden Opus 4.8 ist da, ist gut und ist nicht in der EU-Data-Boundary gehostet. Aktiviere es bewusst über die Subprozessor-Einstellung, scope es auf eine Pilotgruppe und dokumentiere die Entscheidung. „War halt schon an“ ist kein Governance-Konzept. |
|---|

Abb. 1: SWE-Bench Pro – Opus 4.8 setzt sich vor Opus 4.7 und GPT-5.5.
Worum geht es im Detail?
Fangen wir beim Modell selbst an. Opus 4.8 ist Anthropics aktuelles Flaggschiff und auf das ausgelegt, was im Marketing „long-horizon agentic work“ heißt und im Alltag bedeutet: Aufgaben, die aus zehn Teilschritten, drei Tool-Aufrufen und einer halben Stunde unbeaufsichtigtem Arbeiten bestehen. Genau dort bröselten frühere Modelle – sie wählten das falsche Werkzeug, ignorierten auf Schritt sieben die Anweisung von Schritt zwei oder behaupteten fröhlich, fertig zu sein. Opus 4.8 wählt Tools sauberer aus und hält sich über mehrere Runden hinweg an deine Vorgaben. Auf SWE-Bench Pro, einem Satz verifizierter Coding-Aufgaben, liegt es bei 69,2 Prozent gegenüber 64,3 Prozent beim Vorgänger 4.7 und 58,6 Prozent bei GPT-5.5. Auf dem Browser-Benchmark Online-Mind2Web erreicht es 84 Prozent.
Der zweite Sprung ist weniger sexy, aber im Beratungsalltag der wichtigere: Ehrlichkeit. Opus 4.8 ist laut Anthropic rund viermal seltener bereit, einen Fehler im selbst geschriebenen Code unkommentiert stehen zu lassen. Übersetzt: Das Modell sagt öfter „das weiß ich nicht“ oder „dein Plan hat hier ein Loch“, statt selbstbewusst Unsinn zu produzieren. Dazu kommen ein dreimal günstigerer Fast-Mode, eine Effort-Steuerung (Tempo gegen Tiefe) und dynamische Workflows mit parallelen Subagenten. Die Preise für den Normalbetrieb bleiben gegenüber 4.7 unverändert – eine Seltenheit in einem Markt, in dem sonst jede Nachkommastelle einen Aufschlag rechtfertigt.
Im Microsoft 365 Copilot landet das Ganze über den Modell-Selector. Der Anwender klickt in Excel, PowerPoint oder Copilot Cowork auf das Dropdown und wählt statt des OpenAI-Standards eben Claude Opus 4.8. Kombiniert mit Work IQ – Microsofts Schicht für den Organisationskontext aus Mails, Dateien und Chats – sollen die Ergebnisse nicht nur klug, sondern auch auf deine Firmendaten geerdet sein. Konkret heißt das: bessere Datenanalysen in Excel, sauberere Foliendramaturgie in PowerPoint und längere Dokumentenentwürfe, die nicht nach drei Absätzen den Faden verlieren.
Wichtig für die Erwartungssteuerung: Das ist kein Big-Bang-Rollout, sondern Microsofts übliches gestaffeltes Verfahren. Copilot Cowork läuft über das Frontier-Programm – das ist die Vorab-Spur für Kunden, die bewusst „opt-in“ machen und mit frischen Funktionen leben wollen, bevor sie in der breiten Masse ankommen. Wer also heute im Selector noch kein Opus 4.8 sieht, hat nichts falsch gemacht; er ist nur noch nicht dran. Cowork selbst ist dabei das spannendste Stück: ein agentischer Modus, in dem der Copilot eine Aufgabe nicht in einem Rutsch beantwortet, sondern über mehrere Apps hinweg abarbeitet – Daten aus Excel ziehen, daraus Folien bauen, eine Zusammenfassung schreiben. Genau in diesem Modus zahlt sich die bessere Tool-Auswahl von 4.8 am deutlichsten aus.

Abb. 2: Der Datenpfad – wer Claude wählt, schickt die Verarbeitung aus der EU-Data-Boundary heraus.
|
✔ Wo der Schalter wirklich sitzt Microsoft 365 Admin Center → Copilot → Settings → View All → „AI providers operating as Microsoft subprocessors“. Du brauchst die Rolle „AI Administrator“. Das alte „Independent Processor“-Setting wurde am 1. Mai 2026 abgeschaltet – ohne aktivierten Subprozessor gibt es schlicht keinen Claude mehr. |
|---|
Was sind Chancen? Was sind Risiken?
Die Chancen liegen auf der Hand und sind real. Wer im Tagesgeschäft viel mit Excel-Modellen, Präsentationen und längeren Textentwürfen hantiert, bekommt mit Opus 4.8 einen spürbar verlässlicheren Co-Piloten. Die stärkere Tool-Auswahl zahlt direkt auf agentische Szenarien ein: Copilot Cowork kann mehr Schritte selbständig durchziehen, ohne dass jemand danebensitzt und korrigiert. Und die Ehrlichkeits-Gewinne sind im Beratungskontext Gold wert – ein Modell, das „das Quartalsergebnis steht so nicht in den Daten“ sagt, verhindert mehr Schaden als zehn hübsche Folien ihn anrichten können.
Das Risiko steht im selben Satz wie die größte Stärke: Wahlfreiheit. Anthropic-Modelle werden außerhalb der von Microsoft verwalteten Umgebung gehostet. Sobald ein Anwender in Word, Excel oder PowerPoint Claude wählt, findet die Verarbeitung außerhalb der EU Data Boundary statt. Rechtlich ist das nicht der Wilde Westen – Anthropic agiert als Microsoft-Subprozessor und unterliegt den Microsoft Product Terms samt Data Protection Addendum. Aber „unterliegt dem DPA“ ist etwas anderes als „bleibt in der EUDB“, und genau diesen Unterschied wird dein Datenschutzbeauftragter mit spitzem Bleistift nachrechnen wollen.
|
⚠ Die unsichtbare Voreinstellung Für Tenants in EU, EFTA und UK, die nach dem 25.03.2026 erstellt wurden, ist die Anthropic-Nutzung in den Office-Apps standardmäßig AN. Bei älteren Tenants steht der Default im Message Center. Heißt im Klartext: Es kann sein, dass Claude bei dir schon Daten verarbeitet, während du noch überlegst, ob du es testen willst. |
|---|
Das zweite, leisere Risiko ist die Modell-Inkonsistenz. Wenn die Buchhaltung ihre Analyse mit OpenAI baut und der Vertrieb dieselbe Frage mit Claude stellt, können zwei unterschiedlich formulierte – und im Zweifel unterschiedlich gerundete – Antworten herauskommen. Für Self-Service-Analysen ist das Gewürz, für berichtspflichtige Kennzahlen ein Problem. Dazu kommt der Klassiker: Ein zweiter Anbieter bedeutet eine zweite Vertragskette, eine zweite Audit-Frage und einen zweiten Punkt auf der Liste, wenn ein Kunde wissen will, wo seine Daten eigentlich hinfließen.
Ein Beispiel aus der Praxis, das so oder ähnlich gerade in vielen Tenants passiert: Ein Controller bekommt mit, dass Opus 4.8 „besser mit Excel“ sei, schaltet im Dropdown um und lässt eine Deckungsbeitragsrechnung mit echten Kundennamen analysieren. Funktioniert blendend – die Folien sind in zehn Minuten fertig, der Chef ist begeistert. Nur hat in dem Moment niemand bemerkt, dass die Tabelle mit den Klarnamen die EU-Data-Boundary verlassen hat. Nicht illegal, nicht dramatisch, aber eben auch nirgends dokumentiert. Und genau solche stillen, gut gemeinten Einzelfälle sind es, die ein halbes Jahr später im Audit für unangenehme Gesichter sorgen. Die Technik ist nicht das Problem – die fehlende Spielregel davor ist es.
Was müssen wir jetzt schon vorbereiten?
Der erste Schritt ist unspektakulär und genau deshalb so gern übersprungen: eine Bestandsaufnahme. Wann wurde dein Tenant erstellt – vor oder nach dem 25. März 2026? Davon hängt ab, ob Claude in den Office-Apps bei dir per Default an oder aus ist. Den tatsächlichen Status liest du im Message Center ab, nicht aus dem Bauch heraus. Wer hier rät, statt zu prüfen, baut sein Governance-Konzept auf Sand.
Danach geht es an die Policy. Lege fest, ob die Modellauswahl überhaupt freigegeben wird, und wenn ja, für wen. Das Subprozessor-Setting lässt sich auf „Alle Nutzer“ oder auf „bestimmte Nutzer und Gruppen“ scopen – nutze das. Eine Pilotgruppe aus wohlwollenden, datenschutzbewussten Kollegen ist Gold wert, bevor du den Schalter für 4.000 Leute umlegst. Wichtig: Deine bestehenden Sensitivity Labels und DLP-Regeln gelten weiter. Claude hebelt deine Klassifizierung nicht aus – aber es ersetzt sie eben auch nicht. Wer keine Labels pflegt, hat mit Claude dieselbe Lücke wie vorher, nur schneller befüllt.

Abb. 3: Fünf Schritte von der Bestandsaufnahme bis zum kontrollierten Rollout.
Drittens: Kommuniziere. Anwender, die plötzlich ein zweites Modell im Dropdown sehen, fragen sich zu Recht, was der Unterschied ist und ob sie etwas falsch machen, wenn sie es wählen. Ein zweiseitiges Merkblatt – wann Claude sinnvoll ist, wann nicht, und welche Daten tabu sind – erspart dir zwanzig Tickets und einen unangenehmen Anruf aus der Rechtsabteilung. Und dokumentiere die Entscheidung. Nicht, weil es Spaß macht, sondern weil die Frage „wer hat das eigentlich freigegeben?“ erfahrungsgemäß genau dann gestellt wird, wenn niemand mehr die Hand hebt.
Viertens schließlich der Teil, den alle gern in die Zukunft verschieben: Monitoring. Mit dem Subprozessor-Setting allein ist es nicht getan, denn ein Schalter ist eine Momentaufnahme, kein Prozess. Lege fest, wer den Status künftig im Blick behält – die Defaults können sich mit jedem neuen Tenant oder jeder Message-Center-Ankündigung wieder verschieben, und du willst nicht aus einem Datenschutz-Vorfall erfahren, dass sich etwas geändert hat. Nimm den Punkt „KI-Modell-Anbieter“ in deine regelmäßige Tenant-Review-Runde auf, prüfe die Audit-Logs auf Anthropic-Nutzung und halte schriftlich fest, welche Datenarten in den freigegebenen Anwendungsfällen erlaubt sind. Das klingt nach Bürokratie, kostet aber weniger Zeit als eine einzige nachträgliche Aufarbeitung – und macht beim nächsten Kundenaudit den Unterschied zwischen „haben wir im Griff“ und betretenem Schweigen.
|
✔ Pragmatischer Startpunkt Aktiviere Opus 4.8 zunächst nur für eine kleine Sicherheitsgruppe, definiere zwei bis drei konkrete Anwendungsfälle (z. B. Foliendramaturgie und Datenanalyse ohne personenbezogene Daten) und vereinbare nach vier Wochen ein Review. Skalieren kannst du immer noch – zurückrudern ist deutlich unangenehmer. |
|---|
Häufig gestellte Fragen
Brauche ich eine Zusatzlizenz, um Claude Opus 4.8 im Microsoft 365 Copilot zu nutzen?
Nein, eine separate Anthropic-Lizenz brauchst du nicht. Voraussetzung ist eine Microsoft-365-Copilot-Lizenz; die Claude-Modelle werden über den Modell-Selector bereitgestellt, sobald der Admin den Subprozessor-Schalter im Admin Center aktiviert hat.
Verlassen meine Daten die EU, wenn ein Anwender Claude statt OpenAI wählt?
Ja. Anthropic-Modelle werden außerhalb der von Microsoft verwalteten Umgebung gehostet, weshalb die Verarbeitung in Word, Excel und PowerPoint außerhalb der EU Data Boundary stattfindet. Anthropic ist dabei vertraglich als Microsoft-Subprozessor unter dem Data Protection Addendum eingebunden.
Wo aktiviere oder sperre ich Claude im Microsoft 365 Admin Center?
Unter Copilot → Settings → View All → „AI providers operating as Microsoft subprocessors“. Dafür brauchst du die Rolle „AI Administrator“, und du kannst die Einstellung auf alle Nutzer oder auf bestimmte Sicherheitsgruppen scopen.
Ist Claude in meinem EU-Tenant automatisch aktiv?
Für Tenants in EU, EFTA und UK, die nach dem 25. März 2026 erstellt wurden, ist die Anthropic-Nutzung in den Office-Apps standardmäßig eingeschaltet. Bei älteren Tenants hängt der Default vom jeweiligen Eintrag im Message Center ab – deshalb solltest du den Status aktiv prüfen.
Worin ist Opus 4.8 besser als das OpenAI-Standardmodell oder Opus 4.7?
Opus 4.8 wählt Werkzeuge zuverlässiger aus, hält sich über mehrere Schritte konsequenter an Anweisungen und ist ehrlicher – es lässt eigene Fehler rund viermal seltener unkommentiert durchgehen. Auf SWE-Bench Pro erreicht es 69,2 Prozent gegenüber 64,3 Prozent bei Opus 4.7 und 58,6 Prozent bei GPT-5.5.