Consulting Briefing: Thema des Tages
SharePoint-Metadaten per Autofill: Spaltenvorschläge für Bibliotheken
SharePoint Autofill Columns: Metadaten-Automatik mit Hirn – aber bitte nicht ohne Ordnung
SharePoint Autofill Columns ist eine Funktion aus den Document-Processing-Diensten von Microsoft 365. Sie nutzt generative KI, um Inhalte aus Dateien in einer Dokumentbibliothek zu lesen, zu klassifizieren, zusammenzufassen oder gezielt Informationen herauszuziehen und diese direkt in SharePoint-Spalten zu schreiben. Praktisch gesprochen: Statt dass Redakteure Titel, Dokumenttyp, Thema, Projekt, Frist oder Kurzbeschreibung von Hand pflegen, übernimmt ein Prompt diese Arbeit und speichert das Ergebnis als Metadatum in der Bibliothek. Genau dort liegt der Charme: Metadaten werden nicht nur hübscher, sondern nutzbar für Suche, Filter, Ansichten, Workflows und sogar nachgelagerte Schutz- oder Klassifizierungslogik.
Für DACH-Organisationen ist das besonders spannend, weil viele Intranets und Fachportale seit Jahren an derselben Stelle humpeln: Dokumente sind da, aber schlecht beschrieben. Die Folge ist die klassische SharePoint-Tragödie in drei Akten: Datei hochgeladen, Metadaten vergessen, später nichts mehr gefunden. Autofill Columns kann diesen Prozess deutlich verbessern, wenn die Informationsarchitektur sauber ist. Ohne Ordnung darunter ist es allerdings nur KI auf einer chaotischen Rumpelkammer. Dann entsteht keine Magie, sondern nur schnellerer Unsinn.
Was SharePoint Autofill Columns konkret macht
Autofill Columns arbeitet auf Bibliotheksebene. Für eine Spalte wird ein natürlicher Sprachprompt hinterlegt, etwa: „Ermittle den Vertragsbeginn aus dem Dokument und gib nur ein Datum zurück“ oder „Fasse den Inhalt in maximal 220 Zeichen zusammen“. Neue Dateien, die anschließend in die Bibliothek geladen werden, werden automatisch verarbeitet; bestehende Dateien lassen sich gezielt nachverarbeiten. Microsoft empfiehlt für stabile Ergebnisse höchstens zehn Autofill-Spalten pro Bibliothek. Für Word-, PDF- oder TIFF-Dateien gilt außerdem eine empfohlene Obergrenze von 65 Seiten pro Datei.
Unterstützt werden unter anderem Text, mehrzeiliger Text, Zahl, Ja/Nein, Datum/Uhrzeit, Auswahl, Hyperlink, Währung und Managed Metadata. Nicht unterstützt sind derzeit Person oder Gruppe, Standort, Bild und Lookup-Spalten. Ebenfalls wichtig: Verschlüsselte Dateien werden nicht analysiert, Subsites werden nicht unterstützt, und Änderungen am Dokument fließen erst dann neu ein, wenn die Datei erneut verarbeitet wird. Das ist kein kleiner Randhinweis, sondern ein echter Betriebsfaktor. Wer denkt, die KI beobachte jedes Dokument dauerhaft wie ein bibliothekarischer Terminator, wird unsanft auf dem Boden der SharePoint-Tatsachen landen.
Voraussetzungen: Technik, Rollen, Abrechnung
Die reguläre Nutzung setzt laut Microsoft voraus, dass im Microsoft-365-Admin-Center ein Azure-Abonnement für Pay-as-you-go mit Document Processing verknüpft wird. Danach ist Autofill Columns grundsätzlich für SharePoint-Sites aktiviert und kann bei Bedarf auf ausgewählte Sites eingeschränkt werden; Microsoft nennt hier bis zu 100 ausgewählte Sites. Für die Einrichtung werden mindestens SharePoint-Administrator- oder Global-Administrator-Rechte benötigt, wobei Microsoft ausdrücklich das Prinzip der geringsten Rechte empfiehlt.
Bei den Kosten zählt Microsoft Transaktionen. Für Autofill Columns werden je nach Dateityp Seiten, Blätter, Folien oder komplette Dateien als Transaktion abgerechnet; laut aktueller Dokumentation liegt der Preis bei 0,005 US-Dollar pro Transaktion. Interessant für Pilotprojekte: Bis Juni 2026 gibt es bei aktivierter Pay-as-you-go-Abrechnung ein begrenztes kostenfreies monatliches Kontingent für ausgewählte Document-Processing-Dienste, darunter Autofill Columns. Das ist nett für einen Testlauf und kein Freifahrtschein für fröhliche Massenverarbeitung von Aktenbergen bis zum Horizont.
Zusätzlich gibt es derzeit einen Sonderfall: Im Kontext von Knowledge Agent kann Autofill Columns in einer Vorschau auch ohne separates Syntex-PAYG sichtbar sein, sofern berechtigte Microsoft-365-Copilot-Lizenzen vorhanden sind. Für produktive Rollout-Planung in Unternehmen würde ich mich trotzdem an das belastbare Standardmodell mit PAYG und Site-Steuerung halten, statt auf Preview-Sonderwege zu bauen. Vorschau bleibt Vorschau; das ist der Bereich, in dem Roadmaps gern mal Purzelbäume schlagen.
Grenzen, die man früh akzeptieren sollte
Autofill Columns ist kein vollautomatischer Wahrheitsgenerator. Microsoft weist selbst darauf hin, dass KI-generierte Inhalte falsch sein können und Ergebnisse geprüft werden müssen. Genau deshalb eignet sich die Funktion hervorragend für standardisierbare Metadatenfelder, einfache Klassifizierungen, Zusammenfassungen und Termin- oder Vertragsattribute, aber weniger für hochkritische Entscheidungen ohne menschliche Kontrolle. Besonders in regulierten DACH-Umgebungen sollte der Grundsatz gelten: KI erzeugt Vorschläge, Fachbereiche verantworten das Ergebnis.
Ein weiterer Grenzstein ist die Qualität des Quellbestands. Schlechte Scans, uneinheitliche Dokumenttypen, fehlende Content Types oder wilde Bibliotheken mit „Alles-ist-irgendwie-Verträge-und-auch-Projekte“-Logik ruinieren die Trefferquote schneller als jede KI sie retten kann. Bei Managed Metadata gibt es zudem eine konkrete Grenze: Termsets mit bis zu 100 Begriffen werden unterstützt. Das ist nützlich, aber kein Ersatz für eine ausgewachsene, ausufernde Taxonomie mit 700 halbverwaisten Begriffen aus drei Reorganisationen und einer PowerPoint von 2018.
Pilotplan: klein anfangen, sauber messen
Ein sinnvoller Pilot dauert sechs bis acht Wochen und startet mit genau einer Bibliothek in einem klaren Szenario. Gute Kandidaten sind Vertragsablagen, Richtlinienbibliotheken, Qualitätsdokumente, Projektakten oder Bewerbungsunterlagen. Schlechte Kandidaten sind Bibliotheken mit völlig heterogenen Dateitypen, ungeklärten Berechtigungen und mehreren parallelen Fachlogiken. Der Pilot sollte nicht mit „Wir testen mal überall ein bisschen“ beginnen. Das ist keine Strategie, das ist Konfetti.
Phase 1: Informationsarchitektur. Zuerst werden Bibliothek, Zielgruppen, Dokumentarten und Suchszenarien festgelegt. Pro Bibliothek sollten wenige, fachlich relevante Metadaten definiert werden, etwa Dokumenttyp, Fachbereich, Gültig-ab, Vertragsende, Kurzinhalt, Vertraulichkeitsstufe oder Prozessbezug. Diese Felder müssen direkt auf Such- und Governance-Ziele einzahlen, nicht auf kosmetische Vollständigkeit.
Phase 2: Content Types. Danach werden Content Types eingeführt oder bereinigt. Ein Content Type „Vertrag“ braucht andere Pflichtfelder und Prompts als „Richtlinie“ oder „Projektbericht“. Autofill Columns funktioniert am besten, wenn Bibliotheken nicht alles zugleich sein wollen. Pro Content Type sollten nur die Spalten hinterlegt werden, die fachlich Sinn ergeben.
Phase 3: Prompt-Design und Test. Redakteure oder Fachverantwortliche testen die Prompts an echten Beispieldokumenten. Wichtig sind klare Ausgabevorgaben wie „nur Datum im Format TT.MM.JJJJ“ oder „gib genau einen Wert aus der Liste zurück“. Je präziser der Prompt, desto geringer die Metadaten-Kabarettquote. Microsoft ermöglicht das Testen eines Prompts direkt an vorhandenen Dateien in der Bibliothek.
Phase 4: Redakteurstraining. Die Schulung sollte kurz, praktisch und streng an realen Dokumenten ausgerichtet sein. Inhalte: Was Autofill kann, was es nicht kann, wie gute Prompts aussehen, wie Ergebnisse geprüft werden, wann man nachverarbeitet und wie man Fehler meldet. Redakteure brauchen keine KI-Evangelisierung, sondern eine Bedienungsanleitung mit gesundem Misstrauen.
Messgrößen für den Pilot
Drei Messgrößen sind für den Business Case besonders brauchbar. Erstens Suchtrefferqualität: Anteil der Suchvorgänge, bei denen Nutzer das gewünschte Dokument innerhalb der ersten Treffer oder innerhalb von zwei Minuten finden. Zweitens Compliance- und Klassifizierungsqualität: Anteil der Dokumente mit korrekt befüllten Metadatenfeldern, die für Sensitivity- oder Schutzlogik relevant sind. Microsoft beschreibt ausdrücklich, dass die erzeugten Metadaten indexiert und auch als Kriterium für Information-Protection-Labeling genutzt werden können; automatische Sensitivity Labels in Purview bauen grundsätzlich auf definierten Bedingungen auf. Drittens Zeitersparnis: durchschnittliche Zeit für Metadatenpflege pro Dokument vor und nach dem Pilot.
Ergänzend würde ich im Pilot vier operative Kennzahlen führen: Fehlerrate je Spalte, Quote manueller Korrekturen, Verarbeitungsstatus in der Aktivitätsansicht und Volumen der verarbeiteten Dateien. SharePoint stellt dafür eine Aktivitätsansicht mit Status wie „In progress“, „Completed“ und „Failed“ bereit, inklusive Historie der letzten 60 Tage.
Checkliste für den Rollout in DACH-Organisationen
Für den Rollout sollte die Organisation erst dann auf breitere Bibliotheken gehen, wenn Pilotdaten sauber vorliegen. Die Kern-Checkliste lautet:
Technisch muss PAYG eingerichtet, die Site-Nutzung begrenzt und die Pilotbibliothek bereinigt sein. Fachlich müssen Content Types, Pflichtmetadaten, Termsets und Prompt-Vorlagen definiert sein. Organisatorisch braucht es klare Eigentümer für Bibliothek, Metadatenmodell und Prompt-Pflege. Für Redakteure sollten kurze Schulungen, Prüfroutinen und ein Supportweg für Fehlklassifikationen vorhanden sein. Governance-seitig müssen sensible Dokumentarten identifiziert und Regeln für manuelle Freigabe, Nachkontrolle und Stichproben festgelegt sein. Für DACH besonders sinnvoll sind außerdem eine frühe Einbindung von Datenschutz, Compliance und – wo relevant – Betriebsrat, sobald Auswertungen oder Klassifizierungen personenbeziehbare Rückschlüsse zulassen. Die Technik ist flott; die Mitbestimmung ist meist der echte Taktgeber.
Fazit: SharePoint Autofill Columns ist kein Spielzeug und auch kein Allheilmittel. Richtig eingesetzt ist es ein sehr brauchbarer Hebel, um Metadatenqualität, Suche und Governance in SharePoint spürbar zu verbessern. Der Erfolgsfaktor ist nicht die KI allein, sondern das Zusammenspiel aus Bibliotheksdesign, Content Types, guten Prompts, Redakteursschulung und messbarem Pilot. Anders gesagt: Erst Ordnung, dann Automatik. Sonst bekommt die Rumpelkammer eben nur einen Turbolader.