Fallstudie

DATEV-EXTF-Automatisierung

KanzleiDeutschland2025

Eine deutsche Steuerkanzlei mit rund fünfzehn Mitarbeitenden verbrachte monatlich mehrere Personentage mit der Aufbereitung von Belegen für DATEV. Wir haben eine OCR- und Klassifizierungspipeline gebaut, die Eingangs- und Ausgangsbelege automatisch verarbeitet, die Umsatzsteuer vorab zuordnet und einen sauberen DATEV-EXTF-Export erzeugt. Die Buchhaltung prüft nur noch Ausnahmefälle.

Ausgangslage

Die Kanzlei betreut mittelständische Mandanten, darunter mehrere E-Commerce-Unternehmen mit hohem Belegaufkommen — Hunderte bis Tausende Belege pro Mandant pro Monat. Die Aufbereitung lief klassisch: Belege ankommen per Mail oder über das Mandantenportal, Sichtprüfung, manuelles Eintippen oder halbautomatisches Erfassen, manuelle Zuordnung von Konto und Gegenkonto, manuelle Umsatzsteuer-Klassifizierung, dann der DATEV-Export. Pro Mandant fielen so monatlich ein bis zwei Arbeitstage an reiner Erfassungszeit an. Bei zwanzig vergleichbaren Mandanten summierte sich das auf ein erhebliches Volumen, das insbesondere zum Monatsende die Buchhaltung an die Belastungsgrenze brachte. Hinzu kam ein wiederkehrendes Problem: Belege von Amazon, eBay und kleineren EU-Marktplätzen kommen in unterschiedlichen Layouts, und die Umsatzsteuerlogik bei innergemeinschaftlichen Lieferungen und Reverse-Charge-Fällen ist fehleranfällig, wenn sie unter Zeitdruck manuell gepflegt wird.

Lösung

Wir haben eine Pipeline gebaut, die Belege per E-Mail oder Upload entgegennimmt, OCR auf strukturierte Felder durchführt (Datum, Belegnummer, Aussteller, Brutto, Netto, Umsatzsteuersatz, Land), die Transaktion klassifiziert und in das DATEV-EXTF-Format überführt. Die Klassifizierungslogik wurde gemeinsam mit der Buchhalterin in mehreren Iterationen kalibriert: welche Konto-Gegenkonto-Kombinationen für welche Belegtypen, wann der BU-Schlüssel 240 für innergemeinschaftliche Lieferungen greift, wie mit Drittlandgeschäften umzugehen ist. Die OCR nutzt Claude Vision für die robuste Extraktion auch aus schlecht gescannten Belegen, die Klassifizierung läuft in Langflow mit nachgelagerten Regelprüfungen, die Datenhaltung in PostgreSQL auf unserer Hetzner-Infrastruktur in Frankfurt. Der DATEV-EXTF-Export wird täglich generiert und kann direkt in DATEV Unternehmen online importiert werden. Optional steht eine On-Premise-Variante zur Verfügung — manche Mandanten der Kanzlei haben besonders strenge Datenanforderungen, und die Möglichkeit, die Pipeline komplett in einem mandantenseitigen Docker-Stack zu betreiben, ist Teil unseres Angebots. Die Verarbeitung der personenbezogenen Daten ist über einen AVV nach Artikel 28 DSGVO geregelt.

Ergebnis

Der Großteil der Belege durchläuft die Pipeline jetzt automatisch. Die Buchhalterin prüft nur noch markierte Ausnahmen — neue Belegtypen, ungewöhnliche Beträge, fehlende Pflichtfelder. Die monatliche Aufbereitungszeit pro Mandant ist erheblich reduziert. Die Kanzlei spricht in der internen Kommunikation von rund siebzig Prozent Zeitersparnis im Erfassungsschritt; diese Zahl bezieht sich auf die direkte Erfassungstätigkeit, nicht auf den gesamten Monatsabschluss. Konkret: ein Mandant mit etwa zweitausend Belegen pro Monat band zuvor rund zehn Personenstunden in der Erfassung — heute sind es rund drei Stunden für die Prüfung der Ausnahmen. DSGVO-konform durch deutsches Hosting, On-Premise-Variante für Mandanten mit erhöhten Anforderungen.

Was wir daraus gelernt haben

Drei Erkenntnisse aus diesem Projekt. Erstens: DATEV-EXTF ist mechanischer als gedacht, sobald die Konto-Logik der konkreten Kanzlei einmal sauber dokumentiert ist. Wir haben in der ersten Woche fast nur damit verbracht, mit der Buchhalterin die SKR03-Logik des Hauses verbal zu ergründen — diese Stunden haben sich später hundertfach ausgezahlt. Zweitens: OCR ist nie hundert Prozent. Unser erster Anlauf, alle Belegtypen über ein einziges Vision-Prompt zu schicken, hat bei Restaurantbelegen und kleinen Quittungen klar gepatzt. Erst nachdem wir eine kurze Vorklassifizierung des Belegtyps vorgeschaltet und dann typspezifische Extraktionsschemata verwendet haben, kamen die Felder zuverlässig sauber heraus. Drittens: Mandanten der Kanzlei reagieren sehr unterschiedlich auf "KI in der Buchhaltung". Wir haben gelernt, dass eine On-Premise-Option nicht nur ein technisches Feature ist, sondern oft das, was eine Kanzlei braucht, um ihre konservativeren Mandanten zu halten.

Ähnliches Problem?

Schreiben Sie uns kurz, wir antworten innerhalb eines Werktages.

Projekt anfragen