KI-Rechnungsklassifizierung: Wie BillyBox echte Rechnungen automatisch vom Rauschen trennt
März 2026
Dein E-Mail-Postfach enthält nicht nur Rechnungen. Es enthält Logos, Marketing-Banner, Versandbenachrichtigungen, AGB-PDFs, Werbeflyer und Dutzende anderer Anhänge, die aussehen als könnten sie Rechnungen sein — es aber nicht sind. Wenn du deine E-Mail mit einem Rechnungsverwaltungstool verbindest, wird all das mit importiert. Das Ergebnis? Eine Prüfwarteschlange voller Rauschen, die den Zweck der Automatisierung zunichtemacht.
Genau das ist einem unserer ersten Nutzer passiert. Er verband seine E-Mail und fand Hunderte Bilder und Logos gemischt mit seinen echten Rechnungen. Sein Feedback war deutlich: „Was bringt das, wenn ich jedes einzeln durchgehen und entfernen muss?" Er hatte recht. Also haben wir KI-Klassifizierung gebaut, um das zu lösen.
Das Problem: E-Mail-Anhänge sind chaotisch
Die meisten Unternehmen erhalten 50-200+ E-Mails mit Anhängen pro Monat. Nur ein Bruchteil dieser Anhänge sind tatsächliche Rechnungen. Der Rest beinhaltet:
- Firmenlogos und Banner — eingebettete Bilder in E-Mail-Signaturen und Marketing-E-Mails
- Versandetiketten und Tracking-PDFs — Logistikdokumente, die keine Rechnungen sind
- AGB-Aktualisierungen — rechtliche Dokumente als PDF-Anhänge
- Marketingmaterial — Produktkataloge, Werbeflyer, Eventeinladungen
- Quittungen für kostenlose Dienste — 0,00 EUR „Rechnungen" von Gratis-Tools
- Doppelte Anhänge — dasselbe PDF mehrfach weitergeleitet oder beantwortet
Regelbasierte Filterung fängt einen Teil davon ab — du kannst nach Dateityp, Größe oder Absenderdomain filtern. Aber Logos sind PNGs genau wie gescannte Rechnungen. Marketing-PDFs haben dieselbe Dateiendung wie echte Rechnungen. Regeln allein können den Unterschied nicht erkennen, weil der Unterschied im Inhalt liegt, nicht im Format.
Wie BillyBox KI zur Klassifizierung von Anhängen nutzt
BillyBox lässt jeden Anhang durch eine KI-Klassifizierungspipeline laufen, bevor er deine Prüfwarteschlange erreicht. Das System nutzt einen zweischichtigen Ansatz:
Schicht 1: Regelbasierte Vorfilterung
Bevor die KI überhaupt läuft, wendet BillyBox deterministische Regeln an: bekannte Rechnungsdomains (50+ Anbietermuster), Dateitypprüfungen, Größenschwellen und E-Mail-Metadatenanalyse. Anhänge von bekannten Rechnungssendern wie Stripe, AWS oder Hetzner überspringen die KI komplett und gehen direkt in deine Warteschlange. Das hält alles schnell und günstig.
Schicht 2: KI-Klassifizierungsgate
Für Anhänge, die keinem bekannten Muster entsprechen, sendet BillyBox den extrahierten Text und die Metadaten an ein KI-Modell, das bestimmt, ob das Dokument eine echte Rechnung, eine Quittung, ein Kontoauszug oder etwas ganz anderes ist (ein Logo, ein Marketing-PDF, eine Benachrichtigung). Das System unterstützt ein duales Backend — Anthropic AI und OpenAI — mit automatischem Fallback, wenn ein Anbieter nicht verfügbar ist. Nicht-Rechnungsdokumente werden automatisch als „Ignoriert" markiert, damit sie deine Prüfwarteschlange nie überladen.
Schicht 3: KI-Vision für gescannte Dokumente
Für gescannte PDFs, fotografierte Quittungen und Bildanhänge (JPG, PNG) kann die KI sich nicht allein auf extrahierten Text verlassen — weil es keinen gibt. BillyBox nutzt KI-Vision-Modelle, um das Bild direkt zu analysieren: Ist das ein Foto einer echten Rechnung oder nur ein Firmenlogo? Eine gescannte Quittung oder ein Werbeflyer? Visionsbasierte Klassifizierung erkennt Nicht-Rechnungen, die durch reine Textanalyse durchrutschen würden.
Die KI prüft nicht nur, ob ein Dokument Geldbeträge erwähnt. Sie versteht den Kontext: Eine Werbe-E-Mail mit „Spare 50 EUR bei deiner nächsten Bestellung" ist keine Rechnung. Ein PDF mit Firmenlogo, Rechnungsnummer, Einzelposten und Gesamtbetrag — das ist eine Rechnung. Das Modell bewertet die gesamte Dokumentstruktur, nicht nur Schlüsselwörter.
Was herausgefiltert wird
In Tests mit echten Nutzerpostfächern filtert die KI-Klassifizierung typischerweise 40-70 % der Anhänge heraus, die zuvor die Prüfwarteschlange überladen hätten:
Was durchgelassen wird
Die KI ist absichtlich konservativ beim Filtern. Im Zweifelsfall behält sie das Dokument in deiner Warteschlange, statt eine echte Rechnung zu verstecken. Diese werden immer durchgelassen:
Die Philosophie ist einfach: Es ist besser, ein Dokument zu viel zu prüfen, als eine echte Rechnung zu übersehen. KI erledigt das offensichtliche Rauschen; du triffst die endgültige Entscheidung bei allem anderen.
Warum nicht einfach OCR oder simple Schlüsselwortsuche?
Schlüsselwortsuche („enthält es das Wort Rechnung?") versagt, weil Marketing-E-Mails routinemäßig Wörter wie „Rechnung", „Zahlung" und „Quittung" enthalten, ohne echte Rechnungen zu sein. Ein Newsletter mit „Ihre Rechnung ansehen" und einem Link ist keine Rechnung — es ist eine Benachrichtigung. Ein Werbe-PDF mit dem Titel „Rechnungsvorlage" ist nicht deine Rechnung.
Traditionelle OCR (Optische Zeichenerkennung) löst ein anderes Problem — Bilder in Text umwandeln. Sie hilft dir nicht zu entscheiden, ob dieser Text eine Rechnung oder ein Logo darstellt. BillyBox geht weiter: Seine KI-Vision-Modelle analysieren die visuelle Struktur gescannter Dokumente direkt und verstehen Layout, Überschriften, Einzelposten und Summen wie ein Mensch. Das bedeutet, Klassifizierung und Datenextraktion passieren in einem einzigen Durchgang — kein separater OCR-Schritt nötig.
Datenschutz und Kosten
Die KI-Klassifizierung verarbeitet nur Dokumentmetadaten und extrahierten Text — nicht die originalen PDF-Dateien. Die Textextraktion passiert zuerst auf unseren Servern lokal, dann wird nur der extrahierte Inhalt zur Klassifizierung an das KI-Modell gesendet. Deine Originaldokumente verbleiben innerhalb der EU-gehosteten Infrastruktur von BillyBox.
Die Kosten pro Klassifizierung betragen Bruchteile eines Cents, weshalb dieses Feature in allen Tarifen enthalten ist — einschließlich des kostenlosen Tarifs. Es gibt keine Pro-Seiten- oder Pro-Dokument-Gebühr für KI-Klassifizierung.
Über Klassifizierung hinaus: KI-gestützte Datenextraktion
Dieselben KI-Modelle, die Anhänge klassifizieren, extrahieren auch strukturierte Daten aus Rechnungen. Für gescannte Dokumente und Bilder, bei denen traditionelle Textextraktion versagt, liest die KI-Vision das Dokument visuell und zieht heraus: Ausstellername, Betrag, Währung, Rechnungsdatum, Rechnungsnummer, Empfänger, Beschreibung, Steuerbetrag und Zwischensumme. Dieselbe Vision-Fähigkeit verarbeitet auch handschriftliche Quittungen — die KI liest handgeschriebene Anbieternamen, Beträge und Daten mit vernünftiger Genauigkeit für die meisten gängigen Handschriften. Jedes extrahierte Feld enthält einen Konfidenzwert, damit du weißt, welche Werte sicher gelesen wurden und welche einen kurzen Check brauchen könnten.
Alle extrahierten Daten sind inline editierbar — wenn die KI einen Anbieternamen oder Betrag falsch liest, kannst du es direkt in der Prüfoberfläche korrigieren, ohne die Seite zu verlassen. Das gilt für Rechnungen aus E-Mails ebenso wie für manuell hochgeladene Dokumente (Drag-and-Drop PDF-, XML-, JPG- oder PNG-Dateien).
Das Ergebnis: Eine saubere Prüfwarteschlange
Vor der KI-Klassifizierung bedeutete das Verbinden einer E-Mail mit einem vollen Postfach, Hunderte irrelevanter Anhänge durchsehen zu müssen. Jetzt siehst du hauptsächlich echte Rechnungen und Quittungen. Das Rauschen ist weg. Die Klassifizierung dauert Minuten statt der besseren Hälfte einer Stunde.
Kombiniert mit Wischen-zum-Klassifizieren auf dem Handy und Tastaturkürzeln am Desktop ist der gesamte Ablauf von der E-Mail bis zum steuerberater-fertigen Export jetzt schnell genug, um ihn in einer Kaffeepause zu erledigen.
Verwandte Artikel
Kostenlos testen
BillyBox's KI-Klassifizierung und -Extraktion sind in allen Tarifen enthalten, inklusive kostenlos. Verbinde dein Gmail, Outlook, Zoho oder jede IMAP-E-Mail, rufe einen Monat ab und sieh den Unterschied — eine saubere Warteschlange mit echten Rechnungen, nicht eine Wand aus Logos und Marketing-PDFs. Du kannst auch Rechnungen manuell per Drag-and-Drop hochladen.