Clasificare Facturi cu AI: Cum BillyBox Filtrează Automat Facturile Reale de Zgomot
Martie 2026
Inbox-ul tău de email nu conține doar facturi. Conține logo-uri, bannere de marketing, notificări de livrare, PDF-uri cu termeni și condiții, fluturași promoționali și zeci de alte atașamente care par că ar putea fi facturi — dar nu sunt. Când conectezi email-ul la un tool de gestionare facturi, toate astea sunt trase în aplicație. Rezultatul? O coadă de review plină de zgomot care anulează scopul automatizării.
Exact asta s-a întâmplat cu unul dintre primii noștri utilizatori. Și-a conectat email-ul și a găsit sute de imagini și logo-uri amestecate cu facturile reale. Feedback-ul a fost direct: „Care e rostul dacă trebuie să le șterg una câte una?" Avea dreptate. Așa că am construit clasificarea cu AI.
Problema: Atașamentele din Email Sunt Haotice
Majoritatea afacerilor primesc 50-200+ email-uri cu atașamente pe lună. Doar o fracțiune din acele atașamente sunt facturi reale. Restul include:
- Logo-uri și bannere — imagini integrate în semnături de email și email-uri de marketing
- Etichete de livrare și PDF-uri de tracking — documente logistice care nu sunt facturi
- Actualizări de termeni și condiții — documente legale atașate ca PDF-uri
- Materiale de marketing — cataloage de produse, fluturași promoționali, invitații la evenimente
- Chitanțe pentru servicii gratuite — „facturi" de 0,00 € de la tool-uri pe tier-ul gratuit
- Atașamente duplicate — același PDF forwardat sau răspuns de mai multe ori
Filtrarea bazată pe reguli prinde o parte din asta — poți filtra după tipul fișierului, dimensiune sau domeniul expeditorului. Dar logo-urile sunt PNG-uri la fel ca facturile scanate. PDF-urile de marketing au aceeași extensie ca facturile reale. Regulile singure nu pot face diferența pentru că diferența este în conținut, nu în format.
Cum Folosește BillyBox AI pentru Clasificarea Atașamentelor
BillyBox trece acum fiecare atașament printr-un pipeline de clasificare AI înainte să ajungă în coada ta de review. Sistemul folosește o abordare cu două straturi:
Stratul 1: Pre-Filtrare Bazată pe Reguli
Înainte ca AI-ul să ruleze, BillyBox aplică reguli deterministe: domenii cunoscute de facturare (50+ pattern-uri de furnizori), verificări de tip fișier, praguri de dimensiune și analiză de metadate email. Atașamentele de la expeditori cunoscuți precum Stripe, AWS sau Hetzner sar peste AI și merg direct în coada ta. Asta menține lucrurile rapide și ieftine.
Stratul 2: Gate de Clasificare AI
Pentru atașamentele care nu se potrivesc cu pattern-uri cunoscute, BillyBox trimite textul extras și metadatele la un model AI care determină dacă documentul este o factură reală, o chitanță, un extras de cont, sau altceva (un logo, un PDF de marketing, o notificare). Documentele care nu sunt facturi sunt marcate automat ca „ignorate" și nu îți mai aglomerează coada de review.
AI-ul nu verifică doar dacă un document menționează bani. Înțelege contextul: un email promoțional care spune „Economisește 50€ la următoarea comandă" nu este o factură. Un PDF cu logo de companie, număr de factură, linii de produse și un total — asta e o factură. Modelul evaluează structura completă a documentului, nu doar cuvinte cheie.
Ce Se Filtrează
În testele cu inbox-uri reale de utilizatori, clasificarea AI filtrează de obicei 40-70% din atașamentele care anterior ar fi aglomerat coada de review:
Ce Se Păstrează
AI-ul este intenționat conservator în filtrare. Când e incert, păstrează documentul în coada ta în loc să ascundă o factură reală. Acestea trec întotdeauna:
Filosofia e simplă: e mai bine să reviewezi un document în plus decât să pierzi o factură reală. AI-ul se ocupă de zgomotul evident; tu ai decizia finală pe restul.
De Ce Nu Doar OCR sau Potrivire de Cuvinte Cheie?
Potrivirea de cuvinte cheie („conține cuvântul factură?") eșuează pentru că email-urile de marketing conțin în mod curent cuvinte precum „factură", „plată" și „chitanță" fără să fie facturi reale. Un newsletter care spune „Vizualizează factura ta" cu un link nu este o factură — e o notificare. Un PDF promoțional intitulat „Model factură" nu este factura ta.
OCR (Recunoașterea Optică a Caracterelor) rezolvă o problemă diferită — convertirea imaginilor în text. Nu te ajută să decizi dacă acel text reprezintă o factură sau un logo. Ai nevoie de înțelegerea structurii și intenției documentului, exact ce oferă AI-ul.
Confidențialitate și Cost
Clasificarea AI procesează doar metadatele documentului și textul extras — nu fișierele PDF originale. Extragerea textului se face local pe serverele noastre mai întâi, apoi doar conținutul extras este trimis la modelul AI pentru clasificare. Documentele tale originale rămân în infrastructura BillyBox găzduită în UE.
Costul per clasificare este de fracțiuni de cent, motiv pentru care această funcție este inclusă în toate planurile — inclusiv cel gratuit. Nu există nicio taxă per pagină sau per document pentru clasificarea AI.
Rezultatul: O Coadă de Review Curată
Înainte de clasificarea AI, conectarea unui email cu un inbox aglomerat însemna să reviewezi sute de atașamente irelevante. Acum, vezi mai ales facturi și chitanțe reale. Zgomotul a dispărut. Clasificarea durează minute în loc de o oră.
Combinat cu swipe-to-classify pe mobil și scurtături de tastatură pe desktop, întregul flux de la email la export-ul gata pentru contabil este acum suficient de rapid încât să-l faci într-o pauză de cafea.
Articole Asociate
Încearcă Gratuit
Clasificarea AI din BillyBox este inclusă în toate planurile, inclusiv cel gratuit. Conectează-ți email-ul, extrage o lună, și vezi diferența — o coadă curată de facturi reale, nu un zid de logo-uri și PDF-uri de marketing.