Înapoi la blog
Scris de Andrei BiroUltima actualizare

Clasificare Facturi cu AI: Cum BillyBox Filtrează Automat Facturile Reale de Zgomot

Martie 2026

Inbox-ul tău de email nu conține doar facturi. Conține logo-uri, bannere de marketing, notificări de livrare, PDF-uri cu termeni și condiții, fluturași promoționali și zeci de alte atașamente care par că ar putea fi facturi — dar nu sunt. Când conectezi email-ul la un tool de gestionare facturi, toate astea sunt trase în aplicație. Rezultatul? O coadă de review plină de zgomot care anulează scopul automatizării.

Exact asta s-a întâmplat cu unul dintre primii noștri utilizatori. Și-a conectat email-ul și a găsit sute de imagini și logo-uri amestecate cu facturile reale. Feedback-ul a fost direct: „Care e rostul dacă trebuie să le șterg una câte una?" Avea dreptate. Așa că am construit clasificarea cu AI.

Problema: atașamentele din email sunt haotice

Majoritatea afacerilor primesc 50-200+ email-uri cu atașamente pe lună. Doar o fracțiune din acele atașamente sunt facturi reale. Restul include:

  • Logo-uri și bannere — imagini integrate în semnături de email și email-uri de marketing
  • Etichete de livrare și PDF-uri de tracking — documente logistice care nu sunt facturi
  • Actualizări de termeni și condiții — documente legale atașate ca PDF-uri
  • Materiale de marketing — cataloage de produse, fluturași promoționali, invitații la evenimente
  • Chitanțe pentru servicii gratuite — „facturi" de 0,00 € de la tool-uri pe tier-ul gratuit
  • Atașamente duplicate — același PDF forwardat sau răspuns de mai multe ori

Filtrarea bazată pe reguli prinde o parte din asta — poți filtra după tipul fișierului, dimensiune sau domeniul expeditorului. Dar logo-urile sunt PNG-uri la fel ca facturile scanate. PDF-urile de marketing au aceeași extensie ca facturile reale. Regulile singure nu pot face diferența pentru că diferența este în conținut, nu în format.

Cum folosește BillyBox AI pentru clasificarea atașamentelor

BillyBox trece acum fiecare atașament printr-un pipeline de clasificare AI înainte să ajungă în coada ta de review. Sistemul folosește o abordare cu două straturi:

Stratul 1: Pre-Filtrare Bazată pe Reguli

Înainte ca AI-ul să ruleze, BillyBox aplică reguli deterministe: domenii cunoscute de facturare (50+ pattern-uri de furnizori), verificări de tip fișier, praguri de dimensiune și analiză de metadate email. Atașamentele de la expeditori cunoscuți precum Stripe, AWS sau Hetzner sar peste AI și merg direct în coada ta. Asta menține lucrurile rapide și ieftine.

Stratul 2: Gate de Clasificare AI

Pentru atașamentele care nu se potrivesc cu pattern-uri cunoscute, BillyBox trimite textul extras și metadatele la un model AI care determină dacă documentul este o factură reală, o chitanță, un extras de cont, sau altceva (un logo, un PDF de marketing, o notificare). Sistemul folosește un backend dual — Anthropic (Claude Haiku) și OpenAI — cu fallback automat dacă un furnizor nu e disponibil. Documentele care nu sunt facturi sunt marcate automat ca „ignorate" și nu îți mai aglomerează coada de review.

Stratul 3: AI Vision pentru Documente Scanate

Pentru PDF-uri scanate, chitanțe fotografiate și imagini atașate (JPG, PNG), AI-ul nu se poate baza doar pe text extras — pentru că nu există text. BillyBox folosește modele AI vision pentru a analiza imaginea direct: e o poză a unei facturi reale sau doar un logo de companie? O chitanță scanată sau un fluturaș promoțional? Clasificarea bazată pe viziune prinde non-facturile care ar fi trecut de analiza bazată doar pe text.

AI-ul nu verifică doar dacă un document menționează bani. Înțelege contextul: un email promoțional care spune „Economisește 50€ la următoarea comandă" nu este o factură. Un PDF cu logo de companie, număr de factură, linii de produse și un total — asta e o factură. Modelul evaluează structura completă a documentului, nu doar cuvinte cheie.

Ce se filtrează

În testele cu inbox-uri reale de utilizatori, clasificarea AI filtrează de obicei 40-70% din atașamentele care anterior ar fi aglomerat coada de review:

Logo-uri de companie— Imagini PNG/JPG integrate în email-uri
PDF-uri de marketing— Cataloage, fluturași, promoții
Documente de expediere— Etichete, tracking, formulare vamale
Documente legale— Actualizări ToS, politici de confidențialitate
PDF-uri de notificare— Alerte de cont, resetări parolă
Invitații calendar— Atașamente de meeting-uri, detalii evenimente

Ce se păstrează

AI-ul este intenționat conservator în filtrare. Când e incert, păstrează documentul în coada ta în loc să ascundă o factură reală. Acestea trec întotdeauna:

Facturi— Documente cu sume, linii de produse, totaluri
Chitanțe— Confirmări de plată cu sume debitate
Extrase de cont— Extrase cu solduri
Note de credit— Restituiri și ajustări
E-facturi XML— Facturi electronice structurate
Documente ambigue— Orice e incert rămâne în coadă

Filosofia e simplă: e mai bine să reviewezi un document în plus decât să pierzi o factură reală. AI-ul se ocupă de zgomotul evident; tu ai decizia finală pe restul.

De ce nu doar OCR sau potrivire de cuvinte cheie?

Potrivirea de cuvinte cheie („conține cuvântul factură?") eșuează pentru că email-urile de marketing conțin frecvent cuvinte precum „factură", „plată" și „chitanță" fără să fie facturi reale. Un newsletter care spune „Vizualizează factura ta" cu un link nu este o factură — e o notificare. Un PDF promoțional intitulat „Model factură" nu este factura ta.

OCR-ul tradițional (Recunoașterea Optică a Caracterelor) rezolvă o problemă diferită — convertirea imaginilor în text. Nu te ajută să decizi dacă acel text reprezintă o factură sau un logo. BillyBox merge mai departe: modelele sale AI vision analizează structura vizuală a documentelor scanate direct, înțelegând layout-ul, titlurile, liniile de produse și totalurile ca un om. Asta înseamnă că clasificarea și extracția de date se întâmplă într-un singur pas — fără pas separat de OCR necesar.

Confidențialitate și cost

Clasificarea AI procesează doar metadatele documentului și textul extras — nu fișierele PDF originale. Extragerea textului se face local pe serverele noastre mai întâi, apoi doar conținutul extras este trimis la modelul AI pentru clasificare. Documentele tale originale rămân în infrastructura BillyBox găzduită în UE.

Costul per clasificare este de fracțiuni de cent, motiv pentru care această funcție este inclusă în toate planurile — inclusiv cel gratuit. Nu există nicio taxă per pagină sau per document pentru clasificarea AI.

Dincolo de clasificare: extracție de date cu AI

Aceleași modele AI care clasifică atașamentele extrag și date structurate din facturi. Pentru documente scanate și imagini unde extracția tradițională de text eșuează, AI vision citește documentul vizual și extrage: numele emitentului, suma, moneda, data facturii, numărul facturii, destinatarul, descrierea, suma TVA și subtotalul. Aceeași capabilitate vision gestionează și chitanțe scrise de mână — AI-ul citește nume de furnizori, sume și date scrise de mână cu precizie rezonabilă pentru majoritatea stilurilor de scriere obișnuite. Fiecare câmp extras include un scor de încredere pentru a ști ce valori au fost citite cu certitudine și ce ar putea necesita o verificare rapidă.

Toate datele extrase sunt editabile inline — dacă AI-ul citește greșit un nume de furnizor sau o sumă, poți corecta direct din interfața de review fără a părăsi pagina. Asta se aplică atât facturilor din email cât și documentelor încărcate manual (drag-and-drop PDF, XML, JPG sau PNG).

Rezultatul: o coadă de review curată

Înainte de clasificarea AI, conectarea unui email cu un inbox aglomerat însemna să reviewezi sute de atașamente irelevante. Acum, vezi mai ales facturi și chitanțe reale. Zgomotul a dispărut. Clasificarea durează minute în loc de o oră.

Combinat cu swipe-to-classify pe mobil și scurtături de tastatură pe desktop, întregul flux de la email la export-ul gata pentru contabil este acum suficient de rapid încât să-l faci într-o pauză de cafea.

Articole similare

Încearcă gratuit

Clasificarea și extracția AI din BillyBox sunt incluse în toate planurile, inclusiv cel gratuit. Conectează-ți Gmail-ul, Outlook-ul, Zoho sau orice email IMAP, extrage o lună și vezi diferența — o coadă curată de facturi reale, nu un zid de logo-uri și PDF-uri de marketing. Poți și să încarci facturi manual prin drag-and-drop.