C'è un segreto scomodo nelle operazioni enterprise: il dipendente più costoso della vostra azienda potrebbe essere quello che copia dati dai PDF nei fogli di calcolo.

Lo vediamo ovunque. Sinistri assicurativi. Documenti di spedizione. Adempimenti normativi. Ordini di acquisto. I documenti arrivano in diciassette formati diversi, e qualcuno deve leggere ciascuno e digitare i numeri in SAP.

Abbiamo costruito un sistema che legge più velocemente di qualsiasi umano e non traspone mai una cifra.

La Scala del Problema

Uno dei nostri clienti — una società di logistica che processa 8.000 spedizioni al giorno — aveva un team di 23 persone che non faceva altro che inserimento dati documentali. Polizze di carico, dichiarazioni doganali, packing list, fatture. Ogni spedizione generava 4-7 documenti, ogni documento aveva 15-30 campi che richiedevano estrazione.

Circa 50.000 pagine al giorno, 250.000 data point, tutti inseriti manualmente. Tasso di errore: 3,1%. Costo per documento: circa 2 EUR.

Cosa Abbiamo Costruito

Il modulo di document intelligence di Cognity gestisce l'intera pipeline:

1. Acquisizione

I documenti arrivano via email, SFTP, upload API o scansione alle stazioni di accettazione. Normalizziamo tutto in un formato comune indipendentemente dalla fonte. Note manoscritte, fax (sì, fax), ricevute da stampante termica — il sistema gestisce tutto.

2. Classificazione

Prima dell'estrazione, il sistema identifica cosa sta guardando. È una polizza di carico o una fattura commerciale? Una dichiarazione doganale o una packing list? Accuratezza della classificazione: 99,7%.

Questo passaggio conta perché i template di estrazione sono specifici per documento. Un campo etichettato "peso" significa cose diverse su documenti diversi — peso lordo, peso netto, peso volumetrico. Il contesto determina l'interpretazione.

3. Estrazione

Utilizziamo una combinazione di analisi del layout e modelli linguistici:

  • Documenti strutturati (moduli, tabelle): Estrazione layout-aware usando modellazione delle relazioni spaziali
  • Documenti semi-strutturati (fatture, OdA): Template matching con fallback a estrazione basata su LLM
  • Documenti non strutturati (email, note): Estrazione NLP completa con riconoscimento entità

4. Validazione

Ogni campo estratto passa attraverso validazione con regole di business. Questo peso ha senso per questo codice merce? Questa coppia mittente-destinatario è conosciuta? Il totale corrisponde alle righe?

Le anomalie vengono segnalate per revisione umana — ma solo le anomalie. Gli umani ora gestiscono le eccezioni, non l'elaborazione di routine.

I Risultati

Dopo il deployment nei tre principali centri di elaborazione:

  • Velocità di elaborazione: 50.000 pagine/giorno con 4 operatori di revisione (da 23 persone a tempo pieno)
  • Accuratezza: 99,2% end-to-end (da 96,9% manuale)
  • Tempo di elaborazione: Media 1,3 secondi per documento (da 4,2 minuti manuale)
  • Costo per documento: 0,08 EUR (da 2,00 EUR)

I 19 membri dello staff che facevano inserimento dati sono stati riassegnati a gestione eccezioni, servizio clienti e ruoli di miglioramento processi. Nessuno è stato licenziato — sono stati riassegnati a lavori che richiedono effettivamente giudizio umano.

Decisioni Tecniche Che Hanno Contato

Deployment on-premise. Questi documenti contengono dati commerciali sensibili — prezzi, volumi, relazioni con i clienti. L'elaborazione cloud era fuori discussione. Abbiamo deployato Cognity on-premise con nodi GPU per l'inferenza.

Soglie di confidenza invece di target di accuratezza. Invece di ottimizzare per la massima accuratezza, abbiamo ottimizzato per confidenza calibrata. Quando il sistema dice di essere sicuro al 98%, ha ragione il 98% delle volte. Questo permette agli operatori di fidarsi dei punteggi di confidenza e concentrare il tempo di revisione dove conta.

Cicli di feedback. Ogni correzione di un operatore alimenta il modello. Il sistema è partito al 94% di accuratezza. Sei mesi dopo, è al 99,2%. Gli operatori stanno letteralmente addestrando il loro sostituto — solo che non vengono sostituiti, vengono promossi a ruoli di supervisione.

La Verità Scomoda

La maggior parte delle aziende enterprise sa di avere un problema di elaborazione documenti. Lo sanno da anni. Il motivo per cui non l'hanno risolto non è la tecnologia — è organizzativo. Deployare document AI significa cambiare i flussi di lavoro, ridefinire i ruoli e fidarsi di un sistema per fare lavoro che gli umani hanno sempre fatto.

La tecnologia è pronta. La domanda è se la vostra organizzazione è pronta a usarla.

Possiamo aiutare con entrambe le cose.