Document extraction platform

BlueIT ha sviluppato una piattaforma di Intelligent Document Processing (IDP) basata su Intelligenza Artificiale Generativa che automatizza l'estrazione dei dati da documenti destrutturati. Grazie ai Large Language Models (LLM), la soluzione supera i limiti dei tradizionali sistemi OCR, riducendo tempi, costi ed errori nella gestione documentale.

Client Situation
Challenge

Nell'era della trasformazione digitale, la gestione efficiente delle informazioni contenute in documenti destrutturati rappresenta una delle sfide più complesse per le aziende. Quotidianamente, le organizzazioni ricevono un'enorme mole di documenti eterogenei: Documenti di Trasporto (DDT), fatture, modelli fiscali (come gli F24), ingiunzioni legali e contratti. Tradizionalmente, l'estrazione dei dati da questi documenti richiede un massiccio intervento manuale, comportando costi operativi elevati, tempi di elaborazione prolungati e un rischio significativo di errori di data entry.

Per rispondere a questa esigenza, BlueIT ha sviluppato una piattaforma all'avanguardia basata su tecnologie di Intelligenza Artificiale Generativa. Superando i limiti dei tradizionali sistemi OCR (Optical Character Recognition) basati su template rigidi e coordinate spaziali, la soluzione BlueIT introduce una reale capacità di comprensione semantica del testo. Sfruttando i Large Language Models (LLM) all'interno di un'architettura agentica avanzata, la piattaforma è in grado di leggere, comprendere ed estrarre informazioni con estrema precisione, indipendentemente dal layout o dal formato del documento originale.

Il nostro approccio

Il cuore tecnologico della soluzione si fonda su un'architettura definita "AI agentica". In questo ecosistema, diversi modelli specializzati (agenti) vengono istruiti per svolgere compiti specifici sotto la supervisione di un orchestratore centrale. Questo approccio modulare garantisce un'elevata flessibilità e scalabilità, permettendo al sistema di adattarsi dinamicamente a molteplici tipologie documentali e di integrare tecniche avanzate come la Retrieval-Augmented Generation (RAG) o il fine-tuning specifico sui dati del cliente.

Implementazione tecnologica

  • Acquisizione Multicanale: Il sistema intercetta automaticamente i documenti in ingresso attraverso diverse modalità, inclusa l'acquisizione diretta da caselle di posta elettronica dedicate (es. ricezione automatica di DDT via mail) o tramite caricamento manuale attraverso l'interfaccia web.
  • Classificazione Intelligente: Ogni documento acquisito viene analizzato dall'AI che ne determina la tipologia. Il sistema fornisce un livello di confidenza e una spiegazione logica (reasoning) della scelta, instradando il file verso il flusso di lavoro appropriato.
  • Estrazione Semantica: Utilizzando modelli linguistici avanzati, il sistema estrae le informazioni rilevanti basandosi sulla comprensione del contesto e non su coordinate fisse, garantendo robustezza rispetto alle variazioni di formato.
  • Strutturazione dei Dati: Le informazioni estratte vengono organizzate secondo uno schema dati predefinito (JSON Schema), configurabile dall'utente per ogni specifica tipologia documentale.
  • Integrazione Gestionale: I dati strutturati, una volta validati, vengono esportati e caricati automaticamente nel software gestionale aziendale (ERP, CRM, ecc.) tramite procedure di integrazione dedicate.

Capacità e Funzionalità della Piattaforma

La soluzione BlueIT offre un'interfaccia web intuitiva e completa, progettata per massimizzare l'efficienza operativa mantenendo il pieno controllo umano sul processo. Di seguito vengono illustrate le principali sezioni e funzionalità del sistema.

Dashboard e Caricamento Documenti

La Homepage della piattaforma rappresenta il punto di accesso principale per gli operatori. Da qui è possibile avviare rapidamente nuovi processi di elaborazione e monitorare le attività recenti.

Figura 1: Homepage della piattaforma con area di upload e selezione rapida dei workflow.

L'area 'New Upload' supporta il drag & drop e accetta un'ampia gamma di formati file (PDF, DOCX, XLSX, CSV, immagini, ecc.) fino a 50MB per file. Sulla destra, l'operatore può selezionare manualmente il workflow desiderato (es. DDT, Fattura, F24-730, Ingiunzione) se noto a priori. L'interfaccia è progettata per supportare contesti internazionali, offrendo la gestione multi-zona e multi-lingua.

Monitoraggio e Gestione dei Processi

La sezione 'Processes' offre una visione completa e dettagliata di tutti i documenti elaborati o in fase di elaborazione, garantendo la totale tracciabilità delle operazioni.

Figura 2: Lista dei documenti elaborati con filtri di ricerca e stato di avanzamento.

La tabella riepilogativa mostra per ogni documento il nome, il workflow associato, lo stato attuale (es. REVIEWED), la data di elaborazione e le azioni disponibili. Gli operatori possono utilizzare filtri avanzati per ricercare documenti specifici per nome, stato, tipologia di workflow o periodo temporale. È inoltre disponibile una funzione di esportazione per finalità di reportistica.

Validazione Dati e Approccio Human-in-the-Loop

Nonostante l'elevato grado di automazione, la piattaforma adotta un paradigma 'Human-in-the-Loop'. Questo significa che l'operatore umano mantiene sempre il controllo finale sulla qualità dei dati prima che questi vengano inviati ai sistemi aziendali.

Figura 3: Interfaccia di revisione split-screen con PDF originale e dati JSON estratti.

L'interfaccia di revisione presenta una comoda vista affiancata (split-screen). A sinistra viene visualizzato il documento originale (es. il PDF del DDT), mentre a destra sono presentati i dati estratti e strutturati in formato JSON. L'operatore può verificare visivamente la correttezza dell'estrazione (es. codici articolo, quantità, descrizioni), apportare eventuali correzioni manuali cliccando su 'Modifica' e, una volta validato il contenuto, cliccare su 'Marca come Revisionato'. Solo dopo questa approvazione i dati vengono sbloccati per l'integrazione con il gestionale.

Elaborazione Batch e Classificazione Automatica

Per gestire elevati volumi documentali in modo efficiente, la piattaforma è dotata di una potente funzione di Batch Processing arricchita da capacità di classificazione automatica basata su AI.

Figura 4: Batch Processing con suggerimento automatico del workflow e reasoning dell'AI.

Caricando multipli file contemporaneamente, il motore AI analizza il contenuto di ciascun documento e suggerisce automaticamente il workflow più appropriato (es. riconosce che un file è un Modello 730 e un altro è un DDT). Per garantire la massima trasparenza, il sistema fornisce una percentuale di confidenza (Confidence) e, soprattutto, un 'Reasoning' testuale: l'AI spiega esplicitamente quali elementi del documento l'hanno portata a quella classificazione (es. presenza di riferimenti normativi specifici o layout tipico). L'operatore può così approvare rapidamente le classificazioni corrette.

Gestione Flessibile dei Workflow

La vera forza della soluzione risiede nella sua estrema flessibilità. La sezione 'Workflow Management' permette agli amministratori di configurare e gestire flussi di lavoro personalizzati per qualsiasi tipologia di documento aziendale.

Figura 5: Pannello di gestione dei workflow configurati nel sistema.

Da questo pannello è possibile visualizzare tutti i workflow attivi (es. DDT, F24-730, Fattura, Ingiunzione, Mediazione), organizzarli in categorie logiche (es. RDA, SIAV) e attivarli o disattivarli tramite un semplice toggle. Questa architettura permette di scalare rapidamente la soluzione su nuovi casi d'uso aziendali senza necessità di sviluppi software aggiuntivi.

Configurazione della Maschera di Estrazione (JSON Schema)

La creazione di un nuovo workflow è un processo guidato e altamente personalizzabile, che non richiede competenze di programmazione avanzate ma si basa sulla definizione di una 'maschera di estrazione'.

Figura 6: Configurazione di un workflow con definizione del JSON Schema per l'estrazione dati.

In questa fase, l'utente definisce il 'JSON Schema for AI', ovvero la struttura esatta dei dati che l'Intelligenza Artificiale dovrà estrarre dal documento. Ad esempio, per un DDT, lo schema indicherà all'AI di cercare un array di 'ordini', ciascuno contenente 'righe' con campi specifici come 'quantita', 'descrizione', 'unitaMisura' e 'codiceArticolo'. È inoltre possibile fornire una descrizione testuale che aiuta l'AI a contestualizzare il documento, e definire i formati di file supportati e la priorità di elaborazione.

Conclusione

La soluzione BlueIT non si limita a digitalizzare un processo, ma introduce una vera e propria intelligenza operativa, liberando risorse umane da compiti ripetitivi per destinarle ad attività a maggior valore aggiunto.

Risultati significativi del progetto

Grazie a questo approccio strutturato e integrato, l’organizzazione ha conseguito benefici tangibili sia in termini operativi che strategici:

Automazione e Riduzione dei Costi

L'eliminazione del data entry manuale riduce drasticamente i tempi di elaborazione e i costi operativi associati.

Precisione e Qualità dei Dati

La comprensione semantica dell'AI minimizza gli errori umani, garantendo che i sistemi gestionali vengano alimentati con dati accurati e affidabili.

Adattabilità Universale

A differenza dei sistemi OCR tradizionali, la piattaforma non richiede la configurazione di template per ogni nuovo fornitore o formato di documento. L'AI si adatta dinamicamente alle variazioni di layout.

Scalabilità Immediata

Grazie alla configurazione tramite JSON Schema, estendere l'uso della piattaforma a nuove tipologie documentali (es. dai DDT ai contratti legali) è un'operazione rapida e gestibile direttamente dagli utenti di business.

Integrazione Trasparente

L'output strutturato e le API di integrazione permettono un caricamento fluido e automatico delle informazioni in qualsiasi sistema ERP o gestionale preesistente.

Contattaci

Porta la tua azienda al livello successivo

Siamo qui per rispondere a tutte le tue domande.

Trattamento dei dati.

Grazie! La tua richiesta è stata ricevuta!
Oops! Qualcosa è andato storto durante l'invio.
FAQ

Domande?

Scopri le ultime novità e tendenze

Quali sono i servizi di supporto on site che offrite?

Offriamo supporto on site personalizzato per aiutare le aziende a gestire e coordinare i loro progetti direttamente presso le loro sedi. Questo include assistenza nella pianificazione, monitoraggio delle attività, gestione delle risorse e risoluzione di eventuali problematiche operative.

In cosa consiste la vostra consulenza in ambito di project management?

La nostra consulenza in project management comprende l'analisi delle esigenze del cliente, la definizione di piani di progetto, la gestione delle tempistiche e dei budget, e il supporto nel coordinamento delle attività per garantire il successo del progetto.

Come posso usare l’AI senza rischiare sulla sicurezza dei miei dati?

Molte soluzioni AI non garantiscono protezione adeguata, ma esistono alternative pensate per le aziende, come IBM watsonx, che assicurano la privacy e la sicurezza dei dati offrendo le stesse potenzialità.

L’intelligenza artificiale è solo per le grandi aziende?

No, anche le PMI possono adottare soluzioni AI. Oggi, con gli strumenti giusti e il supporto adeguato, è possibile ottenere risultati concreti anche con investimenti contenuti. Serve solo partire con il percorso corretto.

Che cos’è CMS?

CMS, o Cognitive Managed Services, è il nostro approccio innovativo alla gestione dei contenuti digitali. Utilizziamo tecnologie avanzate per automatizzare i processi e migliorare l’efficienza. La nostra esperienza garantisce risultati ottimali per le infrastrutture IT.

Quali sono i vantaggi dei Cognitive Managed Services rispetto ai servizi gestiti tradizionali?

I nostri CMS integrano intelligenza artificiale e automazione avanzata per anticipare problemi, ottimizzare performance e ridurre i tempi di risoluzione. A differenza dei servizi gestiti tradizionali che sono principalmente reattivi, i nostri servizi sono proattivi e si evolvono continuamente grazie al machine learning applicato all'infrastruttura.

Vuoi rafforzare la sicurezza del perimetro esterno della tua azienda contro le minacce informatiche?

BlueIT ti offre una soluzione avanzata, ispirata a tecnologie di derivazione militare, progettata per proteggere efficacemente il perimetro esterno della tua infrastruttura IT. Una difesa solida, pensata per bloccare gli attacchi prima che possano compromettere i tuoi sistemi.

Vuoi proteggere in modo efficace tutti i dispositivi della tua azienda, fisici e virtuali?

BlueIT progetta soluzioni di sicurezza su misura, pensate per rispondere alle specifiche esigenze della tua infrastruttura. Che si tratti di endpoint fisici, macchine virtuali o ambienti ibridi, ti aiutiamo a garantire la massima protezione con un approccio personalizzato e scalabile.

Hai ancora domande?