Estrazione di dati da documenti con controlli automatici
Con la piattaforma Station puoi estrarre dati in modo automatico da qualsiasi tipo di documento, automatizzando verifiche e confronti con dati presenti in altri applicativi.

Estrai dati da qualsiasi tipo di documento con Station
La piattaforma di RPA Station è in grado di eseguire automaticamente operazioni e processi di back office ripetitivi, interagendo con i documenti e gli applicativi aziendali come farebbe l’utente:
- Estrae informazioni da qualsiasi tipo di documento sfruttando diversi strumenti (motore di mappatura, OCR, dizionari precaricati, script…)
- Effettua verifiche e controlli sui dati estratti, anche confrontandoli con i dati presenti in altri applicativi aziendali
- Può trasformare l’output in qualsiasi formato necessario, sia esso XML, EDI, txt o un foglio di calcolo.
- Si interfaccia con qualsiasi sistema informativo per rendere automatico il data entry delle informazioni estratte
Grazie a Station puoi estrarre dati da PDF in modo automatico.
Il tipo di PDF più semplice da gestire è quello vettoriale, che contiene testo selezionabile e ricercabile: da questi documenti nativamente digitali Station ricava direttamente e senza difficoltà il testo.
Nel caso invece di documenti cartacei, puoi effettuare una scansione in PDF e grazie alla funzionalità OCR (Optical Character Recognition – Riconoscimento ottico dei caratteri), Station trasforma l’immagine del documento in un formato in cui il testo diventa riconoscibile ed utilizzabile per l’estrazione dei dati, come con i PDF nativi.
Per estrarre le informazioni dai PDF la piattaforma sfrutta un potente “motore di mappatura” che consente di definire delle regole (statiche o dinamiche) per la ricerca e l’estrazione dei dati dai documenti.
Dopo l’estrazione dei dati, Station può effettuare verifiche e confronti aggiuntivi tra i dati estratti e quelli presenti in altri applicativi (ad es. riscontro automatico tra dati fattura di acquisto e ordini o DDT), per poi procedere al caricamento automatico nei software aziendali o alla rielaborazione delle informazioni per creare un documento in un nuovo formato (ad es. creazione di un file XML per la fatturazione elettronica a partire dalla fattura PDF)
La piattaforma di RPA Station è in grado di lavorare con i file EDI, in codifica oppure in decodifica:
- può estrarre dati da diversi tipi di standard EDI per l’inserimento automatizzato delle informazioni nel sistema informativo o per creare un nuovo tipo di documento con le informazioni dell’EDI.
- può trasformare le informazioni presenti negli applicativi aziendali nel formato EDI (EURITMO, EDIFACT, ODETTE, ecc.) richiesto dal proprio partner commerciale
- effettua conversioni da uno standard all’altro (ad es. da ODETTE ad EURITMO), funzionalità spesso necessaria in quelle aziende in cui è stato adottato uno standard interno diverso da quello utilizzato da alcuni dei propri business partner.
Per l’estrazione dei dati dai messaggi EDI, la piattaforma Station sfrutta dei dizionari precaricati, contenenti le definizioni dei principali messaggi nei vari standard EDI.
L’XML (eXtensible Markup Language) è un linguaggio molto diffuso per l’interscambio di dati strutturati tra diverse applicazioni.
La piattaforma Station è in grado di leggere qualsiasi tipo di file XML, estrarre i dati ed effettuare delle successive elaborazioni, ad esempio:
- caricare in modo automatico i dati estratti dal file XML all’interno di applicativi aziendali (gestionale, ERP o qualsiasi altro applicativo)
- utilizzare i dati estratti per costruire un documento in un altro formato (ad es. txt, csv, Excel ecc.), per renderlo leggibile o elaborabile da altri applicativi.
Per l’estrazione dei dati dai file XML, la piattaforma Station utilizza degli script e ti mette a disposizione delle classi specifiche, che semplificano la lettura ed estrazione dei dati dal file XML.
Con Station puoi estrarre i dati dalle fatture di acquisto elettroniche per procedere alla registrazione automatica nel tuo gestionale/ERP:
- Riconosce ed estrae i dati dal file XML della fattura elettronica
- Effettua un riscontro fattura automatico, eseguendo i necessari confronti e controlli di quantità e prezzi con i carichi magazzino, gli ordini fornitore e le bolle/DDT.
- Notifica all’utente corretto eventuali discrepanze e semplifica la gestione del problema identificato
- Carica i dati nel sistema informativo, integrandosi senza la necessità di intervento da parte dell’utente
Con la piattaforma Station puoi elaborare documenti in qualsiasi formato per estrarre le informazioni in essi contenute ed inserirle nel sistema informativo senza interventi manuali o per convertire il documento in un nuovo formato (ad es. da PDF ad XML, da PDF a foglio di calcolo ecc.).
Oltre ai tradizionali file PDF, Station è in grado di elaborare anche file non “human-readable” come gli XML (compreso il formato specifico per la fatturazione elettronica) ed i messaggi EDI.
Può inoltre elaborare qualsiasi tipo di file di testo: txt, xls (fogli di calcolo), csv, rtf, ecc.
Come fa Station ad estrarre i dati da documenti e file?
Station è in grado di estrarre le informazioni da qualsiasi tipo di documento sfruttando diversi strumenti:
Per estrarre i dati da alcune tipologie di documenti, come PDF, TXT o CSV, Station ti mette a disposizione un potente motore di mappatura, che in fase di configurazione permette di delineare regole per l’estrapolazione dei dati, sia statiche che dinamiche, a partire da un file scelto come modello.
Se, ad esempio, vuoi estrarre i dati da un ordine o una fattura in PDF, a monte utilizzerai un tool di mappatura visuale apposito per i PDF.
Grazie a questo tool, per ogni template di documento di un fornitore/cliente, puoi mappare i punti in cui si trovano le diverse informazioni, definire quale è il tipo di dato presente (ad es. numero intero, data ecc.) e come dovrà essere rielaborato per l’import negli applicativi aziendali.
Nel caso l’azienda riceva documentazione cartacea e/o sotto forma di scansione, la funzionalità OCR di Station trasforma l’immagine del documento in un formato in cui il testo sia riconoscibile ed utilizzabile dalla piattaforma per l’estrazione dei dati e l’inserimento nel sistema informativo o altre elaborazioni.
Per un risultato ottimale, una scansione ad alta definizione permette di ottenere il miglior riconoscimento possibile.
Station è in grado di valutare l’attendibilità del riconoscimento effettuato, carattere per carattere. Terminata la fase di riconoscimento dei caratteri e l’estrazione puoi prevedere una fase di validazione del dato: ad esempio puoi verificare se uno specifico dato estratto è presente nel gestionale (ad es. se un codice articolo presente nel documento esiste effettivamente nel sistema informativo) o chiedere all’utente di validare il dato estratto.
Una volta elaborato il documento ed effettuata l’estrazione dei dati, il documento viene ridotto per l’inserimento nel sistema di gestione documentale dell’azienda, che potrà essere integrato facilmente con Station.
Grazie alla funzionalità di riconoscimento intelligente, Station è in grado di effettuare un’auto-mappatura dei documenti, identificando in piena autonomia le informazioni contenute nella testata e nel piede.
Questo potente strumento può essere applicato sia a documenti vettoriali, che a documenti cartacei acquisiti tramite scanner e trasformati in documenti elaborabili dalla funzionalità OCR.
Per effettuare l’auto-mappatura del documento, Station ricerca determinate “etichette” (definite all’interno di un dizionario alimentabile dall’utente, ad esempio “data”, “data fattura”, “fattura del…”) riconducibili ad uno specifico campo (ad esempio la data del documento), in modo da localizzare il punto in cui si trova un determinato dato e di capire in autonomia di cosa si tratta per poi estrarlo.
Il sistema prevede una fase iniziale di apprendimento, in cui Station analizza un numero di documenti definiti dall’utente e propone un form di validazione delle informazioni estratte. Nel caso di risultati dubbi, l’utente può specificare di cosa si tratta o aggiungere i dati mancanti, permettendo al software di affinare la propria capacità di corretta identificazione dei campi.
Puoi inoltre definire delle regole all’interno del dizionario, per permette al software di localizzare con maggior facilità il campo (un esempio di regola: nel 70% dei casi il campo si trova alla destra dell’etichetta).
Una volta terminata la fase di auto-apprendimento il sistema è in grado di proseguire in totale autonomia.
Per estrarre i dati da alcuni tipi di file, come quelli in formato EDI, Station sfrutta dei dizionari precaricati, che contengono le definizioni dei principali messaggi nei vari standard.
In fase di configurazione basterà definire quale standard applicare nella lettura del file ed il tool visuale di mappatura mostrerà quali tipologie di informazioni sono state identificate automaticamente all’interno del messaggio.
In questo modo si semplifica notevolmente la fase di configurazione iniziale per l’estrazione delle informazioni.