AUTOMATICKÉ ZPRACOVÁNÍ DOKUMENTŮ

Produkt Aidocu používá kombinaci umělé inteligence a crowdsourcingu. Systém je realizován jako cloudová služba. Výsledek automatického vytěžení je kontrolován vyškolenými operátory, na výstupu služby tak garantujeme přesnost vytěžení informace 99 %. Vytěžování elektronických dokumentů je založeno na algoritmu, který se postupně učí a zdokonaluje výsledky vytěžování dokumentů. Celý proces učení probíhá na pozadí a uživatel do něj nemusí zasahovat.

  • Garance kvality – Eliminace ručního přepisování dokumentů, které vede k chybám, záruka přesnosti vytěžení 99 %, poskytnutí logu podezřelých údajů – může poukazovat na chybně vystavené faktury.
  • Úspora nákladů- Přínos vyšší produktivity při zpracování dokumentů, eliminace času tráveného repetitivními činnostmi a tím zvýšení pracovní kapacity pro získání nových zákazníků a podporu růstu firmy.
  • Snadná integrace - Podpora produktů třetích stran (např. účetní SW), podpora různých typů vytěžovaných dokumentů a jejich formátů, libovolné formáty výstupů podle přání zákazníka.
  • Umělá inteligence - Systém je založen na algoritmu, který se postupně učí a zdokonaluje výsledky vytěžování dokumentů. UI automaticky vytěží potřebná data. Celý algoritmus pracuje na pozadí a uživatel do něj nemusí zasahovat.

Vstup dokumentů do Aidocu

Na vstupu jsou sbírány různé typy dokumentů v elektronické podobě. Dokumenty se pošlou na určenou email adresu anebo se nahrají do uložiště (např. cloud Google Drive). Přijaté dokumenty se automaticky stahují a zařazují se do fronty ke klasifikaci a OCR zpracování. Dokumenty mohou mít různou strukturu a podle ní se orientují nástroje pro rozpoznávání, vytěžení údajů a zpracování konkrétních typů dokumentů.

 


Typy vstupních dokumentů

Zpracováváme různé dokumenty od účetních až po ty z průmyslové výroby:

  • Faktury
  • Účtenky
  • Atesty
  • Dokumenty výroby, logistiky
  • apod.

 


Formáty vstupních dokumentů

Téměř jakékoliv typy dokumentů v elektronické podobě.  Může jít o:

  • PDFPDF s textovou vrstvou
  • naskenovaný nebo vyfocený dokument v jakémkoliv obrazovém formátu (jpg, bmp, png,…)

 


Postup zpracování dokumentu

Systém automaticky rozpozná typ a formát vstupního dokumentu, identifikuje klíčové údaje v dokumentu, které pak přečte pomocí vysoce kvalitního OCR enginu, informace se pak uživateli vracejí ve strukturované formě (např. .xml nebo .json). Výstup procesu vytěžení je před odesláním do zákaznické aplikace validován vyškolenými operátory, systém také generuje přehledy podezřelých dokumentů, možných chyb a anomálií.

BDU_system

 


Výstupní formáty

Výstupem systému jsou vytěžená data v libovolné strukturované podobě (XML, JSON,…) a takto mohou být automaticky připravena pro práci v různých SW. Výstup může být také zapisován rovnou do nějakého informačního systému (online), pokud umožňuje vzdálený přístup.  Aidocu má v základu integrované formáty pro běžné účetní SW jako jsou Pohoda, Helios,  DUEL a STEREO.

 


Přehledy podezřelých dokumentů, možných chyb a anomálií

Po zpracování obsahu dokumentů pomocí OCR, lze provádět uživatelem definované kontroly vytěžených informací. Podezřelé dokumenty jsou dány do seznamu a poskytnuty uživateli pro další kontrolu. Aidocu může kontrolovat např.:

  • datumy (DUZP, datum splatnosti, datum vystavení)
  • finanční částky (fakturovaná částka)

 

document-understanding-anomaly

 


Ukázka vytěžení faktury do strukturované formy ve formátu JSON

  

 


Ukázka detekovaného a přečteného textu na účtence

                                   

Sdílejte tuto stránku

FacebookTwitterVimeoShare to Stumble UponMore...