Ako technicky funguje umelá inteligencia v pozadí dnešných podnikových aplikácií? Andrej Gono, generálny riaditeľ spoločnosti Citymind

Ako funguje umelá inteligencia v podnikových aplikáciách: spracovanie faktúr, overovanie údajov a obmedzenia LLM | GRiT

Hlavná fotografia k tomuto článku.

Umelá inteligencia patrí v poslednej dobe medzi najčastejšie spomínané témy. Na trhu sa rýchlo objavujú nové nástroje umelej inteligencie a zároveň sa začínajú integrovať priamo do podnikových systémov, ktoré spracúvajú rôzne administratívne dokumenty alebo iné interné údaje – vrátane riešenia iNVOiCE FLOW, ktoré novinkou využíva vylepšený modul umelej inteligencie Aurora. O tom, ako tieto aplikácie skutočne fungujú vo vnútri a čo všetko sa musí stať ešte predtým, než sa výsledok dostane k používateľovi, sa však hovorí podstatne menej.

Andrej Gono, zakladateľ startupu Citymind, odborník na umelú inteligenciu a doktorand Mendelovej univerzity v Brne, vo svojej práci spája vývoj AI, akademický výskum a praktické nasadenie umelej inteligencie vo firmách. Vďaka tomuto prepojeniu dokáže veľmi presne opísať, ako sú dnešné systémy umelej inteligencie navrhnuté, kde majú zmysel a kde naopak narážajú na svoje limity.

Ako funguje umelá inteligencia v aplikáciách typu Aurora na pozadí?

Klasické veľké jazykové modely boli trénované primárne na súvislých textoch. To znamená, že dobre rozumejú významu viet a odsekov, ale administratívne dokumenty takto štruktúrované nie sú. Faktúry alebo objednávky majú kľúčové informácie roztrúsené po celej stránke – v tabuľkách, hlavičkách, pätičkách alebo poznámkach.

Na pozadí aplikácií typu Aurora preto nebeží všeobecný LLM, ale špecializovaný model označovaný ako Transactional Large Language Model, skrátene T‑LLM. Ten je optimalizovaný práve pre prácu s polostruktúrovanými dokumentmi. AI v tomto prípade nielen číta jednotlivé údaje, ale chápe ich význam v kontexte celého dokumentu – napríklad porovnáva položky s objednávkami alebo kontroluje, či súčty dávajú zmysel.

Zásadné je tiež to, že na dokument nepozerá len ako na text. Vníma ho ako obraz. Rozpoznáva rozloženie stránky, čiary, tabuľky, grafické prvky alebo logá. Práve táto kombinácia vizuálneho a textového pohľadu umožňuje dokument skutočne pochopiť.

Kľúčovým prvkom je tzv. diskriminačný dekodér. To znamená, že model nemôže generovať žiadny nový text, ale iba vyberá a interpretuje údaje, ktoré sú v dokumente skutočne obsiahnuté. Vďaka tomu si systém nemôže „vymyslieť“ žiadne údaje, čo je pre podnikové prostredie absolútne zásadné.

Čo sa musí diať „za kulisami“, než sa AI dostane do užívateľskej vrstvy?

Ešte skôr, než sa k slovu dostane samotný model, prebieha rad krokov, ktoré sú kľúčové pre kvalitu výsledku. Dokumenty prichádzajú z veľmi rôznorodých zdrojov – od e-mailov, cez API, zdieľané zložky, EDI brány až po fyzické skenery. Každý z týchto kanálov má iné vlastnosti a iné riziká chýb.

Prvým úlohou je preto normalizácia. Všetky vstupy je potrebné previesť do jednotného formátu, s ktorým môžu pracovať ďalšie komponenty systému. Súčasťou tohto kroku je detekcia a extrakcia obsahu, konverzia formátov aj kontrola kvality vstupu – napríklad či dokument nie je príliš tmavý alebo svetlý, rozmazaný, v nedostatočnom rozlíšení alebo s chýbajúcimi stranami.

V prípade správ EDI je navyše potrebné zjednotiť rôzne štruktúrované formáty, ako sú XML, JSON alebo EDIFACT, aby vznikla konzistentná dátová základňa.

Následne prichádza na rad počítačové videnie. Dokumenty nie sú vždy v textovej podobe, takže AI musí najprv „prečítať“ obrazový obsah. Používajú sa neurónové siete, ktoré prevádzajú skeny alebo obrázky na text, ale zároveň analyzujú vizuálne prvky – polohu polí, hranice tabuliek alebo vzťahy medzi jednotlivými časťami dokumentu.

Rozpoznaný text sa potom prevádza do podoby, ktorej neurónová sieť rozumie. Prebieha tokenizácia, teda rozdelenie textu na menšie jednotky, a inferenčný proces, počas ktorého T‑LLM nielen extrahuje dáta, ale chápe aj ich vzájomné vzťahy. Model sa zároveň priebežne prispôsobuje konkrétnym firemným dátam, a to bez nutnosti pevne definovaných šablón.

Pred odovzdaním do užívateľskej vrstvy sa údaje overujú. Každé extrahované pole dostáva skóre istoty, ktoré určuje, či je potrebná ľudská kontrola. Informácie sa ďalej prispôsobujú formátom cieľových systémov, typicky ERP (Enterprise Resource Planning), a cez API (Application Programming Interface) sa validujú napríklad voči objednávkam.

Súčasťou backendu sú aj mechanizmy priebežného zlepšovania. Ak používateľ vykoná opravu, systém sa z nej učí a túto znalosť využije pri ďalších dokumentoch. V kontexte iNVOiCE FLOW to znamená, že umelá inteligencia nielen ťaží z dát, ale pripravuje ich pre plynulý a spoľahlivý tok do účtovných systémov.

Ako funguje proces, ktorý umožňuje dokumenty prečítať, pochopiť, zaradiť a odoslať ďalej?

Celý proces začína načítaním dokumentu pomocou OCR (Optical Character Recognition). Systém extrahuje text z PDF, skenov alebo štruktúrovaných formátov a identifikuje kľúčové polia, ako je dodávateľ, suma alebo dátum.

Následne vstupuje do hry T‑LLM a nástroje z oblasti NLP. Model chápe vzťahy medzi jednotlivými údajmi – napríklad či suma zodpovedá položkám, či nejde o duplicitnú faktúru alebo o neštandardnú situáciu. Dokumenty sú klasifikované podľa typu a smerované do správnych front.

Na základe pravidiel, napríklad podľa dodávateľa alebo výšky sumy, sa údaje transformujú do formátu požadovaného ERP. Po validácii sa odovzdávajú do workflow – v prípade iNVOiCE FLOW to znamená automatické schvaľovanie, generovanie upozornení na nezrovnalosti alebo priamy import do účtovného systému.

Ako sa tento typ technológie premieta do firemných workflow a kde vidíte jej hlavný prínos?

Hlavným prínosom je nahradenie manuálnych krokov automatizovanými a adaptívnymi procesmi. Workflow v iNVOiCE FLOW začína prijatím dokumentu, pokračuje extrakciou a validáciou pomocou umelej inteligencie, nadväzuje na schvaľovací tok a končí importom do ERP a archiváciou.

Vďaka tomu môže jedna osoba dohliadať na objemy, ktoré by predtým vyžadovali celý tím. Nie preto, že by umelá inteligencia rozhodovala namiesto nej, ale preto, že odstránila rutinnú a opakujúcu sa prácu a nechala človeku priestor na riešenie výnimiek a kontrolu.

V rámci spolupráce s GRiTom pracujete aj na vývoji ich AI asistenta. Ako je tento asistent navrhnutý a ako bude fungovať v praxi?

Technicky je riešenie postavené na architektúre nazývanej RAG – Retrieval‑Augmented Generation. Umelá inteligencia od Citymindu nie je trénovaná na dátach z celého internetu a je prísne obmedzená na informácie konkrétnej organizácie, napríklad GRiT.

Systém najprv prejde webové stránky, PDF dokumenty alebo interné materiály a rozdelí ich na menšie logické úseky. Každú z nich prevedie do vektorovej podoby, ktorá reprezentuje jej význam. Pri dotaze systém najprv vyhľadá najrelevantnejšie časti dát a až tie pošle jazykovému modelu s inštrukciou, aby z nich odpovedal.

Vďaka tomuto prístupu sú odpovede vždy podložené konkrétnymi zdrojmi a spätne dohľadateľné. Pre GRiT bol navyše implementovaný mechanizmus, pri ktorom asistent na základe zadaného IČO rozpozná konkrétnu firmu a zasadí odpoveď do jej kontextu – napríklad vysvetlí, ako jej môže GRiT pomôcť s rýchlejším tokom dát v rámci dodávateľského reťazca.

V GRiT vnímame umelú inteligenciu ako nástroj, ktorý má pomáhať firmám zvládnuť prácu s dátami v každodennom prevádzke – od dokumentov cez objednávky až po prepojenie celých procesov. Zaujíma nás, ako technológie urýchľujú tok dát, kde prinášajú väčšiu presnosť a kde naopak musí zostať priestor pre ľudskú kontrolu a rozhodovanie. Ak vás téma automatizácie a toku dát zaujala aj z pohľadu vašej firmy, ozvite sa nám.

Riešite schvaľovanie faktúr?

30 minút, žiadny záväzok. Ukážeme vám, ako iNVOiCE FLOW zapadne do vášho ERP.

Mohlo by vás zaujímať

Menšie nástroje na digitalizáciu faktúr sú lacnejšie. Nie vždy však pokryjú to, čo skutočne potrebujete

Ako vybrať riešenie na digitalizáciu faktúr? Nie je postačujúce len získavanie údajov. Dôležitý je celý tok dokumentov a prístup dodávateľa k bezpečnosti | GRiT

Ochrana údajov ako priorita. Prečo si firmy vyberajú GRiT ako spoľahlivého partnera?

Ako GRiT zabezpečuje bezpečnosť údajov zákazníkov? Cloud, šifrovanie, zálohovanie a súlad s GDPR | GRiT

Parfuméria Douglas: 99 % dokladov automaticky a výrazne menej faktúr po splatnosti

Ako spoločnosť Douglas automatizovala spracovanie faktúr a výrazne znížila počet faktúr po splatnosti | GRiT