Teplárenská společnost z malého města v Polsku uchovávala data o své síti v papírové dokumentaci v archivech po mnoho let. Data byla poměrně strukturovaná, ale… Dokážete si představit, že hledáte jednu konkrétní informaci v místnosti plné stovek papírů uložených na nekonečných regálech? Je to těžký, časově náročný a frustrující úkol. Data byla často neúplná, protože aktualizace je obtížný úkol. Dalším problémem byla skutečnost, že noví zaměstnanci často neměli znalosti o celé síti a starší a zkušenější odcházeli do důchodu či měnili zaměstnání. Všechny tyto faktory negativně ovlivňovali mnoho procesů ve firmě.
Aby se umožnil snadný přístup k informacím o síti, rozhodla se společnost, že všechny dokumenty budou naskenovány. Výsledkem tohoto procesu byla digitální verze dokumentace s daty rozdělenými do oblastí (podle polic, analogicky jak byly uloženy). Ukázalo se, že proces vyhledávání byl stále velmi dlouhý a údaje zůstaly neúplné nebo zastaralé. V dokumentaci stále chyběly podrobné informace potřebné k nalezení dokumentu o konkrétní částí sítě, oblasti či období. Zrychlení procesu nebylo tak velké, jak se předpokládalo.
Navíc chtěla společnost využít síťová data v různých podnikových aplikacích, ale kvůli stále nestrukturovaným informacím byly náklady na takové projekty mimo její dosah. Dokumenty musely být podrobně členěny – předchozí specifikace nebyla dostatečná, což také zvýšilo náklady. Pro zaměstnance znamená kategorizace a popis každého dokumentu stovky hodin nudné práce, která často koliduje s jinými důležitými úkoly. Aby byla síť správně a spolehlivě popsána, je potřeba mnoho pozornosti a rozsáhlá znalost sítě.
Zní Vám to povědomě?
Jedná se o každodenní situace v mnoha firmách, a to nejen v oblasti dálkového vytápění. Naše nejnovější experimenty a práce v projektu GlobIQ ukazují, že tyto problémy mohou být vyřešeny s využitím umělé inteligence.
Platforma GlobIQ je navržena ke shromažďování dat na technických rozptýlených objektech přirozeným způsobem – založeným na komunikaci pomocí hlasu a obrazu. To umožňuje konverzi shromážděných informací do strukturované podoby, ve které mohou být data zpracována v konkrétních podnikových aplikacích. Plánujeme vytvořit specializovaná řešení pro energetické, telekomunikační a komunální služby.
Zlepšením kvality dat, rozpoznáním textu (také z ručního psaní) a analýzou obsahu může umělá inteligence automaticky kategorizovat a provádět indexace dokumentů. Může nahradit monotónní a opakující se práci jako je manuální analýza a kategorizace, a vede k výraznému zrychlení práce a nižším nákladům.
Jak jsme to udělali?
Pracovali jsme na souboru 6 200 dokumentů, které obsahovaly více než 24 000 stránek formátu A4 (převážně technické a subdodavatelské projekty, náčrty). Skenované dokumenty musely být správně připraveny – rozdělili jsme je na jednotlivé stránky a zlepšili jejich kvalitu při testování různých možností. Pro lepší rozpoznání struktury a analýzu obsahu bylo použito několik řešení. Učící soubor zahrnoval 470 dokumentů.
Co jsme objevili?
Více než 90 % dokumentů bylo správně rozpoznáno a kategorizováno – pouze 10 % zůstalo k manuální práci. Pro vypočtení počtu správně kategorizovaných dokumentů jsme porovnali správné předpovědi s celkovým počtem dokumentů. Většina práce byla provedena za zaměstnance s menším úsilím za mnohem méně času.
Výhody
S využitím technologie GlobIQ by mohla naše teplárenská společnost rychle organizovat a shromažďovat veškeré informace a vytvořit komplexní a aktuální databázi síťové infrastruktury. Podrobná dokumentace zkracuje proces vyhledávání potřebných informací. GlobIQ umožňuje přístup k datům více uživatelům a v případě potřeby možnost jejich aktualizace.
Co dál?
V současné době pracujeme na dalších aspektech, které může GlobIQ zlepšit. Náš výzkum je zaměřen na následující otázky:
- čtení technických parametrů z dokumentace a jejich prostorové indexování: firmy potřebují velmi detailní data, chronologicky seřazena a kategorizována podle platnosti dokumentů
- zadávaní dat z tabulky souřadnic: kvůli různé kvalitě kopií je proces velmi časově náročný
- budování síťového modelu založeného na datech z papírových zdrojů – jeden náčrt může obsahovat mnoho informací a často neodráží skutečný výskyt v mapě.
Budeme Vás i nadále informovat o našem pokroku ve vývoji platformy GlobIQ. Zůstaňte naladěni!