Industrial Document Intelligence System

AI-støttet system som gjør komplekse tekniske PDF-er, diagrammer og visuelle planer om til strukturert data.

Problem

Mange bedrifter sitter på viktig informasjon i PDF-er, tekniske rapporter, tabeller, diagrammer og visuelle planer. Informasjonen kan være vanskelig å bruke videre fordi den ligger låst i dokumenter som egentlig er laget for mennesker, ikke databaser eller digitale arbeidsflyter.

I dette prosjektet var utfordringen å hente strukturert informasjon ut fra komplekse Gantt-lignende planleggingsdiagrammer i en industriell kontekst. Brukere måtte tidligere sammenligne dokumenter manuelt for å oppdage endringer i aktiviteter, datoer, farger, figurer, statusindikatorer og rader.

Løsning

Jeg utviklet en modulær Python-pipeline som kombinerte PDF-prosessering, layout-analyse, computer vision, fargedeteksjon, formgjenkjenning og regelbasert tolkning. Systemet gjorde visuelle planer om til strukturert data som kunne eksporteres til CSV, Excel, JSON eller SQL-klare formater.

OCR ble testet, men var ikke stabilt nok for denne dokumenttypen. Derfor ble den endelige løsningen bygget rundt mer kontrollerbare metoder: deterministisk PDF-ekstraksjon, bildebehandling, geometrisk analyse og tydelige valideringsregler.

Resultat

Systemet ble evaluert med manuell sammenligning, train/test-lignende validering og strenge korrekthetssjekker på omtrent 150 sider. Rapportert nøyaktighet var over 95%med en streng definisjon der hele raden måtte være riktig for å telle som korrekt.

Prosjektet viser hvordan ustrukturert, visuell og domenespesifikk informasjon kan gjøres om til praktisk, databaseklar data. For en bedrift kan dette redusere manuelt arbeid, gjøre sammenligning raskere og åpne for analyse på tvers av mange dokumenter.

Teknologi brukt

PythonComputer VisionDocument AIPDF ParsingOpenCVPyMuPDFpdfplumberpandasNumPyAutomationIndustrial AI