Problem
Medisinske AI-prosjekter krever mer enn modelltrening. Data må behandles forsiktig, valideringen må være riktig, og man må unngå datalekkasjer som gjør resultatene kunstig gode. Prosjektområdet handlet om å bygge ML-pipelines for komplekse og høy-stakes datasett.
Løsning
Jeg bygget flere pipelines for klassifisering og prediksjon knyttet til nevrodegenerative sykdommer. Arbeidet inkluderte kliniske og biomarkørbaserte data for klassifisering av Alzheimer, MCI og kontrollgruppe, samt EEG-basert klassifisering med signalprosessering.
Pipeline-arbeidet inkluderte label mapping, feature selection, manglende data-håndtering, subject-wise cross-validation, spektrale EEG-features, wavelet-features, Riemannian features, SVM/Random Forest-modeller, permutation testing og tolkning av feature importance.
Resultat
Klinisk-data-pipelinen oppnådde rundt 94% accuracy i valgt sluttoppsett. EEG-prosjektet oppnådde omtrent 0.66 macro F1 og balanced accuracy, og slo en PSD-baseline på omtrent 0.56.
Prosjektene presenteres ikke som kliniske produkter, men som bevis på evne til å bygge robuste ML-arbeidsflyter med riktig validering, feature engineering, leakage prevention og konservativ tolkning av resultater.