Medical AI and Signal-Based Classification

End-to-end ML-pipelines for kliniske data og EEG-signaler med fokus på validering, leakage prevention og robust evaluering.

Problem

Medisinske AI-prosjekter krever mer enn modelltrening. Data må behandles forsiktig, valideringen må være riktig, og man må unngå datalekkasjer som gjør resultatene kunstig gode. Prosjektområdet handlet om å bygge ML-pipelines for komplekse og høy-stakes datasett.

Løsning

Jeg bygget flere pipelines for klassifisering og prediksjon knyttet til nevrodegenerative sykdommer. Arbeidet inkluderte kliniske og biomarkørbaserte data for klassifisering av Alzheimer, MCI og kontrollgruppe, samt EEG-basert klassifisering med signalprosessering.

Pipeline-arbeidet inkluderte label mapping, feature selection, manglende data-håndtering, subject-wise cross-validation, spektrale EEG-features, wavelet-features, Riemannian features, SVM/Random Forest-modeller, permutation testing og tolkning av feature importance.

Resultat

Klinisk-data-pipelinen oppnådde rundt 94% accuracy i valgt sluttoppsett. EEG-prosjektet oppnådde omtrent 0.66 macro F1 og balanced accuracy, og slo en PSD-baseline på omtrent 0.56.

Prosjektene presenteres ikke som kliniske produkter, men som bevis på evne til å bygge robuste ML-arbeidsflyter med riktig validering, feature engineering, leakage prevention og konservativ tolkning av resultater.

Teknologi brukt

Machine LearningMedical AIEEGSignal Processingscikit-learnMNE-PythonpyriemannSVMRandom ForestValidationPython