Formål
Prosjektet undersøkte hvordan språkmodeller kan brukes til å skille mellom subjektive og objektive setninger på tvers av språk. Dette er relevant for tekstklassifisering, innholdsanalyse, nyhetsanalyse og automatisert sortering av store tekstmengder.
Løsning
En encoder-only Transformer/BERT-basert modell ble finjustert for flerspråklig tekstklassifisering. Arbeidet inkluderte databehandling, trening, evaluering og sammenligning mot enklere baselines.
Resultat
Modellen forbedret resultatene betydelig sammenlignet med baseline og oppnådde omtrent81.5% balanced accuracy på et ubalansert datasett. Prosjektet viser praktisk erfaring med Transformer-baserte NLP-modeller og evaluering av klassifisering på ubalanserte data.