Multilingual Text Classification with BERT

Transformer-basert NLP-modell for flerspråklig klassifisering av subjektive og objektive setninger.

Formål

Prosjektet undersøkte hvordan språkmodeller kan brukes til å skille mellom subjektive og objektive setninger på tvers av språk. Dette er relevant for tekstklassifisering, innholdsanalyse, nyhetsanalyse og automatisert sortering av store tekstmengder.

Løsning

En encoder-only Transformer/BERT-basert modell ble finjustert for flerspråklig tekstklassifisering. Arbeidet inkluderte databehandling, trening, evaluering og sammenligning mot enklere baselines.

Resultat

Modellen forbedret resultatene betydelig sammenlignet med baseline og oppnådde omtrent81.5% balanced accuracy på et ubalansert datasett. Prosjektet viser praktisk erfaring med Transformer-baserte NLP-modeller og evaluering av klassifisering på ubalanserte data.

Teknologi brukt

NLPBERTTransformersHuggingFacePythonModel Evaluation