Natural Language Processing (NLP) er teknologi i skjæringspunktet mellom menneskelig språk og datamaskiner. Det bør helsesektoren utnytte til å effektivisere driften og forbedre pasientbehandlingen.
NLP-teknologi, eller språkprosessering, er en form for maskinlæring som har eksistert i flere tiår. Bruksområdene er mange, men i nyere tid finner vi eksempler som stavekontroll, søkemotorer og automatisk innlesing av dokumenter.
– Potensialet i NLP strekker seg derimot langt utover dette, og spesielt for helsesektoren. Likevel brukes teknologien i svært liten grad i dag, sier Severin Sjømark, Chief Data Scientist i Deepinsight.
Hele 90 prosent av data i journalsystemer er tekstdata. NLP-teknologi kan prosessere, hente ut og tolke fritekst i journaler. Om helsesektoren tar den bruk kan diagnostiseringen bistås med data, og bli mer treffsikker.
Store fordeler for hele helsesektoren med NLP
Det er ikke bare til beslutningsstøtte ved diagnostisering NLP gir en stor fordel. Også andre helsearbeidere som jobber mer administrativt kan ha stor nytte av NLP-teknologi.
Et godt eksempel er helsesekretærer som kan bruke store deler av arbeidsdagen på å kategorisere pasienter og hendelser til nødvendige driftsrapporter. Denne prosessen kan automatiseres med NLP og spare mye tid for landets helseforetak.
– NLP er også en viktig del av anonymiseringen av helsedata for å lage datasett til forskning og utviklingen av beslutningsstøtteverktøy. Det blir gjort ved at NLP-teknologien identifiserer hvilke personidentifiserbare data som må anonymiseres før videre bruk, forklarer Hanna Zdanowicz, data scientist i Deepinsight.
NLP-modellene må tilpasses klinisk språk
NLP-teknologi består av en rekke datamodeller, med ulike formål, som jobber for å prosessere og tolke tekstdata. Modellene er basert på kjente matematiske modeller, og trenes ved hjelp av maskinlæringsteknikker til å representere menneskelig språk på måter som kan gi ny innsikt.
Selv om fordelene er enorme, er bruken av NLP-teknologi i norsk helsesektor dessverre ikke like utbredt som mulighetene tilsier.
Det finnes ingen universal NLP-modell som kan hente ut fritekst fra alle verdens helsesystemer uten tilpasning. Mye av arbeidet Deepinsight gjør under utviklingen av helseverktøy er derfor å sette sammen eksisterende modeller og verktøy med egenutviklede.
– En utfordring er at NLP-modeller er språkavhengige. Språkprosessering har definitivt kommet lengre på større språk som engelsk, enn det har på norsk. Det gjør at vi må bruke mer tid på å utvikle egne modeller. Heldigvis kan vi hente inspirasjon fra hva som er blitt gjort i andre land, sier Sjømark.
– Vi utforsker fortsatt mulighetene med NLP i helseverktøy. Vi kartlegger hvilke behov helsesektoren har, og hvilke datamodeller og programvarer som allerede er utviklet, forklarer Zdanowicz.
Så langt viser kartleggingen at det er utrolig mange muligheter med NLP for helsesektoren. Noe som derimot viser seg å være en større utfordring enn først antatt er det avanserte språket helsepersonellet bruker i journalføringen.
– Leger bruker mange forkortelser og medisinsk språk som er så langt fra dagligtale at det trengs egne NLP-modeller tilpasset klinisk norsk. Det er tidskrevende arbeid, men Deepinsight har både kompetansen og ressursene til å få det til, forklarer Sjømark.
Mye vil skje innen NLP de neste årene
Innen få år vil vi trolig se mer NLP-teknologi i alle sektorer. På grunn av strenge sikkerhetskrav, utfordringer med klinisk språk og trange budsjetter henger helsesektoren naturlig nok litt etter andre sektorer når det gjelder å ta i bruk NLP-teknologi.
– Min spådom er at vi vil se stor fremgang innen NLP med både norske, og klinisk norske datamodeller de neste årene, sier Sjømark.
– Det finnes så mye gull å hente fra NLP-teknologi. Tas det i bruk vil helsesektoren både legge til rette for bedre pasientbehandling og helsedrift, avslutter Zdonowicz.