Maskinlæring i Mammografiprogrammet (MIM)

- Et forskningsprosjekt med målsetting om å effektivisere og øke kvaliteten på Mammografiprogrammet ved å kombinere automatisk bildeanalyse med radiologisk ekspertise.
Sist oppdatert: 21.12.2020

Bakgrunn

Brystkreft er den krefttypen som rammer flest kvinner i Norge og i verden. Selv om enkelte risikofaktorer for sykdommen er kjent for grupper av kvinner, er sykdommen vanskelig å forebygge for den enkelte. Tidlig deteksjon gjennom screening er derfor ansett som et effektivt verktøy for å redusere dødeligheten av sykdommen.

En standard screeningundersøkelse i Mammografiprogrammet består av bilder fra to vinkler av hvert bryst. Tyding av bildene utføres uavhengig av to røntgenleger som har spesialutdanning innen brystradiologi. Hver røntgenlege gir en score fra 1 til 5, som indikerer mistanke om malignitet. 1 betyr negativt, 2 sannsynlig negativ, 3 usikker, 4 sannsynlig malign og 5 høy sannsynlighet for malignitet.

Alle tilfeller hvor en eller begge røntgenlegene har gitt en tydescore 2 eller høyere på ett eller begge bryst, blir diskutert på et konsensusmøte hvor det blir besluttet om kvinnen skal kalles inn for tilleggsundersøkelser eller ikke. Om lag 7% av screeningundersøkelsene diskuteres på et slikt konsensusmøte, og om lag halvparten av disse resulterer i en innkalling til etterundersøkelse.

Dette betyr at røntgenlegene som jobber i Mammografiprogrammet bruker betydelig tid på å tyde screeningbilder fra kvinner med normale screeningmammogrammer, det vil si der det ikke vises tegn til brystkreft.

Med nye framskritt innen maskinlæring er det et potensiale for å forbedre dagens screeningprogram for brystkreft blant annet ved at røntgenlegene kan bruke mer tid på kvinnene som blir innkalt til tilleggsundersøkelse og de som har kliniske symptomer på brystkreft.

Hensikt

Prosjektets hovedmålsetting er å utvikle en metode som kan brukes til å tyde screeningmammogrammer, hvor automatisk bildeanalyse kombineres med radiologisk ekspertise.

Ideen er å utvikle en algoritme som bruker kunstig intelligens (deep learning) for å lære å gjenkjenne komplekse mønstre og ta selvstendige beslutninger. Ved å kombinere mammogrammer, tilhørende screeninginformasjon og eventuelle brystkreftdiagnoser, skal algoritmen lære å gjenkjenne mønstre i mammogrammene som kan indikere brystkreft. På denne måten kan metoden brukes til å utvikle automatiske systemer som kan plukke ut screeningmammogrammer som med høy sannsynlighet ikke viser tegn til brystkreft.

Målet er å kunne selektere 70% av alle screeningundersøkelsene som negative ved hjelp av automatisk bildeanalyse. De resterende 30% vil måtte tydes på vanlig måte, med to radiologer. Dette vil kunne frigjøre radiologressurser slik at radiologene kan bruke mer tid på kvinner med mistanke om brystkreft.

Prosjektet gir også muligheter for å utvikle en algoritme som kan hjelpe radiografene som utfører screeningundersøkelsene med å vurdere bildekvalitet, utføre teknisk kvalitetskontroll, og gjøre systematiske analyser for å identifisere forandringer i brystet over tid. En slik algoritme vil kunne effektivisere Mammografiprogrammet og forbedre tilbudet som gis til kvinnene.

Datagrunnlag

For å utvikle metoden kreves store mengder bildedata fra screeningundersøkelser sammen med informasjon om radiologiske vurderinger, samt eventuelle positive og negative funn i og utenfor screeningprogrammet (screeningopplysninger).

De åtte brystsentrene som er med i prosjektet har utført over 650 000 digitale screeningundersøkelser i programmet, noe som utgjør mer enn 2,5 millioner mammogrammer. Bildedataene er lagret lokalt på brystsentrene, og screeningopplysningene er registrert i Kreftregisterets databaser. Disse dataene vil bli koplet sammen til et unikt datasett som kan lære algoritmen å identifisere negative mammmogrammer.

Prosjektet vil kun benytte data fra kvinner som ikke har reservert seg mot at opplysninger fra hennes screeningundersøkelse lagres i Kreftregisteret, i henhold til kreftregisterforskriften. Kvinnene vil ikke bli kontaktet angående prosjektet, og det vil ikke være mulig å gjenkjenne enkeltpersoner i resultater som publiseres.

Organisering

Kreftregisteret er prosjektleder og ansvarlig for søknader til REK, å samle inn og utlevere data, klinisk testing og for eventuelle implementeringsplaner for et revidert screeningprogram.

Norsk Regnesentral har svært høy fagkunnskap om bildeanalyse og maskinlæring, og er ansvarlig for å utvikle metoden som analyserer screeningmammogrammene.

De brystdiagnostiske sentrene er de regionale spesialistene på diagnostikk og screening av brystkreft, og vil bistå med radiologikompetanse og kunnskap om praktisk screening.

Universitetet i Tromsø har spesialkompetanse innen IT-systemer for biologiske og medisinske applikasjoner, og vil fungere som en viktig rådgiver om aspekter knyttet til dette. De skal også veilede masterstudenter på relaterte emner.

Status 

Per desember 2020 er status at prosjektet har mottatt et «pilotdatasett» fra UNN høsten 2018. I 2020 har vi mottatt mammogrammer fra brystsentrene ved St. Olavs Hospital og Helse Møre og Romsdal. Vi forventer å motta data fra brystsenteret ved Universitetssykehuset i Nord-Norge i januar 2021, og fra de fem brystsentrene ved helseforetakene i Helse Sør-Øst i løpet av 2021. Prosesser knyttet til forberedelse for datainnsamling, og selve innsamlingen, har tatt betydelig mer tid enn forventet.

Basert på mammogrammene fra St. Olavs Hospital og Helse Møre og Romsdal har vi analysert forskjeller i bildekarakteristikk og prediksjonsytelse på tvers av de to brystsentrene. En standardiseringsmetode for å kompensere for forskjellene er blitt utviklet og testet. Ytterligere metoder for behandling og fjerning av vannmerker og andre typer støy er også utviklet. I tillegg til multi-view klassifisering av mammogrammer fra enkelte screeningundersøkelser, har vi sett på tilnærminger for å inkludere mammogrammer fra tidligere undersøkelser i klassifiseringsprosessen. Prosjektgruppen har også jobbet med metoder og modeller for sammenligning av ulike screeningstrategier og hvordan man best kan kombinere automatiske og manuelle prediksjoner for et forbedret resultat, og samtidig beholde eller redusere den manuelle arbeidsmengden i screeningprogrammet.

Mammogrammene vi har mottatt så langt er kun en andel av det totale datasettet som det jobbes med å klargjøre for prosjektet. Så snart større mengder data kommer inn, vil det være mulig å fortsette med det pågående arbeidet med å utvikle egne modeller.

MIM-prosjektet i media

Teknisk ukeblad: Google har utviklet kunstig intelligens som gjenkjenner brystkreft bedre enn radiologer. Kreftregisteret og Norsk Regnesentral lager norsk variant. 06.01.20. 

Forskning.no: Norske forskere utvikler en ny metode for å finne brystkreft. 07.09.20.