MIM-studien: Maskinlæring i Mammografiprogrammet

- Et forskningsprosjekt med målsetting om å effektivisere og øke kvaliteten på Mammografiprogrammet ved å kombinere automatisk bildeanalyse med radiologisk ekspertise.

Publisert 26.11.18, oppdatert 18.11.19

Bakgrunn

Brystkreft er den krefttypen som rammer flest kvinner i Norge og i verden. Selv om enkelte risikofaktorer for sykdommen er kjent for grupper av kvinner, er sykdommen vanskelig å forebygge for den enkelte. Tidlig deteksjon gjennom screening er derfor ansett som et effektivt verktøy for å redusere dødeligheten av sykdommen.

En standard screeningundersøkelse i Mammografiprogrammet består av bilder fra to vinkler av hvert bryst. Tyding av bildene utføres uavhengig av to røntgenleger som har spesialutdanning innen brystradiologi. Hver røntgenlege gir en score fra 1 til 5, som indikerer mistanke om malignitet. 1 betyr negativt, 2 sannsynlig negativ, 3 usikker, 4 sannsynlig malign og 5 høy sannsynlighet for malignitet.

Alle tilfeller hvor en eller begge røntgenlegene har gitt en tydescore 2 eller høyere på ett eller begge bryst, blir diskutert på et konsensusmøte hvor det blir besluttet om kvinnen skal kalles inn for tilleggsundersøkelser eller ikke. Om lag 7% av screeningundersøkelsene diskuteres på et slikt konsensusmøte og om lag halvparten av disse resulterer i en innkalling til etterundersøkelse.

Dette betyr at røntgenlegene som jobber i Mammografiprogrammet bruker betydelig tid på å tyde screeningbilder fra kvinner med normale screeningmammogrammer, det vil si der det ikke vises tegn til brystkreft.

Med nye framskritt innen maskinlæring er det et potensiale for å forbedre dagens screeningprogram for brystkreft blant annet ved at røntgenlegene kan bruke mer tid på kvinnene som blir innkalt til tilleggsundersøkelse og de som har kliniske symptomer på brystkreft, slik som kul eller inndragning.

Hensikt

Prosjektets hovedmålsetting er å utvikle en metode som kan brukes til å tyde screeningmammogrammer, hvor automatisk bildeanalyse kombineres med radiologisk ekspertise.

Ideen i prosjektet er å utvikle en algoritme som bruker kunstig intelligens (deep learning) for å lære å gjenkjenne komplekse mønstre og ta selvstendige beslutninger. Ved å kombinere mammogrammer, tilhørende screeninginformasjon og eventuelle brystkreftdiagnoser, skal algoritmen lære å gjenkjenne mønstre i mammogrammene som kan indikere brystkreft. På denne måten kan metoden brukes til å utvikle automatiske systemer som kan plukke ut screeningmammogrammer som med høy sannsynlighet ikke viser tegn til brystkreft.

Målet er å kunne selektere 70% av alle screeningundersøkelsene som negative ved hjelp av automatisk bildeanalyse. De resterende 30% vil måtte tydes på vanlig måte, med to radiologer. Dette vil kunne frigjøre radiologressurser slik at radiologene kan bruke mer tid på kvinner med mistanke om brystkreft.

Prosjektet gir også muligheter for å utvikle en algoritme som kan hjelpe radiografene som utfører screeningundersøkelsene med å vurdere bildekvalitet, utføre teknisk kvalitetskontroll, og gjøre systematiske analyser for å identifisere forandringer i brystet over tid. En slik algoritme vil kunne effektivisere Mammografiprogrammet og forbedre tilbudet som gis til kvinnene.

Datagrunnlag

For å utvikle metoden kreves store mengder bildedata fra screeningundersøkelser sammen med informasjon om radiologiske vurderinger, samt eventuelle positive og negative funn i og utenfor screeningprogrammet (screeningopplysninger).

De åtte brystsentrene som er med i prosjektet har utført over 650 000 digitale screeningundersøkelser i programmet, noe som utgjør mer enn 2,5 millioner mammogrammer. Bildedataene er lagret lokalt på brystsentrene, og screeningopplysningene er registrert i Kreftregisterets databaser. Disse dataene vil bli koplet sammen til et unikt datasett som kan lære algoritmen å identifisere negative mammmogrammer.

Prosjektet vil kun benytte data fra kvinner som ikke har reservert seg mot at opplysninger fra hennes screeningundersøkelse lagres i Kreftregisteret, i henhold til kreftregisterforskriften. Kvinnene vil ikke bli kontaktet angående prosjektet, og det vil ikke være mulig å gjenkjenne enkeltpersoner i resultater som publiseres.

Organisering

Kreftregisteret er prosjektleder og ansvarlig for søknader til REK, å samle inn og utlevere data, klinisk testing og for eventuelle implementeringsplaner for et revidert screeningprogram.

Norsk Regnesentral har svært høy fagkunnskap om bildeanalyse og maskinlæring, og er ansvarlig for å utvikle metoden som analyserer screeningmammogrammene.

De brystdiagnostiske sentrene er de regionale spesialistene på diagnostikk og screening av brystkreft, og vil bistå med radiologikompetanse og kunnskap om praktisk screening.

Universitetet i Tromsø har spesialkompetanse innen IT-systemer for biologiske og medisinske applikasjoner, og vil fungere som en viktig rådgiver om aspekter knyttet til dette. De skal også veilede masterstudenter på relaterte emner.

Samarbeidspartnere

  • Norsk Regnesentral, ved Lars Holden, Line Eikvil, Marit Holden, Olav Brautaset, Sean Meling Murray
  • Universitetet i Tromsø, ved Lars Ailo Aslaksen Bongo
  • Sørlandet sykehus HF, ved Gunn Aagedal Hervold
  • Sykehuset Innlandet HF – Hamar og Lillehammer, ved Hanne Rosenquist, Anna-Lena Skoglund, Gro Frøisland
  • Vestre Viken HF, ved Jon-Haakon Malmer-Høvik
  • Sykehuset Østfold HF, ved Eivind Reitan
  • Helse Møre og Romsdal HF, ved Jo-Åsmund Lund
  • St. Olavs Hospital HF, ved Morten Troøyen
  • Universitetssykehuset i Nord-Norge HF, ved Rica Mortensen

Status per november 2019

Prosjektet mottok et «pilotdatasett» fra Universitetssykehuset Nord-Norge høsten 2018. Datasettet består av mammogrammer fra om lag 15 000 kvinner. Norsk Regnesentral har fått tilgang til disse dataene og har arbeidet med å få kunnskap om, og satt opp rammeverk for, håndtering og analyse av mammogrammene i datasettet.

Med utgangspunkt i dette datasettet har det vært mulig å teste ut allerede utviklede single-view modeller og multi-view modeller for mammogrammer. Resultatene fra testing med multi-view modeller har blitt vurdert ved hjelp av analyser. De foreløpige analysene viser at det er et stort potensiale for å oppdage flere intervallkrefttilfeller, og redusere arbeidsmengden til radiologene, ved å implementere maskinlæring i screeningen. Basert på resultater fra analysene har prosjektgruppen jobbet med å få en innledende oversikt over mulige strategier for en slik implementering.

Mammogrammene vi har mottatt så langt er kun en liten del av det totale datasettet som det jobbes med å klargjøre for prosjektet. Så snart større mengder data kommer inn, vil det være mulig å jobbe videre med å utvikle egne modeller.