MIM-studien: Maskinlæring i Mammografiprogrammet

- Et forskningsprosjekt med målsetting om å effektivisere og øke kvaliteten på Mammografiprogrammet ved å kombinere automatisk bildeanalyse med radiologisk ekspertise.

Publisert 26.11.18, oppdatert 29.11.18

Bakgrunn

Brystkreft er den krefttypen som rammer flest kvinner i Norge og i verden. Selv om enkelte risikofaktorer for sykdommen er kjent, er sykdommen vanskelig å forebygge. Tidlig deteksjon gjennom screening er derfor ansett som et effektivt verktøy for tidligdeteksjon og reduksjon av dødelighet av sykdommen.

En standard screeningundersøkelse med mammografi tar bilder fra to ulike vinkler av hvert bryst.

Tyding av bildene er en manuell prosess som gjøres uavhengig av to radiologer som har spesialutdanning. Hver radiolog gir en score fra 1 til 5, som indikerer mistanke om malignitet. 1 betyr negativt, 2 sannsynlig negativ, 3 betyr usikker, 4 sannsynlig malign og 5 høy sannsynlighet for malignitet.

Alle tilfeller hvor en eller begge radiologene har gitt en tydescore 2 eller høyere på ett eller begge bryst, blir diskutert på et konsensusmøte hvor det blir besluttet om kvinnen skal kalles inn for tilleggsundersøkelser eller ikke. Om lag 7% av screeningundersøkelsene diskuteres på et slikt konsensusmøte, og om lag halvparten av disse fører til en innkalling til etterundersøkelse.

I dag bruker radiologene betydelig tid på å tyde screeningbilder fra kvinner med negative screeningmammogrammer. Nyutviklede metoder innen maskinlæring og kunstig intelligens kan åpne opp for effektivisering og forbedring av dagens mammografiprogram.

Hensikt

Prosjektets hovedmålsetting er å utvikle en metode som kan brukes til å tyde screeningmammogrammer, hvor automatisk bildeanalyse kombineres med radiologisk ekspertise.

Ideen er å utvikle en algoritme som kan lære å gjenkjenne komplekse mønstre og ta intelligente beslutninger. Ved å kombinere mammogrammer, tilhørende screeninginformasjon og eventuelle brystkreftdiagnoser, skal algoritmen lære å gjenkjenne mønstre i bildedataene som kan indikere brystkreft. På denne måten kan metoden brukes til å utvikle automatiske systemer som kan plukke ut screeningmammogrammer som med høy sannsynlighet ikke viser kreft.

Målet er å kunne selektere 70% av alle screeningundersøkelsene som negative ved hjelp av automatisk bildeanalyse. De resterende 30% vil måtte tydes på vanlig måte, med to radiologer. Dette vil kunne frigjøre radiologressurser slik at radiologene kan bruke mer tid på kvinner med mistanke om brystkreft.

Automatisk analyse vil også kunne hjelpe radiografene med å vurdere bildekvalitet, utføre teknisk kvalitetskontroll, og gjøre systematiske analyser for å identifisere forandringer i brystet over tid. Dette vil kunne effektivisere Mammografiprogrammet, og kan forbedre tilbudet som gis til kvinnene.

Datagrunnlag

For å utvikle metoden, kreves store mengder bildedata fra mammografiundersøkelser sammen med informasjon om radiologiske vurderinger, samt eventuelle positive og negative funn i og utenfor screeningprogrammet (screeningopplysninger).

Mammografiprogrammet har screenet med digital mammografi i mer enn ti år, og brystsentrene har dermed en unik samling av bildedata som vil gi grunnlag for å benytte deep learning og etablere systemer for maskinlæring.

Vi vil inkludere bildedata og screeningopplysninger fra alle digitale screeningundersøkelser utført som en del av Mammografiprogrammet ved åtte brystsentre. Dette utgjør om lag 250 000 kvinner, 650 000 undersøkelser og mer enn 2,5 millioner mammogrammer, fra perioden 2004 og frem til i dag.

Bildedataene er lagret lokalt på brystsentrene, og screeningopplysningene er registrert i Kreftregisterets databaser. Ved å koble bildedata sammen med relevante screeningopplysninger, kan dataene benyttes som et treningssett for utvikling av algoritmen som skal tolke screeningmammogrammer ved bruk av maskinlæring.

Organisering

Kreftregisteret er prosjektleder og ansvarlig for søknader til REK, å samle inn og utlevere data, klinisk testing og for eventuelle implementeringsplaner for et revidert screeningprogram.

Norsk Regnesentral har svært høy fagkunnskap om bildeanalyse og maskinlæring, og er ansvarlig for å utvikle metoden som analyserer screeningmammogrammene.

De brystdiagnostiske sentrene er de regionale spesialistene på diagnostikk og screening av brystkreft, og vil bistå med radiologikompetanse og kunnskap om praktisk screening.

Universitetet i Tromsø har spesialkompetanse innen IT-systemer for biologiske og medisinske applikasjoner, og vil fungere som en viktig rådgiver om aspekter knyttet til dette. De skal også veilede masterstudenter på relaterte emner.

Personvern og avtaler

Dette prosjektet vil kun benytte data fra kvinner som ikke har reservert seg mot at opplysninger fra hennes screeningundersøkelse lagres i Kreftregisteret og brukes til kvalitetssikring, evaluering og forskning, i henhold til kreftregisterforskriften.

Studiedeltakerne vil ikke bli kontaktet direkte angående dette prosjektet, og resultatene fra prosjektet vil ikke påvirke deltagernes fremtidige tilbud om, og deltakelse i, programmet.

Opplysninger som inngår i datasettet vil bli avidentifisert, slik at det ikke er mulig å gjenkjenne enkeltpersoner.

Prosjektet har søkt og fått innvilget forhåndsgodkjenning fra Regionale Komiteer for medisinsk og helsefaglig forskningsetikk (REK), prosjektnr: 2017/2461.

Prosjektet vil søke alle brystsentrenes lokale personvernombud om godkjenning for uttrekk av data for å sikre ivaretakelse av personvernet ved det enkelte senter.

Som prosjektleder har Kreftregisteret inngått samarbeidsavtaler med alle de involverte brystsentrene og Norsk Regnesentral. Det er også inngått databehandleravtale mellom Kreftregisteret og Norsk Regnesentral.