FLORENCE: føderert læring på kreftdata
Bakgrunn
Tykk- og endetarmskreft er den nest vanligste kreftsykdommen i Norge når man ser på begge kjønn. I 2021 ble 4550 menn og kvinner diagnostisert med tykk- og endetarmskreft. 1 av 4 tarmkreftpasienter opplever komplikasjoner etter operasjon, og samme andel opplever tilbakefall av kreftsykdommen innen 3 år.
Bedre utnyttelse av register- og sykehusdata kan gi klinikere og pasienter bedre grunnlag for behandling og for forebygging av komplikasjoner etter kirurgi. Å mappe/tilordne data til OMOP-datamodellen gir mulighet for å analysere data på tvers av land uten at selve dataene flyttes over grensene.
Formål
I dette prosjektet ønsker vi legge grunnlag for et IT-verktøy (beslutningsstøtteverktøy) som kan brukes av spesialistene til å hjelpe med behandlingsvalg for tarmkreftpasienter.
Prosjektet er et samarbeid med Center for Surgical Science (CSS) ved Sjælland Universitetssykehus i Danmark, og ved bruk av sykehus- og registerdata fra begge land, skal vi danne grunnlaget for et nytt beslutningsstøtteverktøy. I tillegg samarbeides det med Lunds Universitet i Sverige, Computerome ved DTU og enheten for forskningsprosjekter ved Sjællands Universitetssykehus.
For å skape et beslutningsstøtteverktøy som bruker grunnlagsdata fra flere land er det viktig at dataene som ligger til grunn for analysene er sammenlignbare. Det fører til at dataene må standardiseres og harmoniseres på tvers av landene før de kan sammenlignes. For å oppnå dette vil vi benytte en generisk datamodell kalt OMOP-CDM fra Observational Health Data Sciences and Informatics (OHDSI). Prosjektet vil også ta i bruk syntetiske data for testing og utvikling av algoritmer som kan jevnlig forbedres via føderert læring.
Vi har fått midler til prosjektet sammen med prosjektpartnerne fra Interreg Øresund-Kattegat-Skagerak (ØKS). Interreg ØKS er et europeisk regionalt utviklingsfond som støtter prosjekter som satser på innovasjon, en grønn omstilling, transport eller et grenseløst arbeidsmarked.
Personvern
Personvern er bl.a. ivaretatt ved at det brukes en felles datamodell slik at man kan dele algoritmer istedenfor helseopplysninger. De lokale dataene på et sykehus/registeret vil brukes for å lære opp hver sin versjon av modellen, eller beslutningsstøtteverktøyet i dette tilfellet. Endringer i modellen mellom hvert sted kan deles, og på den måten vil alle behandlingsstedene ha et like godt beslutningsverktøy.