Deling av forskningsdata er avgjørende for åpen forskning. Det kan også spare samfunnet for verdifull tid – og i ytterste konsekvens bidra til å redde liv - for eksempel i kampen mot pandemier.
Universitetet i Oslo (UiO) leder an med løsning for sentral lagring og deling av forskningsdata. Nå signerer systemintegrator Move en avtale med UiO om levering av løsning for datadeling, søking og gjenbruk - som understøtter de allerede leverte lagringsløsninger fra IBM til universitetet. Løsningen har stor betydning for forskning i hele Europa.
Rektor ved Universitetet i Oslo Svein Stølen. (Foto: Morten Kanne-Hansen / UiO)
-For at vi skal ha etterprøvbarhet og tillit til forskning i samfunnet, er det avgjørende at forskningen er åpen og tilgjengelig. For å få til det er vi også avhengig av å ha de tekniske løsningene for å gjenbruke og dele forskning på en god måte, sier rektor ved UiO, Svein Stølen.
Forskere verden over deler sine data for raskest mulig å kunne bidra til god utvikling av samfunnet.
- Datadeling er sentralt for velferdsutvikling og ikke minst er datadeling et våpen i kamp mot sykdom og pandemier. Gjenbruk av forskningsdata kan spare samfunnet for verdifull tid og kostnader, sier Gard Thomassen, underdirektør ved UiOs Senter for Informasjonsteknologi (USIT) og ansvarlig for den nasjonale IT-plattformen «Tjenester for Sensitive Data» (TSD). Han var tidligere forsker ved universitetet.
Underdirektør ved UiOs Senter for Informasjonsteknologi Gard Thomassen. (Foto: UiO)
UiO skal gjøre forskningsdata tilgjengelig, kvalitetssikret, og etterprøvbart for ansatte ved samarbeidende forskningsinstitusjoner i Europa.
-Den kan få stor betydning for forskningsarbeidet på europeisk nivå, sier han.
Dette er ikke så enkelt slik det kanskje kan høres ut. Når enorme datamengder skal lagres lenge – samtidig som de når som helst skal kunne gjøres tilgjengelig for godkjente forskere som har behov for dem, kreves gjennomtenkte løsninger.
Det handler om kjennskap til hvilken forskning som allerede er gjort, og hvilke data som finnes og kan gjenbrukes. Mange tidligere utfordringer knyttet til lagringsplass, sikkerhet og tilgangskontroll er løst gjennom Tjenester for Sensitive Data (TSD). Dette er en tjeneste som USIT har hatt i produksjon siden 2014, og som nå er vertskap for over 5000 forskere, 1000 forskningsprosjekt og rundt 3 petabyte med sensitive forskningsdata.
-Det har på mange måter vært en stille revolusjon – og som i aller høyeste grad fortsatt pågår, sier Thomassen.
UiO er vertskap for flere forskningsprosjekt som hver har mange hundre millioner filer. Utfordringene er typisk knyttet til de såkalte FAIR-prinsippene. FAIR står for «Findable – Accessible – Interoperable – Reusable» og stammer fra internasjonale retningslinjer som tilsier at all offentlig finansiert forskning skal være FAIR. Disse kravene fremkommer ved at det må forelegges en plan for hvordan man tenker å oppnå data FAIRness i sitt forskningsprosjekt, og finansiering av forskningsprosjekt er avhengig av at det finnes gode planer for dette. Og selvfølgelig må det finnes IT infrastruktur som muliggjør realisering av planene.
Nesten alle etablerte løsninger for deling av data fra klinisk utprøving kommer i dag fra USA eller Asia, men grunnet strenge europeiske regler på personvern må man i EU finne sine egne løsninger. TSDs løsninger og systemer har blitt omtalt som noen av de ypperste på Europeisk nivå.
I sommer ble TSD utpekt av EU-kommisjonen som den beste kandidaten til raskt å kunne etablere et FAIR covid-19 «clinical trial data repository» som en ekstra arbeidsoppgave i det enorme EU-finansierte EOSC (European Open Science Cloud) Life prosjektet. Dette er et spennende samarbeid der også Elixir Norge og Elixir Europa er involvert.
UiO skal være en foretrukken lagringspartner for forskningsdata og dermed spille en rolle i viktige internasjonale og nasjonale forskningsprosjekter. UiO har i løpet av 2020 fornyet de sentrale lagringsløsningene, både for normale forskningsdata og for sensitive forskningsdata. Enhetlig lagringsteknologi for universitetets fil-lagring var viktig for å senke driftskompleksiteten. Dessuten var skaleringsmuligheter, kostnadseffektivitet, automatiseringsmuligheter og ikke minst sikkerhet vesentlige kriterier for valget.
IBM Elastic Storage Server ESS ble valgt som løsning – levert gjennom systemintegrator Move. De to identiske systemene som UiO nå har på plass kan til sammen romme rundt 10 petabyte data. Systemene kan utvides mer enn 100 ganger dagens størrelse.
Teknologiansvarlig i IBM Norge, Loek Vredenberg
IBM Spectrum Discover er programvaren som skal bidra til at lagringsløsningen skal kunne oppfylle FAIR-målsetningen. Et prøveprosjekt er i gang som skal gjøre det lettere å søke gjennom de store datamengdene som nå lagres på de nye systemene. Verktøyet gir utvidede muligheter til å berike forskningsdata med metadata.
IBM-løsningene er nå i ferd med å ta over for universitetets eldre løsninger. Det betyr en langt bedre ytelse, enkel skalering av volum og mulighet for lagdelt (tiered) lagring.
- Vi kjenner de strenge kravene til kvalitet og funksjonalitet i universitets- og forskningsmiljøene og er stolte over at vår partner Move har vunnet konkurransen om å tilby den beste løsningen til UIO, sier Loek Vredenberg i IBM.
- Move har veldig stor glede av samarbeidet med UiO, og vi liker de krevende og teknologiske utfordringene som UiO kontinuerlig gir oss som leverandør.
I fellesskap med UiO og IBM flytter vi verden gradvis videre mht samhandling og datatilgjengelighet, samtidig som datasikkerheten alltid blir ivaretatt og har høyeste prioritet, avslutter key account manager Asle Tronrud i Move.
Kundeansvarlig i Move, Asle Tronrud.