Ir svarīgi izvēlēties pareizo vietu datu ilgtermiņa saglabāšabnai, kas nosaka vai dati būs atrodami, pieejami, sadarbspējīgi un atkārtoti izmantojami (pēc FAIR datu principiem: Findable, Accessible, Interoperable, Re-usable). Vairumā gadījumu, digitāls datu repozitorijs būs piemērots, taču atkarībā no datu veidiem un citām pazīmēm var būt izmantojami arī citi pakalpojumi. Liela apjoma un nedigitāli dati var prasīt citus arhivēšanas paņēmienus. Jācenšas atrast tādu saglabāšanas pakalpojumu sniedzēju, kas cenšas īstenot FAIR principus praksē.
FAIR principi ir noteikumu kopums, kas datu pārvaldīšanu padara standartizētāku un orientēšanos datos daudz labāk saprotamu gan cilvēkiem, gan mašīnām. FAIR principus jācenšas īstenot gan veidojot datu repozitorijus un citus pētniecības rezultātu saglabāšanas-pieejamības pakalpojumus, gan apstrādājot un sagatavojot datu kopas.
Digitālie dati jāarhivē piemērotā datu repozitorijā. Datu repozitorijs nodrošina FAIR principu ievērošanu, sniedzot sekojošus pakalppojumus un iespējas:
- saglabāt datus ilgtermiņa izmantošanai, piemēram, datņu kopēšana un pārbaude (validēšana), glabāšanas formātu izmantošana;
- publicēt mašīnlasāmos metadatus, nodrošinot meklēšanas iespējas tiešsaistē;
- datu kopām piešķirt pastāvīgus unikālus identifikatorus (piemēram, DOI), nodrošinot labāku identificēšanu un datu citēšanas iespējas;
- kontrolē datu kopu kvalitāti un paplašina metadatus, piemēram, izmantojot standartizētas vārdnīcas (ne visos repozitorijos tas ir pieejams);
- piešķirt licences informāciju, paskaidrojot izmantošanas noteikumus un citēšanas prasības.
Programmatūras kods, kas izmantots datu apstrādei (piemēram, izvades datu ģenerēšanai izmantotais modeļa kods vai kods, kas veidots statistiskās analīzes vajadzībām) arī ir jāsaglabā datu repozitorijā, arhivējot kopā ar datu kopu tā, lai to arī var citēt vai uz to atsaukties (izmantojot DOI).
Pirmkodu repozitoriji mēdz piedāvāt versiju kontroli, kodu pārbaudi, kļūdu meklēšanu, dokumentēšanu, lietotāju atbalstu un citas iespējas. Populāras šī pakalpojuma platformas ir GitHub un Bitbucket.
GitHub ir pirmkodu repozitoriju platforma, kas piedāvā ērti lietojamu iespēju pirmkodu datņu saglabāšanai un apkopošanai īstermiņā. Vietnē GitHub saturu var modificēt, dzēst, pārrakstīt un neatgriezeniski mainīt, kas padara to nepietiekoši derīgu ilgstošai atsauču izmantošanai. GitHub ir integrēts ar starptautisko daudznozaru Zenodo repozitoriju. Zenodo nodrošina pirmkodu versiju saglabāšanu ilgtermiņā, kā arī lielāku drošību un pastāvīgumu atsaucēm, tostarp piešķirot arī DOI. (Skatīt plašāk šeit)
Daži dati nav publicējami, jo tie satur konfidenciālu informāciju (piemēram, biometriskos datus), ko nevar atdalīt no datu kopuma, kā arī datu rediģēšana, izdzēšot sensitīvu vai konfidenciālu informāciju, ievērojami samazinātu to vērtību. Tas tomēr nenozīmē, ka datus nevar arhivēt vai padarīt pieejamus.
Daži repozitoriji var pārvaldīt sensitīvos datus, kontrolējot piekļuves procedūru. Tas var pieprasīt, lai potenciālais datu lietotājs iesniedz pieteikumu piekļuvei konkrētai datu kopai. Pieprasījumu datu īpašnieks vai pārvaldītājs var noraidīt vai apstiprināt. Pieprasītājam var būt nepieciešams izpildīt konkrētus nosacījumus, lai piekļūtu datiem, piemēram, jāparaksta konfidencialitātes nolīgums. Piekļuve personas datiem būs atkarīga arī no datu subjekta (datos minētās personas) piekrišanas, tāpēc šis aspekts būtu jāapsver jau pētniecības plānošanas un personu iesaistīšanas posmā.