Umbreyting gagna úr hliðrænu í stafrænt form
Mörg verkefni byggja á efnislegum gögnum eins og handskrifuðum glósum, prentuðum skjölum eða hljóðupptökum. Til að tryggja að slík gögn séu aðgengileg, deilanleg og að þau varðveitist til lengri tíma er hægt að umbreyta þeim í stafrænt form með viðeigandi tækni.
Almenna viðmiðið er að frumgögn og tengd rannsóknarefni skuli varðveitt í að minnsta kosti tíu ár frá lokum rannsóknar.
Textar
Gögn eins og glósur, handrit eða prentaðar skýrslur má auðveldlega skanna og geyma sem stafrænar myndir. Þegar gögn eru vistuð sem leitanleg PDF-skjöl má nota OCR-hugbúnað (e. Optical Character Recognition) til að umbreyta textanum í skönnuðu myndunum í tölvulesanlegt form.
Myndbönd og hljóðupptökur
Myndböndum eða hljóðupptökum má umbreyta í stafrænar skrár með ýmsum tækjum og hugbúnaði. Slíkar útgáfur varðveita efnið og draga úr hættu á eyðingu eða hrörnun með tímanum. Ef innihald talmáls er meginviðfangsefnið má afrita upptökurnar í textaskrár og síðan geyma eða eyða upprunalegum hljóð- eða myndskrám.
Áþreifanlegir hlutir
Rannsakendur sem vinna með handrit, textíl, gripi eða listaverk nýta oft stafræna tækni til að skrá og rannsaka þau. Ef ekki er hægt að skanna hlutinn beint er hágæðaljósmyndun oft besta leiðin. Hver mynd á að vera yfirfarin til að tryggja að:
- hún endurspegli frumhlutinn á réttan hátt
- hún hafi nægilega skerpu
- hún sé vistuð í skráarsniði sem hentar til langtímavarðveislu og endurnýtingar
Af hverju?
- Vel skipulagt stafræningarferli gerir rannsakendum og samstarfsaðilum kleift að deila, bera saman og finna gögn auðveldlega.
- Það dregur úr eða útrýmir þörfinni fyrir prentun, ljósritun og efnislega geymslu, sem lækkar langtímakostnað verkefna.
- Stafrænar skrár eru aðgengilegar hvenær sem er og hvar sem er í gegnum öruggar skýjaþjónustur eða netkerfi stofnana.
- Hægt er að stilla aðgangsheimildir og notendastjórnun til að vernda trúnaðargögn eða viðkvæm efni.
- Efnisleg gögn og pappírsskjöl rýrna með tímanum, en stafrænar afrit tryggja að verðmætar upplýsingar varðveitist og verði áfram nothæfar.
Viðkvæm gögn
Meðhöndlun viðkvæmra gagna
Viðkvæm gögn eru allar upplýsingar sem vernda þarf gegn óheimilum aðgangi eða birtingu. Slík verndun getur verið krafa samkvæmt lögum, siðareglum eða stefnum stofnana, sérstaklega þegar um er að ræða gögn sem tengjast persónuvernd, öryggi eða eignarupplýsingum.
Viðkvæm gögn geta verið margskonar, til dæmis:
- Persónugreinanlegar upplýsingar: Nöfn, kennitölur, samskiptaupplýsingar, sem og upplýsingar um heilsu, menningu, efnahag eða staðsetningu.
- Öryggistengd gögn: Lykilorð, tölvuöryggislyklar eða gögn sem varða þjóðaröryggi.
- Trúnaðarupplýsingar: Fjárhags- eða viðskiptaupplýsingar, óbirtar rannsóknir eða gögn sem falla undir hugverkarétt.
- Samsett gagnasöfn: Gögn sem, þegar þau eru sameinuð, geta óbeint leitt til persónugreiningar eða afhjúpað viðkvæmar upplýsingar.
- Viðkvæm lýsigögn: Lýsigögn geta einnig innihaldið viðkvæmar upplýsingar, t.d. atriði sem auðkenna einstaklinga eða stofnanir.
Siðferðileg og lagaleg ábyrgð
Viðkvæm eða persónugreinanleg gögn þarf að meðhöndla af varfærni, með upplýstu samþykki, gagnsæi og ábyrgð frá gagnasöfnun til varðveislu. Sérstaka athygli ber að veita söfnun, vinnslu, meðhöndlun og geymslu gagna á öllum stigum rannsóknarferlisins.
Sérstaklega þarf að gæta að texta-, mynd- og hljóðgögnum sem innihalda persónuupplýsingar sem gera kleift að bera kennsl á einstakling. Þetta á bæði við um beinar auðkenningar, svo sem nöfn, heimilisföng eða ljósmyndir, og óbeinar auðkenningar, þar á meðal upplýsingar um vinnustað eða annað sem gæti leitt til þess að einstaklingur verði auðkenndur þegar gögn eru tengd við önnur gagnasöfn.
Evrópusambandið hefur sett ströng lög um vernd persónuupplýsinga, þar á meðal reglur persónuverndar (e. GDPR).
Hvernig á að undirbúa viðkvæm gögn?
Nafnlausun (e. anonymization)
Varanleg eyðing allra auðkenna, þannig að einstaklingar verði ekki auðkenndir með neinum hætti. Þegar gögn hafa verið gerð fullkomlega nafnlaus eru þau ekki lengur flokkuð sem persónuupplýsingar samkvæmt GDPR.
Dulnefning (e. pseudonymization)
Persónuauðkennum er skipt út fyrir dulnefni eða kóða. Þannig er hægt að rekja gögn aftur til uppruna með hjálp viðbótarupplýsinga sem eru geymdar aðskildar. Gögnin teljast þó áfram lagalega viðkvæm þar sem endurgreining er tæknilega möguleg, en eru talin örugg þar sem persónuauðkenni eru ekki beint tengd.
Dulkóðun (e. encryption)
Gögnum eru umbreytt í kóðað form sem aðeins er hægt að lesa með afkóðunarlykli. Þetta er mikilvæg aðferð til að vernda gögn bæði við geymslu og flutning. Árangursrík dulkóðun byggist á sterkum reikniritum og öruggri lyklastjórnun. Hins vegar getur dulkóðun dregið úr endurnýtanleika gagna ef hún kemur í veg fyrir lögmætan aðgang.
Ef engin þessara leiða er raunhæf skal gagnasafnið ekki gert opinbert. Í staðinn má:
- Varðveita það með lokuðu eða takmörkuðu leyfi í gagnageymslu.
- Birta einungis lýsigögn, sem lýsa gagnasafninu og skilmálum aðgangs. Þannig er gagnsæi viðhaldið án þess að viðkvæm gögn verði aðgengileg.
Aðstoð og frekari upplýsingar
OpenAIRE – Leiðbeiningar Open Access Infrastructure for Research in Europe um viðkvæmar upplýsingar
Amnesia – OpenAIRE tól
GAGNÍS – Leiðbeiningar um aðgangsstýringu