Diskusjon:Viderebruksveileder/Hva er åpne data?
Vedr. pkt 3: Personvernvurdering:
redigerJeg synes dette spørsmålet må behandles mye grundigere. Vurderingen av fare for brudd på personvernet er noe offentlige virksomheter må vurdere før de gjør data tilgjengelig. Dette kan være vanskelige vurderinger, og en veileder som dette bør kunne gi svar på de fleste personvernrelaterte spørsmål. Eksempler:
- Hvor langt ned i aggregeringsnivå kan man gå før det er fare for personvernbrudd?
- Hva med faren for at identifisering kan skje ved kobling til andre datasett?
I arbeidet med rapporten "Fakta først" ble personvern nevnt som problematisk ved tilgjengeliggjøring av data av mange vi intervjuet. Vi fikk et inntrykk av at det er en del usikkerhet rundt de begrensninger personvernkrav faktisk legger på frigivelse av data. Et sitat fra rapporten side 31:
- Personvern: Hensynet til personvern er en av de største utfordringene som flere etater trekker fram i forhold til mulig frigivelse av data, da særlig i forhold til innbyggere og klienter. Antakelig finnes det her et behov for mer kunnskap: Hvilket aggregeringsnivå gir for eksempel et tilstrekkelig personvern? Det kan tenkes at virksomheter holder tilbake mer data enn nødvendig for å være på den sikre siden. Et mulig eksempel er Bergen kommunes politikerregister: Også her ble personvern pekt på som en grunn til å holde tilbake data, i det tilfellet permisjons- og fraværsdata fra de enkelte politikernes sider - selv om det vel kan tenkes at politikeres fravær er av interesse når velgerne skal evaluere folkevalgtes innsats.
--Oaø (diskusjon) 13. jan 2011 kl. 19:44 (CET)
Jeg er enig. Tror dette er i kjernen av problemstillingen. Spørsmålet er selvsagt hvor dypt denne veilederen skal grave, og hvor spissfindige avveininger vi skal gå inn på. Kan man si noe overordnet om dette? Noen som har forslag til en videreutvikling av dette kapittelet? Waagenilsen (diskusjon) 17. jan 2011 kl. 13:52 (CET)
Vedr. begrepet åpne data
redigerDefinisjonen og beskrivelsen av "åpne" data - open data - er her gjort veldig enkel ("Når vi snakker om åpne data er det egentlig bare snakk om noe så enkelt som å gjøre eksisterende faktaopplysninger åpent tilgjengelig for allmennheten."). Jeg frykter at dette kan skape mer forvirring enn oppklaring. Antakelig har en god del av de som leser veilederen støtt på begrepet "open data", men da definert langt mer presist. Open Knowledge Foundation har laget en definisjon av "åpen kunnskap", der data inngår. Den er oversatt til bokmål. Definisjonen setter opp noen kriterier som må være oppfylt for at data skal kunne kalles åpne. At de er "tilgjengelige for allmennheten" er altså ikke i seg selv tilstrekkelig. Her er én gjennomgang av forskjellene på "offentlige data" og "åpne data".
Jeg synes man burde gå inn på denne diskusjonen i veilederen. Dette kan spisse forståelsen av hvorfor data skal offentliggjøres (man oppmuntrer best til gjenbruk når data er åpne i henhold til Open Definition), og kanskje øke lysten til å frigi med reell åpenhet. I CKAN er det for øvrig en "åpenhetsmerking" av hvert datasett. Eksempel på datasett som er tilgjengelig, men ikke åpent (mangler lisens). --Oaø (diskusjon) 18. jan 2011 kl. 13:10 (CET)