Anonimizacija podatkovnih baz

Evidenčna št.

L1-9659 (C) - iz evidence ARIS

Vodja

dr. Aleksandar Jurišić

Obdobje

1.1.2007 - 31.12.2009

Obseg v 2009

0.62 FTE

Veda

Naravoslovje (3)
Tehnika (1)

Status raziskovalca

Raziskovalec (4)
Strokovni ali tehnični sodelavec (0)

Izobrazba

Doktorat znanosti (2)
Magisterij (1)
Drugi (1)

Spol

Ženski (3)
Moški (1)

Status

Zaposlen v RO+RRD (2)
Ni podatka o zaposlitvi v RO (2)

Število publikacij

1–9 (1)
10–99 (1)
100–999 (2)

Projekti / Programi vir: ARIS

Anonimizacija podatkovnih baz

Raziskovalna dejavnost

Koda	Veda	Področje	Podpodročje
1.01.03	Naravoslovje	Matematika	Numerična in računalniška matematika

Koda	Veda	Področje
P110	Naravoslovno-matematične vede	Matematična logika, teorija množic, kombinatorika
P120	Naravoslovno-matematične vede	Teorija števil, teorija obsegov, algebraična geometrija, algebra, teorija gup
P170	Naravoslovno-matematične vede	Računalništvo, numerična analiza, sistemi, kontrola

Ključne besede

anonimizacija podatkov, zasebnost, varnost, zaščita informacij

Vrednotenje (metodologija)

Vrednotenje bibliografskih kazalcev raziskovalne uspešnosti po metodologiji ARIS

Citiranost Citiranost bibliografskih zapisov v COBIB.SI, ki so povezani z zapisi citatnih baz

Organizacije (2) , Raziskovalci (4)

0101 Inštitut za matematiko, fiziko in mehaniko

št.	Evidenčna št.	Ime in priimek	Razisk. področje	Vloga	Obdobje	Štev. publikacijŠtev. publikacij
1.	18021	mag. Janja Jakončič	Računalništvo in informatika	Raziskovalec	2009	27
2.	08724	dr. Aleksandar Jurišić	Matematika	Vodja	2007 - 2009	216
3.	28222	Maruša Stanek	Matematika	Raziskovalec	2007 - 2008	4
4.	14273	dr. Arjana Žitnik	Matematika	Raziskovalec	2007 - 2009	107

1539 Univerza v Ljubljani, Fakulteta za računalništvo in informatiko

Povzetek

Preučujemo modele za zaščito zasebnosti v podatkovnih bazah, bolj konkretno k-anonimnost in ℓ-raznolikost. Analiziramo možne napade ter iščemo ustrezno varnostno nadgradnjo.

Pomen za razvoj znanosti

Varnost podatkovnih baz se je na področju kriptografije in računalniške varnosti kot raziskovalni problem pojavila že okoli leta 1980. Čeprav večine problemov do današnjega dne niso rešili, pa se je povečalo zanimanje zanje prav zaradi zahtevane zasebnosti zdravstvenih podatkov (npr. kartotek). Izvirnost naših rezultatov predstavlja znanstvena definicija problema anonimizacije podatkovnih baz IVZ, ki pa smo ga postavili v širši okvir - od zbiranja podatkov pa vse do njihove uporabe za medicinske in statistične študije. Predlagali smo praktični model, ki z učinkovitimi kriptografskimi in probabilističnimi metodami izboljša obstoječe stanje. Uporabili smo koncepta k-anonimnosti ter l-raznolikosti. Pri tem smo študirali nove kriptografske sheme ter konkretne optimizacijske metode za povečano učinkovitost algoritmov. Preučevali smo učinkovite metode za anonimizacijo podatkovnih baz in jih preizkusili na dejanskih podatkih, ki smo jih prejeli od IVZ. Naš cilj je bil priti do praktične uporabe sodobnih tehnik za anonimizacijo. Algoritmi so se izkazali za učinkovite pri bolj statičnih podatkovnih bazah. Študijo je potrebno nadaljevati tudi na dinamičnih podatkovnih bazah (saj se v številnih primerih novi podatki neprestano dodajajo). Za te vrste baz bo potrebno razviti povsem nove algoritme za anonimizacijo, kar pa presega okvire tega projekta.

Pomen za razvoj Slovenije

Relevantnost in potencialni vpliv rezultatov sta neposredna, saj rešujemo konkreten pereč problem (torej ne gre samo za temeljne raziskave, pač pa za popolnoma problemsko orientirano raziskavo in pilotski projekt kot konkreten odgovor na zastavljeni problem).

Etični problem uporabe osebnih zdravstvenih podatkov je izjemen, s tem pa tudi obveznost, da se zagotovi anonimnost posameznika, kar je tudi opredeljeno v evropski in slovenski zakonodaji. V primeru IVZ je glede na obseg atributov individualnih zapisov, ki so vsebovani v posameznih zbirkah, število zbirk  in možnosti njihovega povezovanja, zagotavljanje anonimnosti osebnih podatkov zahtevna naloga.

Do sedaj je IVZ problem zakrivanja osebnih podatkov reševal predvsem z večjo restriktivnostjo dostopa do uporabe podatkovnih zbirk in odstranjevanja občutljivih atributov. Večja restriktivnost pa je vplivala na manjši obseg in intenzivnost uporabe teh zbirk, zaradi česar ni bil izkoriščen poln potencial, ki bi ga uporaba takšne zbirke podatkov omogočala.

Najpomembnejši znanstveni rezultati

Letno poročilo 2008, zaključno poročilo, celotno poročilo na dLib.si

Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati

Letno poročilo 2008, zaključno poročilo, celotno poročilo na dLib.si

Anonimizacija podatkovnih baz

Zgodovina ogledov

Priljubljeno

Anonimizacija podatkovnih baz

Klasifikacija ARIS

Klasifikacija CERIF

Zahtevana je potrditev

Zgodovina ogledov

Priljubljeno