Projekti / Programi
Anonimizacija podatkovnih baz
Koda |
Veda |
Področje |
Podpodročje |
1.01.03 |
Naravoslovje |
Matematika |
Numerična in računalniška matematika |
Koda |
Veda |
Področje |
P110 |
Naravoslovno-matematične vede |
Matematična logika, teorija množic, kombinatorika |
P120 |
Naravoslovno-matematične vede |
Teorija števil, teorija obsegov, algebraična geometrija, algebra, teorija gup |
P170 |
Naravoslovno-matematične vede |
Računalništvo, numerična analiza, sistemi, kontrola |
anonimizacija podatkov, zasebnost, varnost, zaščita informacij
Raziskovalci (4)
št. |
Evidenčna št. |
Ime in priimek |
Razisk. področje |
Vloga |
Obdobje |
Štev. publikacijŠtev. publikacij |
1. |
18021 |
mag. Janja Jakončič |
Računalništvo in informatika |
Raziskovalec |
2009 |
27 |
2. |
08724 |
dr. Aleksandar Jurišić |
Matematika |
Vodja |
2007 - 2009 |
210 |
3. |
28222 |
Maruša Stanek |
Matematika |
Raziskovalec |
2007 - 2008 |
4 |
4. |
14273 |
dr. Arjana Žitnik |
Matematika |
Raziskovalec |
2007 - 2009 |
103 |
Organizacije (2)
Povzetek
Preučujemo modele za zaščito zasebnosti v podatkovnih bazah, bolj konkretno k-anonimnost in ℓ-raznolikost. Analiziramo možne napade ter iščemo ustrezno varnostno nadgradnjo.
Pomen za razvoj znanosti
Varnost podatkovnih baz se je na področju kriptografije in računalniške varnosti kot raziskovalni problem pojavila že okoli leta 1980. Čeprav večine problemov do današnjega dne niso rešili, pa se je povečalo zanimanje zanje prav zaradi zahtevane zasebnosti zdravstvenih podatkov (npr. kartotek). Izvirnost naših rezultatov predstavlja znanstvena definicija problema anonimizacije podatkovnih baz IVZ, ki pa smo ga postavili v širši okvir - od zbiranja podatkov pa vse do njihove uporabe za medicinske in statistične študije. Predlagali smo praktični model, ki z učinkovitimi kriptografskimi in probabilističnimi metodami izboljša obstoječe stanje. Uporabili smo koncepta k-anonimnosti ter l-raznolikosti. Pri tem smo študirali nove kriptografske sheme ter konkretne optimizacijske metode za povečano učinkovitost algoritmov. Preučevali smo učinkovite metode za anonimizacijo podatkovnih baz in jih preizkusili na dejanskih podatkih, ki smo jih prejeli od IVZ. Naš cilj je bil priti do praktične uporabe sodobnih tehnik za anonimizacijo. Algoritmi so se izkazali za učinkovite pri bolj statičnih podatkovnih bazah. Študijo je potrebno nadaljevati tudi na dinamičnih podatkovnih bazah (saj se v številnih primerih novi podatki neprestano dodajajo). Za te vrste baz bo potrebno razviti povsem nove algoritme za anonimizacijo, kar pa presega okvire tega projekta.
Pomen za razvoj Slovenije
Relevantnost in potencialni vpliv rezultatov sta neposredna, saj rešujemo konkreten pereč problem (torej ne gre samo za temeljne raziskave, pač pa za popolnoma problemsko orientirano raziskavo in pilotski projekt kot konkreten odgovor na zastavljeni problem).
Etični problem uporabe osebnih zdravstvenih podatkov je izjemen, s tem pa tudi obveznost, da se zagotovi anonimnost posameznika, kar je tudi opredeljeno v evropski in slovenski zakonodaji. V primeru IVZ je glede na obseg atributov individualnih zapisov, ki so vsebovani v posameznih zbirkah, število zbirk in možnosti njihovega povezovanja, zagotavljanje anonimnosti osebnih podatkov zahtevna naloga.
Do sedaj je IVZ problem zakrivanja osebnih podatkov reševal predvsem z večjo restriktivnostjo dostopa do uporabe podatkovnih zbirk in odstranjevanja občutljivih atributov. Večja restriktivnost pa je vplivala na manjši obseg in intenzivnost uporabe teh zbirk, zaradi česar ni bil izkoriščen poln potencial, ki bi ga uporaba takšne zbirke podatkov omogočala.
Najpomembnejši znanstveni rezultati
Letno poročilo
2008,
zaključno poročilo,
celotno poročilo na dLib.si
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati
Letno poročilo
2008,
zaključno poročilo,
celotno poročilo na dLib.si