Projekti / Programi
Napovedno razvrščanje na podatkovnih tokovih
Koda |
Veda |
Področje |
Podpodročje |
2.07.07 |
Tehnika |
Računalništvo in informatika |
Inteligentni sistemi - programska oprema |
Koda |
Veda |
Področje |
1.02 |
Naravoslovne vede |
Računalništvo in informatika |
rudarjenje podatkov, spremenljivi podatkovni tokovi, več-ciljna regresija, več-označna klasifikacija, pol-nadzorovano učenje, zaznavanje sprememb
Podatki za zadnjih 5 let (citati za zadnjih 10 let) na dan
28. maj 2023;
A3 za obdobje
2017-2021
Podatki za razpise ARRS (
04.04.2019 - Programski razpis,
arhiv
)
Baza |
Povezani zapisi |
Citati |
Čisti citati |
Povprečje čistih citatov |
WoS |
333 |
7.792 |
6.819 |
20,48 |
Scopus |
428 |
11.283 |
9.911 |
23,16 |
Raziskovalci (14)
Organizacije (2)
Povzetek
Podatkovni tokovi so visoko frekvenčni podatkovni viri, ki so v zadnjem času postali navzoči vsepovsod. Značilna zanje je visoka frekvenca prihoda novih podatkovnih primerov in njihova časovna urejenost. Ena ključnih lastnosti je možnost pojavitve sprememb (ang. concept drift), ki jih metode za rudarjenje podatkovnih tokov morajo zaznati ter se nanje prilagoditi. S povečano potrebo po rudarjenju podatkovnih tokov se je povečala še njihova kompleksnost, ki jo lahko opišemo v več dimenzijah. Ena izmed teh je kompleksnost vrednosti, ki jo napovedujemo. Vse pogosteje naletimo na naloge hkratnega napovedovanja več vrednosti, ki so zahtevnejše kot običajna klasifikacija ali regresija. Druga je obravnavanje podatkovnih primerov z manjkajočimi vrednostmi ciljnih spremenljivk. Takšne naloge rešujemo s pol-nadzorovanimi ali razvrščevalnimi metodami. Zadnja dimenzija je naravni del rudarjenja podatkovnih tokov, zadeva pa spremembe v podatkih, ki jih moramo čimprej zaznati in se nanje prilagoditi. V odogovor na potrebe po rudarjenju kompleksnih podatkovnih tokov, bomo v predlaganem projektu razvili metode za sprotno učenje iz podatkovnih tokov, ki 1) Rešujejo naloge tako običajne kot tudi hierarhične več-ciljne regresije in več-označne klasifikacije, 2) Učinkovito rešujejo naloge nenadzorovanega učenja (razvrščanja v podskupine), prav tako pa tudi polnadzorovanega učenja v kontekstu napovedovanja ene ali več vrednosti (ali celotne hierarhije), 3) Ocenjujejo pomembnosti značilk za zgoraj omenjene naloge napovednega modeliranja, 4) Zaznavajo in se primerno prilagajajo spremembam med učenjem napovednih modelov za zgoraj omenjene naloge napovednega modeliranja. Projekt bo razvite metode sistematično ovrednotil z uporabo primerne metodologije. Razvite metode bodo prosto dostopne kot del večje platforme za rudarjenje podatkovnih tokov. Njihovo uporabo bomo spodbujali tudi z anotacijami metod s termini iz ontologije podatkovnega rudarjenja. Uporabnost razvitih metod bomo nazorno prikazali na študijah primerov iz realnega življenja, natančneje s področij spremljanja okolja in zdravlja ter spremljanja in optimizacije delovanja vesoljskih sond.