Razvili smo metodo za razvrščanje časovnih vrst (vrednosti zvezne spremenljivke) na osnovi dreves za napovedno razvrščanje. Metodo lahko uporabimo za identifikacijo skupin primerov s podobnim časovnim obnašanjem, za vsako skupino pa dobimo tudi njen opis. Metodo smo uporabili za identifikacijo skupin genov navadnega kvasa, ki se podobno odzivajo na različne tipe okoljskega stresa, dobljene skupine pa so opisane z oznakami iz ontologije GeneOntology.
COBISS.SI-ID: 23488807
Razvili smo ontologijo podatkovnega rudarjenja OntoDM. Predstavlja entitete kot so podatki, naloge podatkovnega rudarjenja in algoritme ter generalizacije (na osnovi omenjenih entitet). Z ontologijo lahko opišemo več različnih pristopov podatkovnega rudarjenja, vključno z novejšimi pristopi za rudarjenje strukturiranih podatkov in rudarjenja podatkov z omejitvami. Za razliko od ostalih ontologij podatkovnega rudarjenja je OntoDM globoka ontologija in spoštuje najboljše prakse pri načrtovanju ontologij.
COBISS.SI-ID: 24216359
Razvili smo metode za učenje eno in večciljnih regresijskih dreves iz obsežnih podatkov in podatkovnih tokov. Kolikor nam je znano je to edina delujoča metoda za napovedovanje strukturiranih podatkov iz obsežnih podatkov ali podatkovnih tokov, ki jo lahko uporabimo za analizo zelo velikih podatkovnih množic, kot so npr. podatki pridobljeni z različnimi hitropretočnimi tehnikami na področju sistemske biologije.
COBISS.SI-ID: 24647719
Razvili smo metodo, ki ekspliitno obravnava prostorsko in omrežno avtokorelacijo v podatkih, ki niso neodvisni in enako porazdeljeni (i.i.d.) ter omogoča vecčnivojski vpogled v pojav avtokorelacije. Metoda temelji na konceptu dreves za napovedno razvrščanje (PCT) in se uporablja za različne naloge modeliranja, kot sta klasifikacija in regresija, kot tudi za nekatere naloge razvrščanja. To metodo smo uporabili na več realnih problemih prostorske regresije in klasifikacije, in pa na problemih omrežne regresije, ki prihajajo s področij socialnih in prostorskih omrežij.
COBISS.SI-ID: 26073895
Predlagali smo uporabo metode naključnih gozdov, sestavljenih iz dreves za napovedno razvrščanje, za označevanje medicinskih slik z značkami, ki so organizirane v hierarhijo. Poskusi kažejo, da so ansambli dreves za napovedno razvrščanje bolj učinkoviti kot SVM modeli. Poleg tega smo ugotovili, da nam deskriptorji SIFT ponujajo najboljše razlikovanje med slikami, kombinacije različnih deskriptorjev pa izboljšujejo napovedno učinkovitost napovednih modelov. Rezultati dobljeni na obravnavani zbirki slik so boljši od doslej objavljenih rezultatov tako v literaturi kot na tekmovanjih v označevanju slik.
COBISS.SI-ID: 24848423