Pri proučevanju časa do dogodka včasih vemo, da obstaja neko nezanemarljivo sotveganje, ki pa ni zabeleženo v podatkih. Ocene, ki ne upoštevajo vseh sotveganj, so lahko pomembno pristranske, zato potrebujemo način, s katerim bomo to pristranskost ocenili oziroma odpravili. S problemom smo se prvič srečali pri analizi podatkov iz registra ahalazije požiralnika – ponavljajoče bolezni požiranja, v katerem smrti bolnikov v času raziskave niso bile zabeležene, na enak problem pa lahko naletimo tudi v številnih drugih registrih medicinskih naprav, kjer zakon zdravnike obvezuje k poročanju o dogodkih, medtem ko podatki o smrtih niso dostopni. Kadar je pričakovani delež umrlih dovolj velik (pričakovani čas do dogodka mora biti dovolj dolg v primerjavi s pričakovanim preživetjem bolnikov), neupoštevanja smrti vodi do precenjenih ocen mer preživetja zdravljenja. Pokazali smo, zakaj intuitivno smiselno popravljanje ne da nepristranskih rezultatov in razložili, zakaj pri ocenjevanju kumulativne funkcije pojavnosti ne potrebujemo dodatne informacije. Razvili smo teoretični okvir, ki omogoča nepristransko ocenjevanje poljubne mere s pomočjo dodatne informacije, ki jo pridobimo iz populacijskih tabel smrtnosti. Razvili smo dva pristopa - iterativno metodo pripisovanja časov smrti in metodo s prilagajanjem števila ogroženih. Lastnosti obeh pristopov smo teoretično utemeljili ter jih raziskali s simulaciji in ilustrirali s primerom ahalazije požiralnika.
COBISS.SI-ID: 32255193
Ko učimo klasifikatorje, je naravno, da želimo, da klasifikator pravilno oceni verjetnost dogodka (omejitev 1), da ima enako občutljivost in specifičnost (omejitev 2), ali da ima enako pozitivno ter negativno napovedno vrednost (omejitev 3). Dokažemo, da v primeru uravnoteženih podatkov, kjer je delež dogodkov in nedogodkov enak, vsak klasifikator, ki doseže eno omejitev, doseže vse omejitve. Tako nepristransko obravnavo dogodkov in nedogodkov pa je precej težje doseči, ko imamo opravka z redkimi dogodki, to je primeri, ko je delež dogodkov (precej) manjši od 0,5. V tem primeru dokažemo, da je nemogoče doseči vse tri omejitve, razen, ko klasifikator dosega popolno točnost. Vsak drugi klasifikator pa lahko doseže le eno izmed omejitev, doseganje le-te pa pomeni kršenje preostalih dveh v točno določeni smeri. Naši rezultati imajo pomen za klasifikatorje, ki se jih optimizira z uporabo g-povprečja ali F1-mere, ki pomenita uresničevanje druge oziroma prve omejitve. Naši rezultati temeljijo na osnovah verjetnostne teorije in so ilustrirani s pomočjo simulacij za nekaj najbolj pogosto uporabljenih klasifikatorjev.
COBISS.SI-ID: 33010393
Področje relativnega preživetja je v zadnjem desetletju precej raziskovalno aktivno, a eden izmed rezultatov tega razvoja je tudi več različnih in nasprotujočih si pristopov k analizi. V članku natačno definiramo različne mere in razložimo razlike med njimi. Njihove lastnosti smo raziskali na primeru raka debelega črevesa in prostate iz slovenskega Registra raka ter na podlagi simuliranih podatkov. Realna primera podatkov ilustrirata, kako šele ocenjevanje večih mer omogoča celostno sliko podatkov. Izbira ustrezne metode mora biti narejena v dveh korakih, najprej mora biti jasno definirano raziskovalno vprašanje in mera, ki nas zanima, šele nato sledi izbor med cenilkami, ki konsistentno ocenjujejo to mero.
COBISS.SI-ID: 33117913