V članku je predstavljena metodologija za analizo časovnih serij podatkov o genski ekspresiji, zbranih iz listov okuženih in neokuženih rastlin krompirjevega virusa Y (PVY). Naš cilj je identificirati diferencialno izražene gene, katerih izražene vrednosti so statistično značilno različne v nizu rastlin krompirja, okuženih s PVY, v primerjavi z neokuženimi rastlinami, in za katere hkrati velja, da zanje skozi čas obstajajo statistično značilne spremembe v izraženosti pri rastlinah, okuženih s PVY. Novost pristopa vključuje naključno mešanje stratificiranih podatkov, ki se uporablja pri ocenjevanju statističnih lastnosti izražanja genov vzorcev v kontrolnem nizu neokuženih rastlin krompirja. Opredeljena je bila nova ocena, ki izračuna relativno minimalno razdaljo med vzorci in omogoča zanesljivo identifikacijo razlik med ciljnimi in kontrolnimi množicami podatkov, ko so te množice majhne. Pomembnost rezultatov je prikazana z vizualizacijo relativne minimalne razdalje sprememb genske ekspresije skozi času za tri različne sorte krompirja za gene, ki so bili s predlagano metodologijo opredeljeni kot pomembni.
COBISS.SI-ID: 32031015
Članek predstavlja nov pristop za odkrivanje odvisnosti med različnimi biološkimi področji, ki temelji na kopulni analizi rezultatov literature. Raziskali smo odvisnosti med literaturo s področij obrambnega odziva rastlin in redoks potenciala. Kopulna analiza trojčkov, ki jih ekstrahira orodje Bio3graph, kaže, da med tema dvema področjema obstajajo odvisnosti. To kaže na potencial za raziskovanje literature med različnimi področji. Bio3graph je orodje, ki temelji na pravilih, za obdelavo naravnega jezika. Orodje in odkriva odnose v obliki trojčkov (predmet, predikat, objekt) in je javno dostopen na naslovu http://ropot.ijs.si/bio3graph/software/. Kopulna analiza je bila izvedena z uporabo Clayton in Frank popolnoma ugnezdenih kopul, programska oprema pa je javno dostopna na naslovu http://source.ijs.si/bmileva/copulasfordexapps.git.
COBISS.SI-ID: 2048463379
V delu predstavimo pristop odkrivanja semantičnih podskupin na podlagi skupnosti v omrežjih (ang. Community-Based Semantic Subgroup Discovery). Pristop je nadgradnja obstoječih pristopov za iskanje statističnih asociacij, saj v tovrstno iskanje omogoča tudi vključitev strukturnih lastnosti kompleksnih omrežij, povezanih z opazovanim sistemom. Pristop je osnovan na idejah učenja iz različnih tipov podatkov (ang. Multi-view learning), kjer so v učenje vključeni npr. različni tipi biološke informacije, od npr. proteinskih interakcij pa do regulatornih poti med geni in proteini. Pristop je bil testiran na desetih setih genov pripadajočih različnim metabolnim procesom ter boleznim. Rezultati nakazujejo na potencial uporabe predznanja v obliki strukturnih lastnosti kompleksnih omrežij pri analizi genskih setov, saj predlagan pristop odkrije konjunkte bioloških termov (npr. funkcionalnih anotacij), ki jih obstoječe metode ne identificirajo.
COBISS.SI-ID: 32057639
Orodja za odkrivanje znanja, ki temeljijo na literaturi, se pogosto uporabljajo za premagovanje problema razdrobljenosti znanosti in za pomoč raziskovalcem pri njihovem odkrivanju znanja med različnimi področji. V tem članku predlagamo metodologijo za medpodročno odkrivanje znanja iz literature, ki se osredotoča na osamelce med dokumenti in s tem zmanjša prostor iskanja ter število potencialnih povezav med domenami ter izboljša učinkovitost iskanja. Prejšnja študija je združila orodje OntoGen za gručenje dokumentov in orodje CrossBee za premostitvene termine za iskanje skritih odnosov v znanstvenih prispevkih iz dveh različnih področij interesa, kjer je bila uporabnost pristopa dokazana v študiji PubMed dokumentov o Alzheimerjevi bolezni in črevesnem mikrobiomu. Ta prispevek razširja pristop tako, da predlaga metodologijo, ki se izvaja kot ponovljiv potek dela v spletni platformi za tekstovno rudarjenje TextFlows, kar omogoča enostaven dostop in izvajanje metodologije za zainteresiranega raziskovalca.
COBISS.SI-ID: 30497575
Članek obravnava problem rudarjenja večvrstnih omrežij preko dekompozicije teh omrežij v enovrstna omrežja. Predlagana metodologija HINMINE temelji na že objavljenem delu, ki vozlišča večvrstnega omrežja klasificira v dveh korakih. V prvem koraku iz večvrstno omrežje preko dekompozicije zgradimo enega ali več enovrstnih omrežij. Ta korak v predstavljenem delu izboljšamo z uporabo metod, ki idejno izvirajo iz metod za računanje uteži termov v vektorjih vreć besed v rudarjenju tekstovnih podatkov. V drugem koraku zgrajena enovrstna omrežja uporabimo za klasifikacijo podatkov, bodisi preko propozicionalizacije bodisi preko propagacije oznak. V delu predlagamo tudi adaptacijo metode propagacije oznak, ki je uporabna na podatkovnih množicah z neuravnoteženo razporeditvijo ciljnih razredov, testiramo pa tudi več klasifikacijskih algoritmov v primeru klasifikacije preko propozicionalizacije. Metodologijo HINMINE testiramo na treh podatkovnih množicah z različnimi lastnostmi. Naši rezultati kažejo da z uporabo različnih dekompozicijskih metod HINMINE opazno izboljša delovanje uporabljenih klasifikatorjev ter da je, na neuravnoteženih podatkih, adaptirana metoda propagacije oznak boljša od obstoječe.
COBISS.SI-ID: 30214439