Nalaganje ...
Projekti / Programi vir: ARRS

Analiza heterogenih informacijskih omrežij za odkrivanje zakonitosti v znanostih o življenju

Raziskovalna dejavnost

Koda Veda Področje Podpodročje
7.00.00  Interdisciplinarne raziskave     

Koda Veda Področje
P176  Naravoslovno-matematične vede  Umetna inteligenca 

Koda Veda Področje
1.02  Naravoslovne vede  Računalništvo in informatika 
Ključne besede
Rudarjenje podatkov, odkrivanje znanja, semantično rudarjenje podatkov, delotoki, heterogena omrežja, rastlinska imunska signalizacija
Vrednotenje (pravilnik)
vir: COBISS
Raziskovalci (16)
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  19116  dr. Špela Baebler  Biotehnika  Raziskovalec  2016 - 2018  294 
2.  34130  dr. Anna Coll Rius  Naravoslovje  Raziskovalec  2016 - 2018  144 
3.  12688  dr. Kristina Gruden  Biotehnika  Raziskovalec  2016 - 2018  939 
4.  36355  dr. Jan Kralj  Tehnika  Raziskovalec  2017 - 2018  38 
5.  08949  dr. Nada Lavrač  Tehnika  Vodja  2016 - 2018  852 
6.  50070  dr. Matej Martinc  Humanistika  Raziskovalec  2017 - 2018  70 
7.  36836  dr. Biljana Mileva Boshkoska  Tehnika  Raziskovalec  2017 - 2018  147 
8.  36912  dr. Dragana Miljković  Tehnika  Raziskovalec  2016 - 2018  69 
9.  35475  dr. Matic Perovšek  Tehnika  Raziskovalec  2016  15 
10.  29539  dr. Vid Podpečan  Tehnika  Raziskovalec  2016 - 2018  89 
11.  31844  dr. Senja Pollak  Humanistika  Raziskovalec  2016 - 2018  230 
12.  18467  dr. Maruša Pompe Novak  Biotehnika  Raziskovalec  2016 - 2018  281 
13.  34502  dr. Živa Ramšak  Naravoslovje  Raziskovalec  2016 - 2018  111 
14.  37679  Andraž Repar  Humanistika  Raziskovalec  2018  25 
15.  04586  dr. Tanja Urbančič  Tehnika  Raziskovalec  2018  289 
16.  34262  dr. Anže Vavpetič  Tehnika  Raziskovalec  2016 - 2017  30 
Organizacije (2)
št. Evidenčna št. Razisk. organizacija Kraj Matična številka Štev. publikacijŠtev. publikacij
1.  0105  Nacionalni inštitut za biologijo  Ljubljana  5055784  12.936 
2.  0106  Institut "Jožef Stefan"  Ljubljana  5051606000  85.799 
Povzetek
Predlog projekta obravnava odkrivanje zakonitosti v kompleksnih scenarijih rudarjenja podatkov v znanostih o življenju. Z razvojem mikromrež in drugih naprednih tehnik molekularne biologije se soočamo z ogromnimi količinami podatkov v rangu tako imenovanih Velikih Podatkov (Big Data). Relevantne informacije so razpršene v različnih podatkovnih bazah v heterogenih formatih in so zato za biologe le težko uporabne. Za povečanje uporabnosti javno dostopnih resursov je potrebna integracija le-teh v enoten vir podatkov za podatkovno rudarjenje. Namen predlaganega projekta je razvoj, implementacija, evalvacija in aplikacija nove metodologije za rudarjenje velikih heterogenih podatkov na področju znanosti o življenju. Motivacija za razvoj predlagane metodologije je dejstvo, da obstoječe metode odkrivanja znanja iz podatkov ne sledijo zahtevam analize ogromnih količin raznovrstnih podatkov s področja znanosti o življenju. Izboljšavo obstoječih pristopov bomo dosegli z razširitvijo in kombinacijo metod rudarjenja besedil, rudarjenja relacijskih podatkov ter zlivanja heterogenih podatkov. Da bi ocenili predlagano metodologijo bomo uporabili več testnih in realnih domen s področja znanosti o življenju z namenom, da bi zboljšali translacijske pristope v kmetijstvu z odkrivanjem novega znanja na področju rastlinske imunske signalizacije. Projekt ima naslednje cilje: 1. Razvoj nove metodologije, ki bo omogočila zlivanje besedil in kompleksnega relacijskega predznanja s področja znanosti o življenju v obliko velikega heterogenega informacijskega omrežja. To bomo dosegli z razširitvijo naše metodologije za rudarjenje heterogenih informacijskih omrežij s kontekstualizacijo informacij o instancah glede na razpoložljivo semantično predznanje (domenske taksonomije in ontologije) ter prilagoditvijo metodologije na kompleksne scenarije znanosti o življenju. 2. Implementacija metodologije za rudarjenje heterogenih informacijskih omrežij v spletni platformi ClowdFlows ali TextFlows ter eksperimentalna evalvacija metodologije na prosto dostopnih testnih podatkovnih množicah, vključno z izbranimi medicinskimi domenami, za katere obstajajo javno dostopne baze heterogenih podatkov. 3. Aplikacija razvite metodologije na treh realnih primerih uporabe s področja znanosti o življenju: (i) meddomensko odkrivanje znanja iz dokumentov o dveh nepovezanih problemih s področja znanosti o življenju, z namenom odkrivanja še neznanih povezav med "statusom redoksa" in "signalizacije rastlinske obrambe", (ii) rudarjenje heterogenih eksperimentalnih podatkov v obliki časovnih vrst v domeni signalizacije rastlinske obrambe in (iii) opredelitev ključnih elementov v signalizaciji rastlinske obrambe za ugotavljanje izida bolezni. Projekt bo prispeval k razvoju novih algoritmov za rudarjenje velikih heterogenih podatkov. Dostopnost razvite metodologije bomo zagotovili z implementacijo metodologije v enem od naših spletnih okolij za rudarjenje podatkov ClowdFlows ali TextFlows, kar bo omogočilo uporabo razvite tehnologije širšemu krogu raziskovalcev ter povečalo njeno relevantnost tudi za strokovnjake s področja znanosti o življenju. Raziskava bo potekala v tesnem sodelovanju strokovnjakov s področja podatkovnega rudarjenja z IJS in domenskih strokovnjakov z NIB.
Pomen za razvoj znanosti
Projekt želi razviti orodja in postopke, ki bi pomagali znanstvenikom pri čedalje težji nalogi odkrivanja in združevanja heterogenega in distribuiranega znanja. Reševanje tega problema zahteva razvoj nove računalniške paradigme, ki integrira ideje iz različnih področij. Ustrezna rešitev tega problema bodo nove tehnologije, pomembne za vrsto aplikacij, med katerimi so nekatere omenjene tudi v 7.OP EU IKT programu, npr. Izziv 4 o inteligentnih vsebinah in Izziv 5 o zdravstvenem varstvu. Tu gre tudi za vprašanja ustvarjanja in upravljanja znanja, ki so predmet razpisov projektov v programu Obzorja 2020. Predlagani projekt prispeva k rešitvi ozkega grla obravnave heterogenih informacij ter podpore uporabnikom, zlasti znanstvenikom, pri odkrivanju znanja iz distribuiranih virov informacij. Projekt bo razvil poenoten teoretični okvir za rudarjenje heterogenih informacijskih omrežij, nove algoritme in kot tudi nov pristop k interaktivni formulaciji in izboljševanju delotokov odkrivanja znanja. Predlagani projekt rešuje odprt problem kar ima visok znanstveni in tehnološki potencial. Uspešni rezultati predlaganega projekta lahko doprinesejo k evropski industriji znanja, kar bi jo naredilo bolj učinkovito in konkurenčno. Izzivov, s katerimi se bomo srečali v a projekta, ne moremo obravnavati s katerokoli drugo znano IKT tehnologijo ali katero od njenih izboljšav, saj predlog predstavlja nov pristop k zlivanju informacij in odkrivanju znanja. Za uspešno reševanje izzivov s tega področja pa je potrebno sodelovanje ekspertov z različnih področij. Uspešni rezultati projekta bodo imeli tako v prvi vrsti močan vpliv na tehnologijo rudarjenja podatkov in s tem na znanost. Dolgoročno pa lahko vplivajo na evropski privatni in javni sektor pri analizi javnih podatkov. Predlagani projekt ima potencial za uveljavitev nove teoretične in metodološke paradigme za upravljanje z informacijami in znanjem, ter njihovega odkrivanja, zlivanja in razumevanja. Razviti prototip pa predstavlja močno znanstveno in tehnološko osnovo tudi za širše interdisciplinarne raziskave in za razvoj metodologij do takega nivoja, ki bo zanimiv tudi za investitorje iz industrije, predvsem s področja biotehnologije in farmacije.
Pomen za razvoj Slovenije
Cilj projekta je analiza heterogenih informacijskih omrežij krompirja, zato bodo rezultati lahko direktno vplivali na prehrambeno industrijo. Krompir je trenutno tretja najpomembnejša poljščina na svetu. Z njegovo proizvodnjo glede na hektar pridobimo velike količine nealergenih rastlinskih proteinov, vitaminov in zdravju primernih spojin, s čimer mu raste pomen prehrambene poljščine v razvijajočem svetu. Kljub temu njegova proizvodnja trenutno ni optimalna, zaradi visokih proizvodnih stroškov, ki so med pridelavo potrebni za doseganje primernih donosov, ter dovzevnosti na biotske in abiotske vplive. Evropska industrija proizvodnje krompirja je zelo tekmovalna in njen delež na trgu nepretrgano raste. V uporabi je več sto različnih kultivarjov, veliko od njih tesno povezanih s kulturo in regijami rasti. V Sloveniji je v 80-ih letih epidemija virusa PVY popolnoma izničila občutljive (ampak v tistem času glavne) krompirjeve kultivarje, kar je praktično uničilo Slovensko proizvodnjo semenskega krompirja. Trenutno obstoje le nekaj popolnoma odpornih kultivarjev, katerih proizvodnja pa je težavna iz vidika specifičnosti Slovenskega podnebja in iz perspektive genetske raznovrstnosti. Raziskovalni rezultati predlaganega projekta bodo tako predstavljali osnovo za natančen razvoj okoljsko odpornih kultivarjev.
Najpomembnejši znanstveni rezultati Vmesno poročilo, zaključno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati Vmesno poročilo, zaključno poročilo
Zgodovina ogledov
Priljubljeno