Nalaganje ...
Projekti / Programi vir: ARIS

Inteligentna analiza podatkov, računalniška logika in jezikoslovje

Obdobja
Raziskovalna dejavnost

Koda Veda Področje Podpodročje
2.07.00  Tehnika  Računalništvo in informatika   
2.06.00  Tehnika  Sistemi in kibernetika   

Koda Veda Področje
P176  Naravoslovno-matematične vede  Umetna inteligenca 
B110  Biomedicinske vede  Bioinformatika, medicinska informatika, biomatematika, biometrija 
H350  Humanistične vede  Jezikoslovje 
B003  Biomedicinske vede  Ekologija 
P175  Naravoslovno-matematične vede  Informatika, teorija sistemov 
P110  Naravoslovno-matematične vede  Matematična logika, teorija množic, kombinatorika 
Ključne besede
računalništvo in informatika, umetna inteligenca, informacijski sistemi, analiza podatkov, induktivno logično programiranje, logično programiranje z omejitvami, računalniško jezikoslovje, jezikovne tehnologije, medicinska informatika, analiza podatkov o okolju
Vrednotenje (pravilnik)
vir: COBISS
Raziskovalci (7)
št. Evidenčna št. Ime in priimek Razisk. področje Vloga Obdobje Štev. publikacijŠtev. publikacij
1.  05806  dr. Bojan Cestnik  Računalništvo in informatika  Raziskovalec  2001 - 2003  197 
2.  11130  dr. Sašo Džeroski  Računalništvo in informatika  Raziskovalec  2001 - 2003  1.204 
3.  05023  dr. Tomaž Erjavec  Jezikoslovje  Raziskovalec  2001 - 2003  636 
4.  20243  dr. Branko Kavšek  Računalniško intenzivne metode in aplikacije  Raziskovalec  2001 - 2003  134 
5.  08949  dr. Nada Lavrač  Računalništvo in informatika  Vodja  2001 - 2003  869 
6.  16302  dr. Ljupčo Todorovski  Računalništvo in informatika  Raziskovalec  2001 - 2003  443 
7.  22279  dr. Bernard Ženko  Računalništvo in informatika  Raziskovalec  2002 - 2003  172 
Organizacije (1)
št. Evidenčna št. Razisk. organizacija Kraj Matična številka Štev. publikacijŠtev. publikacij
1.  0106  Institut "Jožef Stefan"  Ljubljana  5051606000  90.742 
Povzetek
Na vseh področjih človekovega delovanja smo priča razkoraku med količino ustvarjenih podatkov, ki se shranjujejo na elektronskih medijih, ter človekovo sposobnostjo razumevanja teh podatkov. Cilj programa je razvoj in uporaba metod umetne inteligence za računalniško analizo podatkov, ki sodijo na področje odkrivanja zakonitosti v podatkovnih bazah (KDD - Knowledge Discovery in Databases) in inteligentne analize podatkov (IDA - Intelligent Data Analysis). Te metode bomo razvijali v tesni povezavi z izsledki računalniške logike (Computational Logic), predvsem induktivnega logičnega programiranja (ILP - Inductive Logic Programming), logičnega programiranja z omejitvami (CLP - Constraint Logic Programming) in računalniškega jezikoslovja (Computational Linguistics). Vezni člen v raziskavah je zahteva po čim večji uporabi človekovega znanja pri reševanju problemov in analizi podatkov ter čim boljši razumljivosti odkritih rešitev, kar omogoča uporaba logičnih formalizmov za predstavitev znanja. Na področju inteligentne analize podatkov bo raziskovalni program usmerjen v razvoj novih in izpopolnjevanje obstoječih računalniških metod strojnega učenja, predvsem induktivnega logičnega programiranja. Razvite metode bomo uporabili na različnih področjih ter jih tudi prilagajali zahtevam izbranega področja. Poseben poudarek bo na uporabi razvitih metod za reševanje naslednjih praktičnih problemov:- analiza medicinskih podatkov in sinteza diagnostičnih in prognostičnih pravil (pri ishem. bolezni srca, epilepsiji, itd.),- analiza podatkov o okolju (podatkov o kakovosti rečnih voda, modeliranje populacij gozdnih živali, itd.),- analiza ekonomsko-poslovnih podatkov (podatkov o podjetjih, prodaji, itd.).Pri modeliranju problemov z metodami logičnega programiranja z omejitvami je za učinkovito reševaje problemov potrebno v model vključiti znanje o domeni ter izkušnje o modeliranju podobnih tipov problemov. To lahko dosežemo v sodelovanju z eksperti. Raziskave v tem programu pa bodo namenjene avtomatskemu generiranju tovrstnega znanja z uporabo metod strojnega učenja. Metode logičnega programiranja z omejitvami bomo uporabili za analizo in reševanje kompleksnih kombinatoričnih problemov na različnih področjih (razporejanje poslov in virov, izgradnja urnikov, itd.).Na področju računalniške lingvistike (Computational Linguistics) in jezikovnih tehnologij (Language Technologies) bomo v okviru programa zbirali in analizirali tekstovne podatke. Poudarek bo na zajemu in gradnji slovenskih in večjezičnih jezikovnih virov, predvsem korpusov in slovarjev. Razvijali bomo oblikoslovne, skladenjske in prevodne jezikovne modele slovenskega jezika, pri čemer bomo uporabljali tudi metode strojnega učenja, predvsem induktivnega logičnega programiranja.
Pomen za razvoj znanosti
Že program Fourth Framework Evropske unije ugotavlja, da so adaptivnost in odkrivanje znanja iz podatkov izjemnega pomena za izboljšanje delovnih in administrativnih procesov. Pri večjih problemih s tega področja, ki so prioritetnega značaja za uporabnike, je prisotna potreba po odkrivanju znanja iz tekstovnih in relacijskih podatkov, tj. podatkov, ki jih lahko obravnavamo z metodami računalniške lingvistike in induktivnega logičnega programiranja. Z naraščanjem količine shranjenih podatkov (Data Warehousing) narašča tudi zavedanje o ključnem pomenu strukturiranih podatkov in relacij med njimi za področja uporabe kot so biologija, ekologija in upravljanje z okoljem, inženirstvo in medicina. Raziskave inteligentne analize podatkov, odkrivanja zakonitosti v podatkovnih bazah in računalniške lingvistike so v svetu v izjemnem razcvetu, kar dokazujejo nove konference, znanstvene revije in knjige s tega področja. Podobno velja tudi za logično programiranje z omejitvami, ki se je v zadnjih nekaj letih izkazalo kot najprodornejše področje računalniške logike. Raziskovalni program bo prispeval k razvoju metod induktivnega logičnega programiranja ter uporabe metod strojnega učenja za analizo podatkov v ekologiji in medicini ter k razvoju in analizi slovenskih jezikovnih virov. Prispeval bo tudi k razvoju metod za učinkovitejše reševanje sistemov omejitev.
Pomen za razvoj Slovenije
Program bo prispeval k razvoju slovenske znanosti na področju odkrivanja zakonitosti v podatkovnih bazah, računalni-škega jezikoslovja in računalniške logike, predvsem induktivnega logičnega programiranja in logičnega programiranja z omejitvami. Skrbeli bomo tudi za popularizacijo teh področij ter širjenje znanj o navedenih področjih v Sloveniji.Razvili bomo nove algoritme strojnega učenja za analizo podatkov, ki bodo omogočali uporabo strokovnega znanja o problemu, razumljivost naučenih pravil ter uporabnost za raziskave in reševanje praktičnih problemov. Nadaljevali bomo z analizo slovenskih podatkov o okolju (v sodelovanju s Hidrometeorološkim zavodom Slovenije in Oddelkom za gozdarstvo Biotehniške fakultete v Ljubljani). Izsledki analiz bi lahko prispevali k izboljšanju spremljanja in ocenjevanja kako-vosti rečnih voda ter k izboljšanju upravljanja populacij gozdnih živali. Nadaljevali bomo z analizo medicinskih podatkov (v sodelovanju z raziskovalci Medicinske fakultete in zdravniki UKC v Ljubljani), kjer bi uporaba metod za inteligentno analizo podatkov lahko pomembno doprinesla k zmanjšanju števila preiskav, kvalitetnejšemu spremljanju zdravstvenega stanja bolnikov ter hitrejši diagnostiki. Algoritme logičnega programiranja z omejitvami bomo uporabili na zahtevnih optimizacijskih problemih za izboljšanje produktivnosti slovenskih podjetij, predvsem na podr. strojništva.Prihodnost slovenščine je vezana tudi na razvitost jezikovnih tehnologij za naš jezik, še posebej z razvojem informacijskih tehnologij in vključevanja Slovenije v Evropsko unijo. Najbolj akutno je pomanjkanje podpore prevajanju, iskanju informacij, slovaropisju in terminologiji. Nadaljevanje dela na izgradnji računalniških virov (v sodelovanju z DZS d.d. in Amebis d.o.o.) in modelov slovenskega jezika ima namen nuditi konkretne rešitve na tem področju in spodbuditi razvoj tega, zaenkrat skoraj neobstoječega področja v Sloveniji.
Najpomembnejši znanstveni rezultati Zaključno poročilo
Najpomembnejši družbeno–ekonomsko in kulturno relevantni rezultati Zaključno poročilo
Zgodovina ogledov
Priljubljeno