Primena jezičkih tehnologija

"Jezičke tehnologije" je termin koji obuhvata skup već razvijenih softverskih algoritama, alata i resursa namenjenih za obradu tekstova na prirodnim jezicima u računarstvu. Iako bi se ova grupa istraživačkih aktivnosti možda mogla da svrsta u proces digitalizacije znanja o jeziku, a time i u prethodnu grupu istraživačkih aktivnosti Centra, mi smo je zbog njenih specifičnosti i velike primene ipak izdvojili u zasebnu.

Primena jezičkih tehnologija u biološkim i biotehničkim naukama obuhvata:

Sve navedene aktivnosti su veoma razvijene u svetu. U biotehnologiji, ontologije se uglavnom koriste za anotaciju podataka kao što su sekvence, geni, eksperimenti i sl. Tako označeni podaci dalje mogu biti korišćeni na veliki broj načina, na primer za povezivanje baza podataka, za omogućavanje veoma komplikovanih pretraga, za obezbeđivanje okvira za tumačenje rezultata istraživanja, za razmenu znanja i dr. Danas postoje već razvijene ontologije iz oblasti bioloških i biotehničkih nauka, kao što su AGROVOC, Gene Ontology, EUROVOC, Plant Ontology i dr.

U poslednje vreme posebno intenzivno se razvija oblast nazvana istraživanje teksta (eng. text mining). U okviru ove olasti razvijaju se tehnike kojima se iz velikih kolekcija tekstova (na primer, skup naučnih članaka nekog časopisa ili digitalizovane enciklopedije iz neke oblasti) izdvajaju neke specifične informacije i znanja. Posebno je značajna za istraživanje medicinske i biološke literature.

Situacija je sasvim drugačija kada su je u pitanju naša zemlja i resursi za srpski jezik. Kod nas, ova oblast je poznata samo uskom krugu istraživača. Istraživači drugih nauka, koji su u stvari potencijalni korisnici metoda i alata jezičkih tehnologija, još uvek ne znaju ništa o mogućnostima koje im se pružaju. Takođe, resursi za srpski jezik su nedovoljno razvijeni, posebno u poređenju sa resursima za engleski jezik. Razlozi za tako nešto su ekonomske prirode, zatim mali broj ljudi koji govori srpski jezik u odnosu na engleski, ali i specifičnosti srpskog jezika, na prvom mestu njegova bogata morfologija. Neki od razvijenih resursa za srpski jezik mogu se naći na sajtu Grupe za jezičke tehnologije Univerziteta u Beogradu.