Lexikální databáze víceslovných jednotek v češtině

Speaker:
Milena Hnátková et al.
Abstract:
Výklad se zaměří na:

(a) komplexní typologii víceslovných jednotek v češtině (VLJ) (b) lexikální databázi obsahující VLJ charakterizované na základě této typologie

Typologie a databáze jsou motivovány těmito faktory:

(i) Typologie/klasifikace VLJ představuje podstatnou součást lingvistického modelu jazyka, neboť zachycují různé zvláštnosti a idiosynkrasie jazyka (zde češtiny) oproti standardním gramatickým a sémantickým pravidlům a strukturám. Typologie VLJ má též význam teoretický, neboť VLJ jsou zajímavé jazykové útvary na pomezí slovníku a gramatiky.

(ii) VLJ, formálně přesně popsané v lexikální databázi, přispějí ke zlepšení výsledků počítačového zpracování přirozeného jazyka, konkrétně morfologického značkování, parsingu, značkování lexikálních významů, případně i anotace sémantické. Zlepšení se přitom netýkají jen VLJ samých, ale i jejich kontextu ve větě.

(iii) VLJ zachycené v lexikální databázi bude možné značkovat a rozpoznávat v korpusech češtiny, a to nejen v jejich standardní, kanonické podobě, ale i v podobě jejich fragmentů a variant, zvláště na rovině morfologické, syntaktické a lexikální. Chceme tak zachytit kreativitu uživatelů jazyka, jež se odráží v různých druzích modifikacích standardních VLJ.

Lexikální databáze se dá mimoto použít v lexikografii, při výuce češtiny jako cizího jazyka apod.  

Length:
01:24:00
Date:
19/11/2018
views: 853

Images:
Attachments: (video, slides, etc.)
77 MB
467 downloads
759 MB
854 downloads
147 MB
502 downloads
211 MB
498 downloads
430 MB
562 downloads