(a) komplexní typologii víceslovných jednotek v češtině (VLJ) (b) lexikální databázi obsahující VLJ charakterizované na základě této typologie
Typologie a databáze jsou motivovány těmito faktory:
(i) Typologie/klasifikace VLJ představuje podstatnou součást lingvistického modelu jazyka, neboť zachycují různé zvláštnosti a idiosynkrasie jazyka (zde češtiny) oproti standardním gramatickým a sémantickým pravidlům a strukturám. Typologie VLJ má též význam teoretický, neboť VLJ jsou zajímavé jazykové útvary na pomezí slovníku a gramatiky.
(ii) VLJ, formálně přesně popsané v lexikální databázi, přispějí ke zlepšení výsledků počítačového zpracování přirozeného jazyka, konkrétně morfologického značkování, parsingu, značkování lexikálních významů, případně i anotace sémantické. Zlepšení se přitom netýkají jen VLJ samých, ale i jejich kontextu ve větě.
(iii) VLJ zachycené v lexikální databázi bude možné značkovat a rozpoznávat v korpusech češtiny, a to nejen v jejich standardní, kanonické podobě, ale i v podobě jejich fragmentů a variant, zvláště na rovině morfologické, syntaktické a lexikální. Chceme tak zachytit kreativitu uživatelů jazyka, jež se odráží v různých druzích modifikacích standardních VLJ.
Lexikální databáze se dá mimoto použít v lexikografii, při výuce češtiny jako cizího jazyka apod.