Modelování slovotvorných vztahů ve slovní zásobě češtiny

Speaker:
Magda Ševčíková
Abstract:
V příspěvku budu informovat o pokrocích ve vývoji lexikální databáze DeriNet a rozeberu tři témata, kterým je v rámci projektu aktuálně věnována významná pozornost. Databáze DeriNet je jako jazykový zdroj specializovaný na derivační morfologii češtiny budována v Ústavu formální a aplikované lingvistiky MFF UK, mezi více než 1 milionem lexémů se zatím podařilo identifikovat 774 tisíc derivačních vztahů. Prvním z témat probíraných v příspěvku jsou hláskové alternace, které jsou pro poloautomatické metody identifikace derivačních vztahů zásadním problémem. Dále se zaměřím na kategorii slovesného vidu, tato flektivní kategorie českého slovesa je vyjadřována slovotvornými prostředky. Kategorie vidu byla spolu s dalšími rysy použita jako jedno z kritérií při uspořádávání příbuzných sloves do derivačního stromu. V závěru příspěvku - jako téma třetí - bude zachycování sloves odvozených od sloves představeno komplexně. Všechna tři témata jsou vzájemně provázána, ve všech jsou úzce propojeny aspekty teoretické a komputační lingvistiky.
Length:
00:47:15
Date:
29/05/2017
views: 1155

Images:
Attachments: (video, slides, etc.)
65 MB
631 downloads
487 MB
1156 downloads
88 MB
704 downloads
129 MB
619 downloads
265 MB
652 downloads