Zkušenosti z prakticky orientovaných projektů využívajících PDT
Speaker:
M. Jakubicek, V. Kovar (MU Brno)
Abstract:
Na prednasce budou prezentovany zkusenosti s vyuzivanim Prazskeho zavislostniho korpusu (PDT) - zejmena jeho analyticke, castecne i tektogramaticke roviny - pro prakticke reseni projektu v oblasti NLP. Jedna se o projekty vyvoje a vyhodnoceni noveho syntaktickeho analyzatoru SET vyvijeneho v Centru zpracovani prirozeneho jazyka FI MU, extrakce a anotace klauzi, jmennych a predlozkovych frazi a extrakce anafor z bezneho textu. Na konkretnich prikladech budou demonstrovany nejcastejsi problemy, s nimiz jsme se pri reseni techto projektu setkali: - nekonzistence v anotaci, - potize pri extrakci jednodussich informaci (napr. jmennych frazi) ze zavislostnich dat apod. V zaveru uvedeme nekolik navrhu metod, ktere by mohly nektere problemy vyresit, pripadne pomoci lepe se zorientovat ve strukture dat PDT.