Zkušenosti z prakticky orientovaných projektů využívajících PDT

Speaker:
M. Jakubicek, V. Kovar (MU Brno)
Abstract:
Na prednasce budou prezentovany zkusenosti s vyuzivanim Prazskeho zavislostniho korpusu (PDT) - zejmena jeho analyticke, castecne i tektogramaticke roviny - pro prakticke reseni projektu v oblasti NLP. Jedna se o projekty vyvoje a vyhodnoceni noveho syntaktickeho analyzatoru SET vyvijeneho v Centru zpracovani prirozeneho jazyka FI MU, extrakce a anotace klauzi, jmennych a predlozkovych frazi a extrakce anafor z bezneho textu. Na konkretnich prikladech budou demonstrovany nejcastejsi problemy, s nimiz jsme se pri reseni techto projektu setkali: - nekonzistence v anotaci, - potize pri extrakci jednodussich informaci (napr. jmennych frazi) ze zavislostnich dat apod. V zaveru uvedeme nekolik navrhu metod, ktere by mohly nektere problemy vyresit, pripadne pomoci lepe se zorientovat ve strukture dat PDT.
Length:
01:23:10
Date:
15/11/2010
views: 864

Images:
Preview of img-002.jpg
Image img-002.jpg
Preview of img-047.jpg
Image img-047.jpg
Preview of img-051.jpg
Image img-051.jpg
Attachments: (video, slides, etc.)
38M
371 downloads
104M
382 downloads
450M
380 downloads
893K
652 downloads