Rozpoznávání plagiátů v psaném textu

Speaker:
Zdeněk Česka
Abstract:
Rostouci popularita Internetu a zvysujici se dostupnost nejruznejsich dokumentu vede k potrebe efektivne rozpoznavat plagiaty textovych dokumentu. Skolstvi je jednou z mnoha instituci, kde dopad na kvalitu vyuky je markantni. Nas vyzkum na ZCU se zabyva pokrocilymi technikami a jejich vyuzitim pro detekci plagiatu. Zakladnim stavebnim prvkem je latentni semanticka analyza pro nalezeni skrytych vztahu mezi frazemi v textu. V tomto smeru se nejvice venujeme matematicke metode SVD a jeji aplikaci. Krome toho se zabyvame normalizaci textu s vyuzitim WordNet tezauru a vlivem ruznych technik predzpracovani, jako jsou stop-slova, lemmatizace a nahrazovani cisel. V nasich testech pracujeme s experimentalnim korpusem ceskych plagiatu citajicim 950 dokumentu o politice, vytvorenym z CTK korpusu.
Length:
01:13:01
Date:
10/11/2008
views: 1702

Images:
Preview of img021.jpg
Image img021.jpg
Preview of img037.jpg
Image img037.jpg
Attachments: (video, slides, etc.)
33M
1403 downloads
336M
1703 downloads
474M
1357 downloads
156M
1383 downloads