Automatické párování uzlů českých a anglických tektogramatických stromů
Speaker:
David Mareček
Abstract:
Úkolem párování je nalézt pro slova anglické věty jejich protějšky v českém překladu. V přednášce budou prezentovány rozdíly mezi párováním na morfologické a tektogramatické rovině, dále způsob, jakým lze morfologické párování převést na tektogramatické a jak se v tomto případě změní mezianotátorská shoda. Následně bude popsán hladový algoritmus pro automatické párování tektogramatických stromů, který využívá podobnosti stromových struktur, a jeho úspěšnost bude ověřena na ručně spárovaných větách. Experimenty byly prováděny zvlášť pro různé typy textů (právní texty, beletrie, novinové články).