Nyelvtechnológiai szemináriumsorozat: Tensor decomposition for verb argument structure analysis
A Nyelvtechnológiai szemináriumsorozat következő előadását Makrai Márton (ELKH TTK) tartja június 3-án, 14:30-tól, "Tensor decomposition for verb argument structure analysis" címmel.
A tenzorok a mátrixok általánosításai: ahogy a mátrixok két tengely (sorok és oszlopok) mentén elrendezve tartalmaznak számokat, a tenzoroknak több tengelyük (avagy módjuk) van. A különféle tenzorfelbontások a mátrixos szingulárisérték-felbontásának általánosításai, és a céljuk is hasonló: látens jelentés modellezése, zajcsökkentés, magasabb rendű együttes előfordulások modellezése (vagyis amikor két szó hasonló kontextusokban jelenik meg), vagy az adatritkaság csökkentése. Kísérleteinkben az alanyok, igék és tárgyak közötti asszociáció különféle mértékeivel benépesített tenzorokat bontunk fel. Az tesztelt asszociációs mértékek közül kiemelkedik a normalizált pontonkéni kölcsönös információ, amit tudomásunk szerint még nem használtak a háromváltozós esetben. Először alany-ige-tágy hármasok hasonlóságát modellezzük, majd a nem-negítv Tucker-felbontás látens dimenziót nézegetve szemantoszintaktikai igeosztályokat (Levin 1993) fedezünk fel.