TK MILAB Speaker Series - Solving Multi-Class Classification for Low Resource Languages with Large Language Models
A Társadalomtudományi Kutatóközpont Mesterséges Intelligencia Nemzeti Laboratórium TK MILAB Speaker Series online rendezvénysorozatának következő állomása 2022. február 8-án 13:00 órától „Solving Multi-Class Classification for Low Resource Languages with Large Language Models” címmel kerül megrendezésre.
Előadó: Máté Ákos (TK PTI-poltextLAB)
Moderátor: Ring Orsolya (TK PTI-poltextLAB)
Absztrakt:
Az előadás célja annak bemutatása, hogy az NLP területén elért legújabb fejlesztések hogyan használhatók fel a társadalomtudományi kutatásokban. A nemrégiben kifejlesztett Transformer vagy nagyméretű nyelvi modellek lehetővé teszik a nagyméretű, előre betanított modellek finomhangolását, ami a hagyományos gépi tanulási megközelítésekhez képest alacsonyabb összköltséget és jobb teljesítményt jelent. Egy finomhangolt BERT-modellt használunk a magyar és a lengyel törvényszövegek közötti transzfer tanulás alkalmazására az Comparative Agendas Project (CAP) kódolási sémájának felhasználásával, amely a közpolitikai tartalmat osztályozza a politikai beszédektől a törvényekig terjedő korpuszok széles skáláján. Az eredmények azt mutatják, hogy a finomhangolt modell felülmúlja a hagyományos felügyelt tanulási benchmarkokat (Support Vector Machines, Naïve Bayes és Multinomiális regresszió) a pontosság tekintetében. Ez a megközelítés életképes megoldást mutat a transzfer tanulás keretrendszerének alkalmazására kisebb nyelvek esetében.
Az előadás magyar nyelven, online, Zoom alkalmazáson kerül megrendezésre, az eseményen való részvétel regisztrációhoz kötött, melyhez a kitöltendő űrlapot ide kattintva éri el. Az esemény linkjét külön e-mailben küldik a szervezők a regisztrált résztvevőknek.