TK MILAB Speaker Series - Az oltásellenesség változó arcai - szövegklasszifikációk időbeli stabilitása
Folytatódik a Társadalomtudományi Kutatóközpont Mesterséges Intelligencia Nemzeti Laboratórium TK MILAB Speaker Series online rendezvénysorozata, melynek során online kutatásbeszámolókat, beszélgetéseket tart a mesterséges intelligencia társadalmi hatásairól. A sorozat következő állomása 2023. január 17-én 10:00 órától „Az oltásellenesség változó arcai - szövegklasszifikációk időbeli stabilitása” címmel kerül megrendezésre.
Előadó: Kmetty Zoltán (TK CSS-RECENS)
Absztrakt:
A szövegbányászati kutatások jelentős részében alkalmaznak valamilyen klasszifikációs modellt. A jelenlegi state-of-the-art megoldások jellemzően mélytanuláson alapuló transzformer modellekre épülnek, ilyen például a magyar nyelven is elérhető BERT (huBERT). Ezeknek a modelleknek a használatához először a kutató csapatnak kell annotálnia egy nagyobb szövegmennyiséget. Ezt követően a modell segítségével, jó hatásfokkal (akár 80-90%) klasszifikálhatók a további tartalmak. De mi történik akkor, ha a kódolási időszak után újabb adatok keletkeznek? Ez a digitális adatoknál nem ritka, mivel szemben az általában csak keresztmetszeti survey kutatásokkal, a digitális térben minden nap minden percében újabb és újabb cikkek, posztok és kommentek születnek. Vajon meddig jó az annotált adatbázisunk? És honnan tudjuk, ha már nem jó?
Előadásunkban oltásellenességgel kapcsolatos kommenteken mutatjuk be, hogyan lehet vizsgálni a tematika elmozdulását egy korpuszon belül és hogyan lehet erre újrakódolás nélkül felkészíteni a nyelvi modelljeinket.
Az előadás magyar nyelven, online, Zoom alkalmazáson kerül megrendezésre, az eseményen való részvétel regisztrációhoz kötött.