TK MILAB Speaker Series - Klasszikus regresszió vs. gépi tanulás az előrejelzésben és az oksági magyarázatban
A Társadalomtudományi Kutatóközpont Mesterséges Intelligencia Nemzeti Laboratórium TK MILAB Speaker Series néven indította el online rendezvénysorozatát 2021.tavaszán, melynek során online kutatásbeszámolókat, beszélgetéseket tart a mesterséges intelligencia társadalmi hatásairól.
A sorozat következő állomása 2023. január 24-én 13:00 órától „Klasszikus regresszió vs. gépi tanulás az előrejelzésben és az oksági magyarázatban” címmel kerül megrendezésre.
Előadó: Janky Béla (TK CSS-RECENS)
Absztrakt:
A korszerű gépi tanulási eljárások a nemlineáris kapcsolatok és interakciók komplex rendszereit ragadják meg; így elvileg sokkal alkalmasabbak komplex összefüggések felfedezésére mint a legtöbb társadalomtudós által jelenleg használt klasszikus lineáris regressziós technikák. Azonban nem evidens, hogy a számos fontos változót nélkülöző vagy rosszul mérő társadalomtudományi elemzések valóban tudnának-e profitálni gépi tanulási eljárások alkalmazásából.
Az előadásban a TK MILAB oksági gépi tanulással foglalkozó részprojektjének két, a fenti kérdésre választ kereső elemzését mutatjuk be.
Az első elemzésben korszerű gépi tanulási eljárások és a klasszikus lineáris regresszió előrejelző erejét hasonlítjuk össze adatszegény környezetben. Kérdőíves felmérések válaszolóinak etnikai minősítését jelezzük előre. Eredményeink azt mutatják, hogy a gépi tanulási eljárások pontossága messze meghaladja a regressziós technikáét, és kevés adat alapján is nagy pontosságra képesek. Ez tartalmilag azt jelenti, hogy az általunk használt felmérésekben definiált etnikum sokkal erősebben szociális kategória, mint ahogy a regressziós elemzések alapján korábban gondoltuk.
A második elemzésben egy népszerű új oksági gépi tanulási technika (dupla gépi tanulás) hatásbecslését vetjük össze a regresszióéval e célra generált speciális szintetikus adatbázisok felhasználásával. Szemben egyes korábbi eredményekkel, elemzésünk azt mutatja, hogy a lineáris regresszió komplex adatösszefüggések esetén is a gépi tanuláshoz hasonlóan nagy pontossággal tudja becsülni kezelések átlagos hatását. További kutatások szükségesek annak azonosítására, hogy milyen jellegű összefüggések és elemzési célok esetén mutatkozhat meg az oksági gépi tanulási eljárások nagyobb pontossága.
Az előadás magyar nyelven, online, Zoom alkalmazáson kerül megrendezésre, az eseményen való részvétel regisztrációhoz kötött.