Content Analysis of Textbooks via Natural Language Processing: Findings on Gender, Race, and Ethnicity in Texas U.S. History Textbooks
2020. november 24-én, 10 órától Demszky Dorottya tart előadást a Társadalomtudományi Kutatóközpont MILAB projekt keretében: Content Analysis of Textbooks via Natural Language Processing: Findings on Gender, Race, and Ethnicity in Texas U.S. History Textbooks címmel.
Az előadó a Stanford University NLP csoportjának tagja, mely vezetőnek számít a szövegbányászat területén.
Az előadás absztraktja:
Cutting-edge data science techniques can shed new light on fundamental questions in educational research. We apply techniques from natural language processing (lexicons, word embeddings, topic models) to 15 U.S. history textbooks widely used in Texas between 2015 and 2017, studying their depiction of historically marginalized groups. We find that Latinx people are rarely discussed, and the most common famous figures are nearly all White men. Lexicon-based approaches show that Black people are described as performing actions associated with low agency and power. Word embeddings reveal that women tend to be discussed in the contexts of work and the home. Topic modeling highlights the higher prominence of political topics compared with social ones. We also find that more conservative counties tend to purchase textbooks with less representation of women and Black people. Building on a rich tradition of textbook analysis, we release our computational toolkit to support new research directions.
Az előadás magyar nyelvű. Az előadó az előadás során ki fog térni az említett módszerek magyar szövegekre vonatkozó lehetséges alkalmazásaira.
A rendezvényt a járványügyi szabályok betartása mellett hibrid formában tartjuk. A részvétel regisztrációhoz kötött. Regisztrálni 2020. november 20-ig az alábbi linken lehet.