Home Bots & Brains Utopia AI analyseert aanzetten tot haat op social media

Utopia AI analyseert aanzetten tot haat op social media

door Marco van der Hoeven

Uit een onderzoek van Utopia Analytics, in opdracht van het Ministerie van Justitie in Finland, blijkt dat online haatzaaiende uitlatingen het vaakst voorkomen op discussieforums. Uit het onderzoek blijkt dat op discussieforums 97% van de geïdentificeerde haatzaaiende berichten staat. De op een na grootste platformtypes zijn Twitter-berichten met 2,5% en Instagram-berichten met 0,2%. Blogs, nieuwscommentaar en openbare Facebook-berichten vormen minder dan 0,02% van alle geïdentificeerde haatzaaiende uitlatingen. De dataset bevatte geen privédiscussies, bijvoorbeeld Facebook-groepen of accounts.

Het project, onderdeel van het Facts Against Hate-programma van het ministerie van Justitie, liet het vermogen zien van kunstmatige intelligentie om haatzaaiende uitlatingen in online omgevingen te herkennen. De aanpak combineerde menselijke evaluatie met machine learning. Een belangrijk doel was om de belangrijkste kanalen van haatzaaiende uitingen te vinden en verschillen in haatzaaiende taal van platform tot platform te identificeren.

Academisch onderzoek

De definitie van aanzetten tot haat was gebaseerd op academisch onderzoek in de sociale wetenschappen. De definitie bestond mede uit haatdragende taalcategorieën, die vervolgens zijn gebruikt om handmatig voorbeelden van haatzaaiende uitlatingen in een dataset van online berichten te identificeren. Deze annotaties werden weer ingezet als trainingsgegevens voor de Utopia AI Moderator, een taalonafhankelijke tool die gebruikmaakt van tekstanalyse en machine learning. De dataset bestond uit 12 miljoen Finse commentaren en posts van september tot oktober 2020.

De resultaten laten zien dat elke maand ongeveer 150.000 berichten met haatzaaiende uitlatingen op openbare Finse sociale mediaplatforms verschijnen. Dat is ongeveer 1,8% van alle berichten.

Twitter

Van de openbare internationale sociale mediaplatforms lijkt Twitter het meest prominent aanwezig, met 7.450 berichten die worden geïdentificeerd als haatdragende taal, of 0,14% van alle tweets. Retweets spelen een belangrijke rol bij het verspreiden van deze berichten: 39% van alle haatdragende tweets zijn duplicaten.

“Hoewel de dataset voornamelijk uit Finse berichten bestond”, zegt dr. Mari-Sanna Paukkeri, CEO van Utopia, “zullen de resultaten in andere talen sterk op elkaar lijken. Het belangrijkste platform voor Finse aanzetten tot haat, Ylilauta, is bijvoorbeeld een peer van het algemeen bekende 4chan. Bovendien kunnen we in slechts twee weken een soortgelijk AI-model bouwen om haatdragende taal in elke taal te identificeren. We hebben alleen een bekwaam persoon nodig om te zeggen hoe haatzaaiende uitlatingen in een bepaalde cultuur en taal moeten worden gedefinieerd, en we hebben de gegevens nodig om te analyseren.”

Misschien vind je deze berichten ook interessant