학술논문

Re-thinking large scale hate speech identification: beyond common NLP conventions and supervised machine learning
Document Type
Dissertation/Thesis
Source
TDX (Tesis Doctorals en Xarxa)
Subject
Hate speech detection
Machine learning conventions
Algorithmic challenges
Deteccio de discurs d’odi
Convencions d’aprenentatge automàtic
Reptes algorítmics
Language
English
Abstract
Abordar el discurs de l’odi als espais en línia s’ha conceptualitzat comuna tasca de classificació que utilitza t`ecniques d’intelligència artificial (IA), aprenentatge automàtic (ML) o processament del llenguatge natural (PNL). Mitjançant aquesta conceptualització, la tasca de detecció del discurs d’odi s’ha basat en les convencions i pr`actiques comunes d’aquests camps. Per exemple, l’acord entre anotadors es conceptualitza com una manera de mesurar la qualitat del conjunt de dades i s’utilitzen determinades m`etriques i punts de referència per inferir el rendiment del model. Tanmateix, el discurs de l’odi és un concepte profundament complex i situat que eludeix aquestes pràctiques estàtiques i incorpònies. En aquesta tesi aprofundeixo en els reptes de definici ó i les dificultatKeywordss pel que fa a la generalització de models, dos problemes que analitzo amb estudis empírics. A més, reflexiono críticament sobre les metodologies seguides, argumento que moltes convencions en PNL són poc adequades per al problema i animo els investigadors a desenvolupar mètodes més adequats per combatre el discurs d’odi en línia.
Programa de doctorat en Tecnologies de la Informació i les Comunicacions