Des chercheurs de l'Université de Cornell ont découvert que les systèmes d'intelligence artificielle conçus pour identifier les commentaires offensants de "discours de haine" signalent les commentaires prétendument faits par les minorités "à des taux beaucoup plus élevés" que les remarques faites par les Blancs.
Plusieurs universités maintiennent des systèmes d'intelligence artificielle conçus pour surveiller les sites Web de médias sociaux et signaler les utilisateurs qui affichent des "discours haineux". Dans une étude publiée en mai, des chercheurs de Cornell ont découvert que les systèmes "signalent" plus souvent les tweets qui proviennent des utilisateurs noirs des médias sociaux, selon Campus Reform.
Les auteurs de l'étude ont constaté que, selon la définition des systèmes d'IA du discours offensant, "les tweets écrits en anglais afro-américain sont abusifs à des taux considérablement plus élevés".
L'étude a également révélé que les tweets correspondant à des utilisateurs noirs sont deux fois plus sexistes que ceux correspondant à des utilisateurs blancs.
L'équipe de recherche a déclaré que les résultats inattendus pouvaient s'expliquer par les "préjugés raciaux systématiques" affichés par les êtres humains qui ont aidé à repérer le contenu offensant.
"Les résultats montrent des preuves de préjugés raciaux systématiques dans tous les ensembles de données, car les logiciels classificateurs formés sur ces bases de données ont tendance à prédire que les tweets écrits en anglais afro-américain sont abusifs à des taux considérablement plus élevés", peut-on lire dans le résumé de l'étude. "Si ces systèmes de détection de langage abusif sont utilisés sur le terrain, ils auront donc un impact négatif disproportionné sur les utilisateurs afro-américains des médias sociaux."
L'un des auteurs de l'étude a déclaré que les "préjugés internes" sont peut-être à blâmer en ce que l'anglais afro-américain pourrait être plus perçu comme une langue offensante".
Il existe d'autres technologies de censure antiraciste
La technologie automatisée d'identification des discours de haine n'est pas nouvelle, et les universités ne sont pas les seules à l'élaborer. Il y a deux ans, Google a dévoilé son propre système appelé "Perspective", conçu pour évaluer les phrases et les expressions en fonction de leur degré de "toxicité".
Peu après la sortie de Perspective, le youtubeur Tormental a réalisé une vidéo du programme au travail, alléguant des incohérences dans sa mise en œuvre. Le système a jugé que les commentaires préjudiciables à l'égard des minorités étaient plus "toxiques" que les déclarations équivalentes à l'égard des Blancs. Le système de Google a montré un écart similaire noirs/blancs pour les commentaires religieux moralisateurs dirigés contre les femmes par rapport aux hommes.
Par Kyle Hooten | 21 août 2019
Traduction : Julien Martel.
Colleges Create AI to Identify ‘Hate Speech’ – Turns Out Minorities Are the Worst Offenders
By Kyle Hooten | Aug 21, 2019
Researchers from the University of Cornell discovered that artificial intelligence systems designed to identify offensive “hate speech” flag comments purportedly made by minorities “at substantially higher rates” than remarks made by whites.
Several universities maintain artificial intelligence systems designed to monitor social media websites and report users who post “hate speech.” In a study published in May, researchers at Cornell discovered that systems “flag” tweets that likely come from black social media users more often, according to Campus Reform.
The study’s authors found that, according to the AI systems’ definition of abusive speech, “tweets written in African-American English are abusive at substantially higher rates.”
The study also revealed that “black-aligned tweets” are “sexist at almost twice the rate of white-aligned tweets.”
The research team averred that the unexpected findings could be explained by “systematic racial bias” displayed by the human beings who assisted in spotting offensive content.
“The results show evidence of systematic racial bias in all datasets, as classifiers trained on them tend to predict that tweets written in African-American English are abusive at substantially higher rates,” reads the study’s abstract. “If these abusive language detection systems are used in the field they will, therefore, have a disproportionate negative impact on African-American social media users.”
MORE: Leaked FBI Report Shows Left-Wingers Are a Bigger Threat Than White Supremacists
One of the study’s authors said that “internal biases” may be to blame for why “we may see language written in what linguists consider African American English and be more likely to think that it’s something that is offensive.”
More From The Web
Recommended by
Other Anti-Racist Censorship Technologies Exist
Automated technology for identifying hate speech is not new, nor are universities the only parties developing it. Two years ago, Google unveiled its own system called “Perspective,” designed to rate phrases and sentences based on how “toxic” they might be.
Shortly after the release of Perspective, YouTube user Tormental made a video of the program at work, alleging inconsistencies in implementation.
MORE: Dem Presidential Candidate Vows to Fingerprint Gun Owners to Fight ‘Rising’ White Nationalism
According to Tormental, the system rated prejudicial comments against minorities as more “toxic” than equivalent statements against white people.
Google’s system showed a similar discrepancy for bigoted comments directed at women versus men.
Aucun commentaire:
Enregistrer un commentaire