HELSINKI–(BUSINESS WIRE)–Les discours de haine en ligne apparaissent le plus souvent sur les forums de discussion, d’apres une etude d’Utopia Analytics pour le ministere de la Justice finlandais. Le rapport revele que les forums de discussion recoivent 97 % des messages de discours de haine identifies. Les types de plateformes les plus importants ensuite sont les messages Twitter avec 2,5 % et les messages Instagram avec 0,2 %. Les blogs, les commentaires sur l’actualite et les messages Facebook publics representent moins de 0,02 % de l’ensemble des discours de haine identifies. L’ensemble de donnees n’incluait pas les discussions privees, comme les groupes ou comptes Facebook.

Le projet, qui fait partie du programme Facts Against Hate du ministere de la Justice, a teste la capacite de l’intelligence artificielle a reconnaitre les discours haineux dans les environnements en ligne. L’approche combinait l’evaluation humaine avec l’apprentissage automatique. L’un des objectifs cles etait de trouver les principaux canaux de diffusion des discours haineux, et d’identifier les differences entre les plateformes pour ce genre de discours.

La definition du discours de haine etait basee sur des recherches universitaires dans le domaine des sciences sociales. La definition a ete faite en produisant des categories de discours haineux, puis utilisee pour identifier manuellement des exemples de discours haineux dans un ensemble de donnees de messages en ligne. Ces annotations ont ensuite ete utilisees comme donnees d’apprentissage pour Utopia AI Moderator, un outil independant de la langue qui utilise l’analyse textuelle et l’apprentissage automatique. L’ensemble de donnees comportait 12 millions de commentaires et messages en finlandais, publies entre septembre et octobre 2020.

Les resultats montrent qu’environ 150 000 messages contenant des discours haineux apparaissent chaque mois sur les plateformes de reseaux sociaux finlandaises disponibles publiquement. Cela represente environ 1,8 % de l’ensemble des messages.

Parmi les plateformes de reseaux sociaux publiques internationales, Twitter semble etre la principale, avec 7 450 messages identifies comme etant des discours de haine, soit 0,14 % de tous les tweets. Les retweets jouent un role important dans la circulation de ces messages : 39 % de tous les tweets contenant des discours haineux sont des copies.

<>, a declare le Dr Mari-Sanna Paukkeri, PDG d’Utopia, <>

Bibliotheque multimedia/photos : https://utopiaanalytics.com/media-library

Le texte du communique issu d’une traduction ne doit d’aucune maniere etre considere comme officiel. La seule version du communique qui fasse foi est celle du communique dans sa langue d’origine. La traduction devra toujours etre confrontee au texte source, qui fera jurisprudence.