Ce n’est un secret pour personne que la politique américaine est devenue très polarisée.
Malgré tout, il y a probablement peu d’Américains vivants qui ont jamais assisté à quelque chose qui se compare tout à fait au premier débat présidentiel de cet automne.
Était-ce vraiment le cas que la nation ne pouvait pas faire mieux qu’un combat alimentaire verbal, avec deux candidats se lançant des insultes de quatrième année et se parlant l’un après l’autre?
Pour nous, le débat discordant n’était qu’un symptôme de plus du discours civique effiloché de la nation, que, dans une étude récente, nous avons pu montrer s’étend aux mots que nous utilisons pour parler de politique.
Plus tôt cette année, nous avons commencé à construire un ensemble de données composé de tous les commentaires des téléspectateurs sur les vidéos YouTube publiées par quatre réseaux de télévision – MSNBC, CNN, Fox News et One America News Network – qui ciblent des tranches du spectre politique. Ensemble, l’ensemble de données contient plus de 85 millions de commentaires sur plus de 200 000 vidéos de 6,5 millions de téléspectateurs depuis 2014.
Nous avons étudié s’il existe des variantes distinctes de l’anglais écrites dans les sections de commentaires, semblables à la distinction entre l’anglais britannique et l’anglais américain.
En utilisant des méthodes d’apprentissage automatique, nous avons constaté que ces permutations existent. De plus, nous pouvons les classer en termes de « gauche » et de « droite ». »À notre connaissance, il s’agit de la première démonstration empirique de différences linguistiques quantifiables dans les audiences de l’information.
Notre deuxième découverte, cependant, était encore plus inattendue.
Notre système de traduction par apprentissage automatique a constaté que des mots avec des significations très différentes, comme « KKK » et « BLM », étaient utilisés exactement dans les mêmes contextes en fonction de la chaîne YouTube analysée.
L’entreprise conserve un mot
Lors de la traduction de deux langues différentes – par exemple, l’espagnol et l’anglais – les systèmes de traduction automatisés tels que Google Translate commencent par un grand ensemble de textes de formation dans les deux langues. Le système applique ensuite des méthodes d’apprentissage automatique pour améliorer la traduction.
Au fil des ans, cette technologie est devenue de plus en plus précise, grâce à deux informations clés.
Le premier remonte aux années 1950, lorsque le linguiste John Rupert Firth a mis au point l’aphorisme » Vous connaîtrez un mot par l’entreprise qu’il conserve. »
Pour les systèmes modernes de traduction automatique, la « société » qu’un mot conserve est son « contexte », ou les mots qui l’entourent. Par exemple, le mot anglais « grape » se produit dans des contextes tels que « jus de raisin » et « vigne de raisin », tandis que le mot équivalent en espagnol, uva, se produit dans les mêmes contextes – jugo de uva, vid de uva – dans les phrases espagnoles.
La deuxième découverte importante est venue assez récemment. Une étude de 2013 a trouvé un moyen d’identifier – et donc de lier – le contexte d’un mot dans une langue à son contexte dans une autre. La traduction automatique moderne dépend fortement de ce processus.
Ce que nous avons fait, c’est d’utiliser ce type de traduction d’une manière entièrement nouvelle: traduire l’anglais vers l’anglais.
Quand les « Trumptards » deviennent des « flocons de neige »
Cela peut sembler bizarre. Pourquoi traduire l’anglais vers l’anglais?
Eh bien, considérez l’anglais américain et l’anglais britannique. Beaucoup de mots sont les mêmes dans les deux langues. Pourtant, il peut y avoir des différences subtiles. Par exemple, « appartement » en anglais américain peut se traduire par « appartement » en anglais britannique.
Pour les besoins de notre étude, nous avons étiqueté la langue utilisée dans la section de commentaires de chaque réseau « MSNBC – Anglais », « CNN – Anglais », « Fox -Anglais » et « OneAmerica – Anglais. »Après avoir analysé les commentaires, nos algorithmes de traduction ont découvert deux modèles différents de « mots mal alignés » – des termes qui ne sont pas identiques dans les sections de commentaires mais qui sont utilisés dans les mêmes contextes.
Un type était similaire à « appartement » et « appartement », en ce sens que les deux décrivent ostensiblement la même chose. Cependant, les paires de mots que nous avons découvertes ont des intonations différentes. Par exemple, nous avons constaté que ce qu’une communauté appelle « Pelosi », l’autre appelle « Pelousy »; et « Trump » dans une langue d’actualité se traduit par « Drumpf » dans une autre.
Un deuxième – et plus profond – type de désalignement s’est produit lorsque les deux mots se réfèrent à deux choses fondamentalement différentes.
Par exemple, nous avons constaté qu’en CNN – anglais, « KKK » – l’abréviation du Ku Klux Klan – est traduit par notre algorithme en « BLM » – raccourci pour Black Lives Matter – en Fox – anglais. L’algorithme constate essentiellement que les commentaires d’une communauté sur KKK ressemblent beaucoup aux commentaires de l’autre sur BLM. Bien que les systèmes de croyance du KKK et du BLM soient à peu près aussi différents que possible, selon la section des commentaires, ils semblent chacun représenter quelque chose de similaire inquiétant et menaçant.
CNN-English et Fox-English ne sont pas les deux seules langues à afficher ce type de désalignements. La fin conservatrice du spectre elle-même se divise en deux langues. Par exemple, « masque » en Fox – anglais se traduit par « museau » en UnaMérique- anglais, reflétant les attitudes différentes entre ces sous-communautés.
Il semble y avoir une dualité miroir en jeu. « Conservatisme » devient « libéralisme », « rouge » se traduit par « bleu », tandis que « Cooper » se transforme en « Hannity ». »
Il ne manque pas non plus ce que l’on ne peut appeler que des injures enfantines.
« Trumptards » en CNN – Anglais se traduit par « flocons de neige » en Fox – Anglais; « Trumpty » en CNN – Anglais se traduit par « Obummer » en Fox – anglais; et « republicunts » en CNN – Anglais se traduit par « democraps » en Fox-Anglais.
Territoire inexploré
Les linguistes soulignent depuis longtemps à quel point une communication efficace entre des personnes ayant des croyances différentes nécessite un terrain d’entente. Nos résultats montrent que la façon dont nous parlons des questions politiques devient de plus en plus divergente; selon qui écrit, un mot commun peut être imprégné d’un sens tout à fait différent.
Nous nous demandons: À quelle distance sommes-nous du point de non-retour lorsque ces différences linguistiques commencent à éroder le terrain d’entente nécessaire à une communication productive?
Les chambres d’écho sur les médias sociaux ont-elles exacerbé la polarisation politique au point que ces désalignements linguistiques se sont enracinés dans le discours politique ?
Quand la « démocratie » dans une variante linguistique cessera-t-elle de se traduire en « démocratie » dans l’autre ?