Fox News-Zuschauer schreiben über 'BLM' genauso wie CNN-Zuschauer über 'KKK schreiben'

Es ist kein Geheimnis, dass die US-Politik stark polarisiert ist.

Trotzdem gibt es wahrscheinlich nur wenige lebende Amerikaner, die jemals etwas gesehen haben, das mit der ersten Präsidentendebatte dieses Herbstes vergleichbar ist.

War es wirklich so, dass die Nation nichts Besseres tun konnte als einen verbalen Essenskampf, bei dem zwei Kandidaten Beleidigungen der vierten Klasse schleuderten und aneinander vorbeigingen?

Für uns war die diskordante Debatte nur ein weiteres Symptom des ausfransenden bürgerlichen Diskurses der Nation, den wir in einer kürzlich durchgeführten Studie auf die Wörter ausdehnen konnten, mit denen wir über Politik sprechen.

Anfang dieses Jahres begannen wir mit der Erstellung eines Datensatzes, der aus allen Zuschauerkommentaren zu YouTube–Videos besteht, die von vier Fernsehsendern – MSNBC, CNN, Fox News und One America News Network – gepostet wurden, die auf Teile des politischen Spektrums abzielen. Zusammen enthält der Datensatz über 85 Millionen Kommentare zu über 200.000 Videos von 6,5 Millionen Zuschauern seit 2014.

Wir haben untersucht, ob es in den Kommentaren unterschiedliche Varianten des Englischen gibt, ähnlich der Unterscheidung zwischen britischem Englisch und amerikanischem Englisch.

Mit Methoden des maschinellen Lernens haben wir festgestellt, dass diese Permutationen existieren. Darüber hinaus können wir sie in Bezug auf die „Linke“ und die „Rechte“ einordnen.“ Nach unserem besten Wissen ist dies der erste empirische Nachweis quantifizierbarer sprachlicher Unterschiede im Nachrichtenpublikum.

Unser zweiter Befund war jedoch noch unerwarteter.

Unser maschinelles lernendes Übersetzungssystem fand heraus, dass Wörter mit sehr unterschiedlichen Bedeutungen, wie „KKK“ und „BLM“, in genau den gleichen Kontexten verwendet wurden, abhängig von dem YouTube-Kanal, der analysiert wurde.

Die Firma a word hält

Bei der Übersetzung von zwei verschiedenen Sprachen – beispielsweise Spanisch und Englisch – beginnen automatisierte Übersetzungssysteme wie Google Translate mit einem großen Trainingssatz von Texten in beiden Sprachen. Das System wendet dann Methoden des maschinellen Lernens an, um besser übersetzen zu können.

Im Laufe der Jahre wurde diese Technologie dank zweier wichtiger Erkenntnisse immer genauer.

Der erste stammt aus den 1950er Jahren, als der Linguist John Rupert Firth den Aphorismus „You shall know a word by the company it keeps.“

Für moderne maschinelle Übersetzungssysteme ist das „Unternehmen“, das ein Wort hält, sein „Kontext“ oder die Wörter, die es umgeben. Zum Beispiel kommt das englische Wort „Traube“ in Kontexten wie „Traubensaft“ und „Weinrebe“ vor, während das äquivalente Wort auf Spanisch, uva, in denselben Kontexten vorkommt – jugo de uva, vid de uva – in spanischen Sätzen.

Die zweite wichtige Entdeckung kam erst vor kurzem. Eine Studie aus dem Jahr 2013 fand einen Weg, den Kontext eines Wortes in einer Sprache mit seinem Kontext in einer anderen zu identifizieren und damit zu verknüpfen. Moderne maschinelle Übersetzung hängt stark von diesem Prozess ab.

Wir haben diese Art der Übersetzung auf eine völlig neue Art und Weise verwendet: um Englisch ins Englische zu übersetzen.

Wenn ‚Trumptards‘ zu ‚Schneeflocken‘ werden

Das mag bizarr klingen. Warum Englisch ins Englische übersetzen?

Nun, betrachten Sie amerikanisches Englisch und britisches Englisch. Viele Wörter sind in beiden Sprachen gleich. Dennoch kann es subtile Unterschiede geben. Zum Beispiel kann „apartment“ im amerikanischen Englisch in „flat“ im britischen Englisch übersetzt werden.

Für die Zwecke unserer Studie haben wir die im Kommentarbereich jedes Netzwerks verwendete Sprache mit „MSNBC-Englisch“, „CNN-Englisch“, „Fox-Englisch“ und „OneAmerica-Englisch“ gekennzeichnet.“ Nach der Analyse der Kommentare deckten unsere Übersetzungsalgorithmen zwei verschiedene Muster von“falsch ausgerichteten Wörtern“auf – Begriffe, die in den Kommentarbereichen nicht identisch sind, aber in denselben Kontexten verwendet werden.

Ein Typ war ähnlich wie „Wohnung“ und „Wohnung“ in dem Sinne, dass beide angeblich dasselbe beschreiben. Die von uns entdeckten Wortpaare haben jedoch unterschiedliche Intonationen. Zum Beispiel haben wir festgestellt, dass das, was eine Community „Pelosi“ nennt, die andere „Pelosi“ nennt; und „Trump“ in einer Nachrichtensprache bedeutet in einer anderen „Drumpf“.

Eine zweite – und tiefere – Art der Fehlausrichtung trat auf, wenn sich die beiden Wörter auf zwei grundlegend verschiedene Dinge beziehen.

Zum Beispiel haben wir festgestellt, dass in CNN-Englisch „KKK“ – die Abkürzung für den Ku Klux Klan – von unserem Algorithmus in „BLM“ – Abkürzung für Black Lives Matter – in Fox-Englisch übersetzt wird. Der Algorithmus stellt im Grunde fest, dass die Kommentare einer Community zu KKK den Kommentaren der anderen Community zu BLM sehr ähnlich sind. Während die Glaubenssysteme des KKK und BLM so unterschiedlich sind, wie es sein kann, je nach Kommentarbereich, Sie scheinen jeweils etwas ähnlich Bedrohliches und Bedrohliches darzustellen.

CNN-Englisch und Fox-Englisch sind nicht die einzigen beiden Sprachen, die diese Art von Fehlausrichtungen anzeigen. Das konservative Ende des Spektrums selbst zerfällt in zwei Sprachen. Zum Beispiel bedeutet „Maske“ in Fox-Englisch „Schnauze“ in OneAmerica-Englisch, was die unterschiedlichen Einstellungen in diesen Subgemeinschaften widerspiegelt.

Es scheint eine spiegelgleiche Dualität im Spiel zu sein. „Konservatismus“ wird „Liberalismus“, „rot“ wird in „blau“ übersetzt, während „Cooper“ in „Hannity“ umgewandelt wird.“

Es mangelt auch nicht an dem, was man nur kindische Beschimpfungen nennen kann.

„Trumptards“ in CNN-Englisch übersetzt „Schneeflocken“ in Fox-Englisch; „Trumpty“ in CNN-Englisch übersetzt „Obummer“ in Fox-Englisch; und „republicunts“ in CNN-Englisch übersetzt „democraps“ in Fox-Englisch.

Neuland

Linguisten betonen seit langem, dass eine effektive Kommunikation zwischen Menschen mit unterschiedlichen Überzeugungen eine gemeinsame Grundlage erfordert. Unsere Ergebnisse zeigen, dass die Art und Weise, wie wir über politische Themen sprechen, divergierender wird; Je nachdem, wer schreibt, kann ein gemeinsames Wort eine ganz andere Bedeutung haben.

Wir fragen uns: Wie weit sind wir vom Punkt ohne Wiederkehr entfernt, wenn diese sprachlichen Unterschiede beginnen, die Gemeinsamkeiten zu untergraben, die für eine produktive Kommunikation erforderlich sind?

Haben Echokammern in sozialen Medien die politische Polarisierung so weit verschärft, dass diese sprachlichen Fehlanpassungen im politischen Diskurs verankert sind?

Wann wird „Demokratie“ in einer Sprachvariante aufhören, in „Demokratie“ in der anderen übersetzt zu werden?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.