nie jest tajemnicą, że polityka USA stała się bardzo spolaryzowana.
mimo to, prawdopodobnie niewielu jest żyjących Amerykanów, którzy kiedykolwiek byli świadkami czegoś, co porównuje się z pierwszą jesienną debatą prezydencką.
czy rzeczywiście tak było, że naród nie mógł zrobić nic lepszego niż słowna walka o jedzenie, z dwoma kandydatami rzucającymi obelgi w czwartej klasie i rozmawiającymi ze sobą?
dla nas niezgodna debata była tylko kolejnym symptomem strzępiącego się dyskursu obywatelskiego narodu, który w niedawnym badaniu byliśmy w stanie pokazać, że rozciąga się na słowa, których używamy do mówienia o polityce.
na początku tego roku zaczęliśmy konstruować zestaw danych, który składa się ze wszystkich komentarzy widza do filmów na YouTube opublikowanych przez cztery sieci telewizyjne-MSNBC, CNN, Fox News i One America News Network-które kierują się fragmentami politycznego spektrum. Łącznie zbiór danych zawiera ponad 85 milionów komentarzy do ponad 200 000 filmów od 6,5 miliona widzów od 2014 roku.
badaliśmy, czy istnieją różne warianty angielskiego napisane w sekcjach komentarzy, podobne do rozróżnienia między brytyjskim angielskim i amerykańskim angielskim.
korzystając z metod uczenia maszynowego, odkryliśmy, że te permutacje istnieją. Co więcej, możemy je uszeregować pod względem „lewicowości „i ” prawicowości”.”Zgodnie z naszą najlepszą wiedzą jest to pierwszy empiryczny pokaz wymiernych różnic językowych wśród odbiorców wiadomości.
nasze drugie odkrycie było jednak jeszcze bardziej nieoczekiwane.
nasz system tłumaczeń machine learning wykazał, że słowa o znacznie różnych znaczeniach, takie jak ” KKK ” i „BLM”, były używane w dokładnie tych samych kontekstach, w zależności od analizowanego kanału YouTube.
firma słowo utrzymuje
przy tłumaczeniu dwóch różnych języków – powiedzmy, hiszpańskiego i angielskiego – automatyczne systemy tłumaczeń, takie jak Google Translate, zaczynają się od dużego zestawu tekstów szkoleniowych w obu językach. Następnie system stosuje metody uczenia maszynowego, aby stać się lepszym w tłumaczeniu.
z biegiem lat technologia ta stała się coraz bardziej dokładna, dzięki dwóm kluczowym spostrzeżeniom.
pierwszy pochodzi z lat 50., kiedy językoznawca John Rupert Firth wymyślił aforyzm ” poznasz słowo po towarzystwie, które utrzymuje.”
dla nowoczesnych systemów tłumaczenia maszynowego „firmą”, które słowo zachowuje, jest jego” kontekst ” lub słowa otaczające go. Na przykład angielskie słowo ” winogrono „występuje w kontekstach takich jak” sok winogronowy „i” winorośl winogronowa”, podczas gdy równoważne słowo w języku hiszpańskim, uva, występuje w tych samych kontekstach – jugo de uva, vid de uva – w hiszpańskich zdaniach.
drugie ważne odkrycie przyszło raczej niedawno. Badanie z 2013 r.znalazło sposób na zidentyfikowanie – a tym samym powiązanie – kontekstu słowa w jednym języku z kontekstem w innym. Nowoczesne tłumaczenie maszynowe w dużym stopniu zależy od tego procesu.
to, co zrobiliśmy, to wykorzystanie tego typu tłumaczeń w zupełnie nowy sposób: tłumaczenie z angielskiego na angielski.
kiedy „Trumptardy” stają się „płatkami śniegu”
to może zabrzmieć dziwnie. Dlaczego warto tłumaczyć z angielskiego na polski?
rozważ Amerykański Angielski i brytyjski angielski. Wiele słów jest takich samych w obu językach. Jednak mogą istnieć subtelne różnice. Na przykład „mieszkanie „w amerykańskim angielskim może tłumaczyć się na” mieszkanie ” w brytyjskim angielskim.
na potrzeby naszych badań oznaczyliśmy język używany w sekcji komentarzy każdej sieci „MSNBC-angielski”, „CNN-angielski”, „Fox-angielski” i „OneAmerica-angielski.”Po przeanalizowaniu komentarzy, nasze algorytmy tłumaczeniowe odkryły dwa różne wzorce” źle dobranych słów ” – terminów, które nie są identyczne w sekcjach komentarzy, ale są używane w tych samych kontekstach.
jeden typ był podobny do „mieszkania” i „mieszkania”, w tym sensie, że oba opisują pozornie to samo. Jednak pary słów, które odkryliśmy, mają różne intonacje. Na przykład odkryliśmy, że to, co jedna społeczność nazywa „Pelosi”, druga nazywa” Pelousy”, a” Trump „w jednym języku wiadomości przekłada się na” Drumpf ” w innym.
drugi – i głębszy – rodzaj niewspółosiowości wystąpił, gdy dwa słowa odnoszą się do dwóch zasadniczo różnych rzeczy.
na przykład odkryliśmy, że w CNN-angielski, „KKK” – Skrót Ku Klux Klan – jest tłumaczony przez nasz algorytm na „BLM” – skrót dla Black Lives Matter – W Fox-angielski. Algorytm polega na stwierdzeniu, że komentarze jednej społeczności na temat KKK są bardzo podobne do komentarzy drugiej na temat BLM. Podczas gdy systemy wierzeń KKK i BLM są tak różne, jak to tylko możliwe, w zależności od sekcji komentarzy, wydają się one reprezentować coś podobnie złowieszczego i groźnego.
CNN-angielski i Fox-angielski nie są jedynymi dwoma językami wykazującymi tego typu rozbieżności. Konserwatywny koniec spektrum dzieli się na dwa języki. Na przykład” maska „w języku Fox-English przekłada się na” kaganiec ” w języku Oneameryka-angielski, odzwierciedlając różne postawy w tych subkomuniekach.
wydaje się, że w grę wchodzi lustrzana dwoistość. „Konserwatyzm” staje się” liberalizmem”,” czerwony „tłumaczy się na” niebieski”, podczas gdy” Cooper „przekształca się w” Hannity.”
nie brakuje też tego, co można nazwać tylko dziecinnym wyzwiskiem.
„Trumptards” w CNN-Angielski przekłada się na „płatki śniegu” w Fox-angielski; „Trumpty” w CNN-Angielski przekłada się na „Obummer” w Fox-angielski; a „republicunts” w CNN-Angielski przekłada się na „democraps” w Fox-angielski.
Uncharted territory
lingwiści od dawna podkreślają, jak skuteczna komunikacja między ludźmi o różnych przekonaniach wymaga wspólnej płaszczyzny. Nasze odkrycia pokazują, że sposób, w jaki mówimy o kwestiach politycznych, staje się coraz bardziej rozbieżny; w zależności od tego, kto pisze, wspólne słowo może być nasycone zupełnie innym znaczeniem.
zastanawiamy się: jak daleko jesteśmy od punktu bez powrotu, gdy te różnice językowe zaczynają niszczyć wspólną płaszczyznę potrzebną do produktywnej komunikacji?
czy echo chambers w mediach społecznościowych zaostrzyło polaryzację polityczną do tego stopnia, że te niewspółmierności językowe zakorzeniły się w dyskursie politycznym?
kiedy ” demokracja „w jednym wariancie językowym przestanie się tłumaczyć na” demokrację ” w drugim?