DET er ingen hemmelighet AT amerikansk politikk har blitt svært polarisert.
likevel er det sannsynligvis få Levende Amerikanere som noen gang har sett noe som ganske sammenligner med høstens første presidentdebatt.
var det virkelig slik at nasjonen ikke kunne gjøre noe bedre enn en verbal matkamp, med to kandidater som kastet fjerde klasse fornærmelser og snakket forbi hverandre?
for oss var den uharmoniske debatten bare et symptom på nasjonens fraying civic diskurs, som i en nylig studie vi kunne vise strekker seg til ordene vi bruker til å snakke om politikk.
Tidligere i år begynte vi å bygge et datasett som består av alle seerkommentarene På YouTube – videoer lagt ut av fire tv – nettverk-MSNBC, CNN, Fox News og One America News Network-som retter seg mot deler av det politiske spekteret. Til sammen inneholder datasettet over 85 millioner kommentarer på over 200 000 videoer fra 6,5 millioner seere siden 2014.
vi studerte om det er forskjellige varianter av engelsk skrevet i kommentarfeltene, beslektet med skillet Mellom Britisk engelsk og Amerikansk engelsk.
ved hjelp av maskinlæringsmetoder fant vi at disse permutasjonene eksisterer. Videre kan vi rangere dem i form av «venstre-ness» og » høyre-ness.»Så vidt vi vet, er dette den første empiriske demonstrasjonen av kvantifiserbare språklige forskjeller i nyhetsmålgrupper.
vårt andre funn var imidlertid enda mer uventet.
vårt maskinlærings oversettelsessystem fant at ord med svært forskjellige betydninger, som » KKK » og «BLM», ble brukt i nøyaktig samme sammenhenger avhengig Av YouTube-kanalen som ble analysert.
selskapet a word holder
når du oversetter to forskjellige språk – si, spansk og engelsk – automatiserte oversettelsessystemer som Google Translate begynner med et stort opplæringssett med tekster på begge språk. Systemet bruker deretter maskinlæringsmetoder for å bli bedre til å oversette.
gjennom årene har denne teknologien blitt stadig mer nøyaktig, takket være to viktige innsikter.
den første dateres tilbake til 1950-tallet, da språkforskeren John Rupert Firth kom opp med aforismen «Du skal kjenne et ord av selskapet det holder.»
til moderne maskinoversettelsessystemer er» selskapet «et ord holder sin «kontekst» eller ordene som omgir det. For eksempel forekommer det engelske ordet «drue» i sammenhenger som «druesaft » og» drue vintreet», mens det tilsvarende ordet på spansk, uva, forekommer i samme sammenhenger – jugo de uva, vid de uva – i spanske setninger.
den andre viktige oppdagelsen kom ganske nylig. En studie fra 2013 fant en måte å identifisere – og dermed knytte – et ords kontekst på ett språk til konteksten i et annet. Moderne maskinoversettelse er avhengig av denne prosessen.
Det vi har gjort er å bruke denne typen oversettelse på en helt ny måte: å oversette engelsk til engelsk.
Når ‘Trumptards’ blir ‘snowflakes’
det kan høres bisarrt ut. Hvorfor oversette engelsk til engelsk?
vel, vurder Amerikansk engelsk og Britisk engelsk. Mange ord er like på begge språk. Likevel kan det være subtile forskjeller. For Eksempel,» leilighet «I Amerikansk engelsk kan oversette til «flat» I Britisk engelsk.
i forbindelse med vår studie merket vi språket som ble brukt i hvert nettverkets kommentarseksjon «MSNBC-engelsk», «CNN-engelsk»,» Fox-engelsk «og» OneAmerica-engelsk. Etter å ha analysert kommentarene, avdekket oversettelsesalgoritmene våre to forskjellige mønstre av » feiljusterte ord – – begreper som ikke er identiske på tvers av kommentarseksjonene, men brukes i samme sammenhenger.
En type var lik «flat» og «leilighet», i den forstand at begge beskriver tilsynelatende det samme. Men ordet parene vi avdekket har forskjellige intonasjoner. For eksempel fant vi at det ett samfunn kaller «Pelosi», den andre kaller» Pelousy»; og «Trump» i ett nyhetsspråk oversetter til «Drumpf» i et annet.
en annen – og dypere – slags feiljustering oppstod når de to ordene refererer til to fundamentalt forskjellige ting.
for EKSEMPEL fant vi at I CNN-engelsk,» KKK «– forkortelsen For Ku Klux Klan – er oversatt av vår algoritme til» BLM » – stenografi For Black Lives Matter – I Fox-engelsk. Algoritmen er i utgangspunktet å finne at kommentarene fra ett samfunn om KKK er veldig mye som kommentarene fra DEN andre OM BLM. Mens trossystemene TIL KKK og BLM er omtrent like forskjellige som det kan være, avhengig av kommentarseksjonen, synes de å representere noe tilsvarende uhyggelig og truende.
cnn-engelsk og Fox-engelsk er ikke de eneste to språkene som viser disse typer feiljusteringer. Den konservative enden av spekteret selv bryter inn i to språk. For eksempel oversetter «mask» I Fox-engelsk til «muzzle» I Enamerika-engelsk, som gjenspeiler de ulike holdninger på tvers av disse subsamfunnene.
Det ser ut til å være en speillignende dualitet på spill. «Konservatisme» blir «liberalisme», » rød «blir oversatt til «blå», mens «Cooper» blir omgjort til » Hannity.»
Det er heller ingen mangel på det som bare kan kalles barnslig utskjelling.
«Trumptards» PÅ CNN-engelsk oversetter til » snowflakes «På Fox-engelsk;» Trumpty «PÅ CNN-engelsk oversetter til» Obummer «På Fox-engelsk; og» republicunts «PÅ cnn-engelsk oversetter til» democraps » På Fox-engelsk.
Ukjent territorium
Lingvister har lenge lagt vekt på hvor effektiv kommunikasjon mellom mennesker med ulik tro krever felles grunnlag. Våre funn viser at måten vi snakker om politiske spørsmål blir mer divergerende; avhengig av hvem som skriver, kan et vanlig ord bli gjennomsyret av en helt annen betydning.
vi lurer på: Hvor langt er vi fra det punktet hvor vi ikke kommer tilbake når disse språklige forskjellene begynner å erodere det felles grunnlaget som trengs for produktiv kommunikasjon?
har ekkokamre på sosiale medier forverret politisk polarisering til det punktet hvor disse språklige feiljusteringene har blitt innblandet i politisk diskurs?
når vil» demokrati «i ett språk variant slutte å oversette til» demokrati » i den andre?