Non è un segreto che la politica statunitense sia diventata altamente polarizzata.
Anche così, ci sono probabilmente pochi americani viventi che hanno mai assistito a qualcosa che si confronta con il primo dibattito presidenziale di questo autunno.
Era davvero il caso che la nazione non potesse fare di meglio di una lotta alimentare verbale, con due candidati che si scagliavano insulti di quarta elementare e si parlavano l’un l’altro?
Per noi, il dibattito discordante era solo un altro sintomo del logorante discorso civico della nazione, che, in un recente studio, siamo stati in grado di mostrare si estende alle parole che usiamo per parlare di politica.
All’inizio di quest’anno, abbiamo iniziato a costruire un set di dati che consiste in tutti i commenti degli spettatori sui video di YouTube pubblicati da quattro reti televisive – MSNBC, CNN, Fox News e One America News Network – che prendono di mira fette dello spettro politico. Insieme, il set di dati contiene oltre 85 milioni di commenti su oltre 200.000 video da 6,5 milioni di spettatori dal 2014.
Abbiamo studiato se ci sono varianti distinte dell’inglese scritte nelle sezioni dei commenti, simili alla distinzione tra inglese britannico e inglese americano.
Usando i metodi di apprendimento automatico, abbiamo scoperto che queste permutazioni esistono. Inoltre, possiamo classificarli in termini di “sinistra-ness” e ” destra-ness.”Per quanto ne sappiamo, questa è la prima dimostrazione empirica di differenze linguistiche quantificabili nel pubblico delle notizie.
La nostra seconda scoperta, tuttavia, è stata ancora più inaspettata.
Il nostro sistema di traduzione di apprendimento automatico ha scoperto che parole con significati molto diversi, come “KKK” e “BLM”, venivano utilizzate negli stessi contesti a seconda del canale YouTube analizzato.
La società a word mantiene
Quando si traducono due lingue diverse – ad esempio, spagnolo e inglese – sistemi di traduzione automatizzati come Google Translate iniziano con un ampio set di formazione di testi in entrambe le lingue. Il sistema applica quindi metodi di apprendimento automatico per migliorare la traduzione.
Nel corso degli anni, questa tecnologia è diventata sempre più accurata, grazie a due intuizioni chiave.
La prima risale al 1950, quando il linguista John Rupert Firth si avvicinò con l’aforisma “You shall know a word by the company it keeps.”
Ai moderni sistemi di traduzione automatica, la” società “che una parola mantiene è il suo “contesto”, o le parole che la circondano. Ad esempio, la parola inglese “grape” si verifica in contesti come “grape juice” e “grape vine”, mentre la parola equivalente in spagnolo, uva, si verifica negli stessi contesti – jugo de uva, vid de uva – nelle frasi spagnole.
La seconda importante scoperta è arrivata piuttosto di recente. Uno studio del 2013 ha trovato un modo per identificare – e quindi collegare – il contesto di una parola in una lingua al suo contesto in un’altra. Traduzione automatica moderna dipende molto da questo processo.
Quello che abbiamo fatto è utilizzare questo tipo di traduzione in un modo completamente nuovo: tradurre dall’inglese all’inglese.
Quando ‘Trumptards’ diventano ‘fiocchi di neve’
Può sembrare bizzarro. Perché tradurre inglese a inglese?
Bene, considera l’inglese americano e l’inglese britannico. Molte parole sono le stesse in entrambe le lingue. Eppure ci possono essere sottili differenze. Ad esempio,” appartamento “in inglese americano può tradursi in” appartamento ” in inglese britannico.
Ai fini del nostro studio, abbiamo etichettato la lingua utilizzata nella sezione commenti di ogni rete “MSNBC-inglese”, “CNN-inglese”, “Fox-inglese” e “OneAmerica-inglese.”Dopo aver analizzato i commenti, i nostri algoritmi di traduzione hanno scoperto due diversi modelli di” parole disallineate ” – termini che non sono identici nelle sezioni dei commenti ma sono usati negli stessi contesti.
Un tipo era simile a “flat” e “apartment”, nel senso che entrambi descrivono apparentemente la stessa cosa. Tuttavia, le coppie di parole che abbiamo scoperto hanno intonazioni diverse. Ad esempio, abbiamo scoperto che ciò che una comunità chiama “Pelosi”, l’altra chiama “Pelousy”; e “Trump” in una lingua di notizie si traduce in “Drumpf” in un’altra.
Un secondo – e più profondo – tipo di disallineamento si è verificato quando le due parole si riferiscono a due cose fondamentalmente diverse.
Ad esempio, abbiamo scoperto che in CNN-inglese, “KKK” – l’abbreviazione per il Ku Klux Klan – è tradotto dal nostro algoritmo in “BLM” – abbreviazione per Black Lives Matter – in Fox-inglese. L’algoritmo sta fondamentalmente scoprendo che i commenti fatti da una comunità su KKK sono molto simili ai commenti fatti dall’altra su BLM. Mentre i sistemi di credenze del KKK e del BLM sono tanto diversi quanto possono essere, a seconda della sezione dei commenti, sembrano rappresentare ciascuno qualcosa di simile minaccioso e minaccioso.
CNN-English e Fox-English non sono le uniche due lingue che mostrano questi tipi di disallineamenti. La fine conservatrice dello spettro stesso si rompe in due lingue. Ad esempio,” maschera “in Fox-English si traduce in” museruola ” in UnoAmerica-inglese, riflettendo i diversi atteggiamenti tra queste sottocomunità.
Sembra esserci una dualità speculare in gioco. “Conservatorismo” diventa “liberalismo”, “rosso” viene tradotto in “blu”, mentre “Cooper” viene convertito in ” Hannity.”
Non manca nemmeno quello che può essere chiamato solo nomignolo infantile.
” Trumptards “in CNN-Inglese si traduce in” snowflakes “in Fox-inglese;” Trumpty “in CNN-inglese si traduce in” Obummer “in Fox-inglese; e” republicunts “in CNN-inglese si traduce in” democraps ” in Fox-inglese.
Uncharted territory
I linguisti hanno da tempo sottolineato come una comunicazione efficace tra persone con credenze diverse richieda un terreno comune. I nostri risultati mostrano che il modo in cui parliamo di questioni politiche sta diventando sempre più divergente; a seconda di chi sta scrivendo, una parola comune può essere intrisa di un significato completamente diverso.
Ci chiediamo: quanto siamo lontani dal punto di non ritorno quando queste differenze linguistiche cominciano a erodere il terreno comune necessario per una comunicazione produttiva?
Le camere di eco sui social media hanno esacerbato la polarizzazione politica al punto in cui questi disallineamenti linguistici sono diventati radicati nel discorso politico?
Quando” democrazia “in una variante linguistica smetterà di tradursi in” democrazia ” nell’altra?