nu este un secret faptul că politica americană a devenit extrem de polarizată.
chiar și așa, există probabil puțini americani în viață care au asistat vreodată la ceva care se compară cu prima dezbatere prezidențială din această toamnă.
a fost într-adevăr cazul în care națiunea nu ar putea face mai bine decât o luptă alimentară verbală, cu doi candidați aruncând insulte de clasa a patra și vorbind unul pe altul?
pentru noi, dezbaterea discordantă a fost doar încă un simptom al discursului civic al națiunii, pe care, într-un studiu recent, am putut să-l arătăm, se extinde la cuvintele pe care le folosim pentru a vorbi despre politică.
la începutul acestui an, am început să construim un set de date care constă din toate comentariile spectatorilor la videoclipurile YouTube postate de patru rețele de televiziune – MSNBC, CNN, Fox News și One America News Network – care vizează felii din spectrul politic. Împreună, setul de date conține peste 85 de milioane de comentarii la peste 200.000 de videoclipuri de la 6,5 milioane de telespectatori din 2014.
am studiat dacă există variante distincte de engleză scrise în secțiunile de comentarii, asemănătoare distincției dintre engleza britanică și engleza americană.
folosind metode de învățare automată, Am descoperit că aceste permutări există. Mai mult, le putem clasifica în termeni de „stânga” și „dreapta”.”Din câte știm, aceasta este prima demonstrație empirică a diferențelor lingvistice cuantificabile în publicul de știri.
a doua noastră descoperire a fost însă și mai neașteptată.
sistemul nostru de traducere de învățare automată a constatat că cuvintele cu semnificații foarte diferite, cum ar fi „KKK” și „BLM”, au fost folosite în exact aceleași contexte, în funcție de canalul YouTube analizat.
compania a word păstrează
atunci când traduce două limbi diferite – să zicem, spaniolă și engleză – sistemele de traducere automată precum Google Translate încep cu un set mare de texte în ambele limbi. Sistemul aplică apoi metode de învățare automată pentru a deveni mai bun la traducere.
de-a lungul anilor, această tehnologie a devenit din ce în ce mai precisă, datorită a două informații cheie.
prima datează din anii 1950, când lingvistul John Rupert Firth a venit cu aforismul „veți cunoaște un cuvânt al companiei pe care o păstrează.”
pentru sistemele moderne de traducere automată, ” compania „pe care o păstrează un cuvânt este” contextul ” său sau cuvintele care îl înconjoară. De exemplu, cuvântul englezesc „struguri” apare în contexte precum „suc de struguri” și „viță de vie”, în timp ce cuvântul echivalent în spaniolă, uva, apare în aceleași contexte – jugo de uva, vid de uva – în propoziții spaniole.
a doua descoperire importantă a venit destul de recent. Un studiu din 2013 a găsit o modalitate de a identifica – și, prin urmare, de a lega – contextul unui cuvânt dintr-o limbă de contextul său din alta. Traducerea automată modernă depinde foarte mult de acest proces.
ceea ce am făcut este să folosim acest tip de traducere într-un mod cu totul nou: să traducem din engleză în engleză.
când ‘Trumptarzii ‘ devin’fulgi de zăpadă’
asta poate suna bizar. De ce traduce din engleză în engleză?
Ei bine, luați în considerare engleza americană și engleza britanică. Multe cuvinte sunt aceleași în ambele limbi. Cu toate acestea, pot exista diferențe subtile. De exemplu, „apartament „în engleza americană se poate traduce în” apartament ” în engleza britanică.
în scopul studiului nostru, am etichetat limba utilizată în secțiunea de comentarii a fiecărei rețele „MSNBC-engleză”, „CNN-engleză”, „Fox-engleză” și „OneAmerica-engleză. După analizarea comentariilor, algoritmii noștri de traducere au descoperit două modele diferite de” cuvinte nealiniate ” – termeni care nu sunt identici în secțiunile de comentarii, dar sunt folosiți în aceleași contexte.
un tip era similar cu „apartament” și „apartament”, în sensul că ambele descriu aparent același lucru. Cu toate acestea, perechile de cuvinte pe care le-am descoperit au intonații diferite. De exemplu, am constatat că ceea ce o comunitate numește „Pelosi”, cealaltă numește „Pelosy”; iar „Trump” într-o limbă de știri se traduce în „Drumpf” în alta.
un al doilea – și mai profund – fel de nealiniere a avut loc atunci când cele două cuvinte se referă la două lucruri fundamental diferite.
de exemplu, am constatat că în CNN-engleză, „KKK” – abrevierea pentru Ku Klux Klan – este tradusă de algoritmul nostru în „BLM” – prescurtare pentru Black Lives Matter – în Fox-engleză. Algoritmul este practic constatarea că comentariile făcute de o comunitate despre KKK sunt foarte asemănătoare cu comentariile făcute de cealaltă despre BLM. În timp ce sistemele de credință ale KKK și BLM sunt la fel de diferite, în funcție de secțiunea de comentarii, ele par să reprezinte fiecare ceva similar amenințător și amenințător.
CNN-engleză și Fox-engleză nu sunt singurele două limbi care afișează aceste tipuri de nealinieri. Sfârșitul conservator al spectrului în sine se rupe în două limbi. De exemplu,” masca „în Fox-engleză se traduce prin” bot ” într-Unaamerica-engleză, reflectând atitudinile diferite din aceste subcomunități.
se pare că există o dualitate asemănătoare unei oglinzi în joc. „Conservatorismul” devine „liberalism”, „roșu” este tradus în „albastru”, în timp ce „Cooper” este transformat în „Hannity”.”
de asemenea, nu lipsește ceea ce poate fi numit doar nume copilărești.
” Trumptards „în CNN-engleză se traduce prin” fulgi de zăpadă „în Fox-engleză;” Trumpty „în CNN-engleză se traduce prin” Obummer „în Fox-engleză; și” republicunts „în CNN-engleză se traduce prin” democraps ” în Fox-engleză.
teritoriu neexplorat
lingviștii au subliniat mult timp cât comunicarea eficientă între oameni cu credințe diferite necesită un teren comun. Constatările noastre arată că modul în care vorbim despre problemele politice devine din ce în ce mai divergent; în funcție de cine scrie, un cuvânt comun poate fi impregnat cu un sens complet diferit.
ne întrebăm: cât de departe suntem de punctul fără întoarcere când aceste diferențe lingvistice încep să erodeze terenul comun necesar comunicării productive?
camerele de ecou de pe rețelele de socializare au exacerbat polarizarea politică până la punctul în care aceste nealinieri lingvistice au devenit înrădăcinate în discursul politic?
când va înceta „democrația „într-o variantă de limbă să se traducă în” democrație ” în cealaltă?