nem titok, hogy az amerikai politika erősen polarizálódott.
ennek ellenére valószínűleg kevés élő amerikai van, aki valaha is tanúja volt valaminek, ami meglehetősen összehasonlítható az őszi első elnöki vitával.
valóban az volt a helyzet, hogy a nemzet nem tudott jobbat csinálni, mint egy szóbeli ételharc, amelyben két jelölt negyedikes sértéseket dobált és egymás mellett beszélt?
számunkra az ellentmondó vita csak egy újabb tünete volt a nemzet fásult polgári diskurzusának, amely egy nemrégiben készült tanulmányban megmutattuk, hogy kiterjed azokra a szavakra is, amelyeket a politikáról beszélünk.
ez év elején elkezdtünk egy olyan adathalmazt összeállítani, amely négy televíziós hálózat – az MSNBC, a CNN, a Fox News és egy America News Network – által közzétett YouTube-videókhoz fűzött összes nézői hozzászólásból áll, amelyek a politikai spektrum szeleteit célozzák meg. Az adatkészlet együttesen több mint 85 millió megjegyzést tartalmaz több mint 200 000 videóhoz, 6,5 millió nézőtől 2014 óta.
megvizsgáltuk, hogy vannak-e az angol nyelv különböző változatai a megjegyzésekben, hasonlóan a brit angol és az amerikai angol megkülönböztetéséhez.
gépi tanulási módszerekkel megállapítottuk, hogy ezek a permutációk léteznek. Sőt, rangsorolhatjuk őket a “baloldaliság” és a “jobboldaliság” szempontjából.”Legjobb tudomásunk szerint ez az első empirikus demonstráció a számszerűsíthető nyelvi különbségekről a hírközönségben.
második megállapításunk azonban még váratlanabb volt.
gépi tanulási fordítási rendszerünk megállapította, hogy a “KKK” és a “BLM” jelentésű szavakat pontosan ugyanabban a kontextusban használták, az elemzett YouTube-csatornától függően.
a cég a word tartja
fordításakor két különböző nyelven – mondjuk, spanyol és angol – automatizált fordítási rendszerek, mint a Google Translate kezdődik egy nagy képzési sor szövegek mindkét nyelven. A rendszer ezután gépi tanulási módszereket alkalmaz, hogy jobbá váljon a fordításban.
az évek során ez a technológia egyre pontosabbá vált, két kulcsfontosságú felismerésnek köszönhetően.
az első az 1950-es évekre nyúlik vissza, amikor John Rupert Firth nyelvész előállt az aforizmussal: “egy szót Meg kell ismernie annak a társaságnak, amelyet tart.”
a modern gépi fordítási rendszerek számára a “vállalat”, amelyet egy szó tart, a “kontextus”, vagy az azt körülvevő szavak. Például az angol ” grape “szó olyan kontextusokban fordul elő, mint a” szőlőlé “és a” grape vine”, míg az ezzel egyenértékű szó spanyolul, uva, ugyanabban a kontextusban fordul elő – jugo de uva, vid de uva – spanyol mondatokban.
a második fontos felfedezés meglehetősen nemrégiben történt. Egy 2013-as tanulmány megtalálta a módját annak, hogy azonosítsa – és ezáltal összekapcsolja – egy szó kontextusát az egyik nyelvben a másik kontextusával. A modern gépi fordítás nagymértékben függ ettől a folyamattól.
amit tettünk, az az, hogy ezt a fajta fordítást teljesen új módon használjuk: angolról angolra fordítani.
amikor a ‘Trumptards’ – ból ‘hópelyhek’lesz
ez bizarrul hangozhat. Miért fordít angolról angolra?
nos, fontolja meg az amerikai angol és a brit angol nyelvet. Sok szó ugyanaz mindkét nyelven. Mégis lehetnek finom különbségek. Például az amerikai angol nyelvű ” Apartman “lefordítható Brit angol nyelven” lapos ” – ra.
tanulmányunk céljaira az egyes hálózatok megjegyzéseiben használt nyelvet “MSNBC-English”, “CNN-English”, “Fox-English” és “OneAmerica-English” címkével láttuk el.”A Megjegyzések elemzése után fordítási algoritmusaink két különböző “rosszul igazított szó” mintát fedeztek fel – olyan kifejezéseket, amelyek nem azonosak a megjegyzésszakaszokban, de ugyanabban a kontextusban használják őket.
az egyik típus hasonló volt a “lakás” – hoz és a “lakás” – hoz, abban az értelemben, hogy mindkettő látszólag ugyanazt írja le. Az általunk feltárt szópárok azonban eltérő intonációval rendelkeznek. Például azt találtuk, hogy amit az egyik közösség “Pelosi”-nak, a másik “Pelousy” – nak hív; a “Trump” pedig az egyik hírnyelvben “Drumpf” – ra fordul egy másikban.
egy második – és mélyebb – fajta eltérés történt, amikor a két szó két alapvetően különböző dologra utal.
például azt találtuk, hogy a CNN-angol nyelven a “KKK” – a Ku Klux Klan rövidítése – algoritmusunk “BLM” – re fordítja – a Black Lives Matter rövidítése-Fox-angol nyelven. Az algoritmus alapvetően megállapítja, hogy az egyik közösség megjegyzései a KKK-ról nagyon hasonlítanak a másik megjegyzéseire a BLM-ről. Bár a KKK és a BLM hitrendszerei annyira különböznek, amennyire csak lehet, a megjegyzés rovattól függően úgy tűnik, hogy mindegyik valami hasonlóan baljóslatú és fenyegető dolgot képvisel.
a CNN-angol és a Fox-Angol nem az egyetlen két nyelv, amely ilyen eltéréseket mutat. Maga a spektrum konzervatív vége két nyelvre bomlik. Például, a” maszk “Fox-angol fordításban” szájkosár ” OneAmerica-angol, tükrözve ezen alközségek eltérő hozzáállását.
úgy tűnik, hogy egy tükörszerű kettősség játszik szerepet. A ” konzervativizmus “” liberalizmussá “válik, a” piros “” kékre “fordul, míg a” Cooper “”Hannity” – vé alakul.”
nem hiányzik az sem, amit csak gyerekes névhívásnak lehet nevezni.
“Trumptards” a CNN-angol fordítja a “hópelyhek” a Fox-angol; “Trumpty” a CNN-angol fordítja “Obummer” a Fox-angol; és “republicunts” a CNN-angol fordítja a “demokraták” a Fox-angol.
feltérképezetlen terület
a nyelvészek régóta hangsúlyozzák, hogy a különböző meggyőződésű emberek közötti hatékony kommunikáció közös alapot igényel. Eredményeink azt mutatják, hogy a politikai kérdésekről való beszélgetés egyre eltérőbb; attól függően, hogy ki ír, egy közös szó teljesen más jelentéssel bírhat.
azon tűnődünk: milyen messze vagyunk attól a ponttól, ahonnan nincs visszatérés, amikor ezek a nyelvi különbségek elkezdik erodálni a produktív kommunikációhoz szükséges közös alapot?
a közösségi média visszhangkamrái olyan mértékben fokozták-e a politikai polarizációt, hogy ezek a nyelvi eltérések beépültek a politikai diskurzusba?
mikor szűnik meg az egyik nyelvben a “demokrácia” fordítása “demokráciává” a másikban?