Foxニュース視聴者は'BLM'についてCNN視聴者が'KKKについて書いているのと同じように書いています。'

米国の政治が高度に二極化していることは秘密ではありません。

そうであっても、今秋の最初の大統領討論と非常に比較するものを目撃した生きているアメリカ人はおそらくほとんどいません。

二人の候補者が四年生の侮辱を投げつけ、お互いを過ぎて話して、国民が口頭で食べ物の戦いよりも良いことができなかったのは本当にケースでしたか?

私たちにとって、不和な議論は、最近の研究では、私たちが政治について話すために使用する言葉にまで及ぶことを示すことができた、国家のほつれた市民談話のもう一つの症状に過ぎなかった。

今年の初めに、私たちは、4つのテレビネットワーク(MSNBC、CNN、Fox News、One America News Network)によって投稿されたYouTube動画の視聴者コメントのすべてで構成されるデータセットの構築を開始しました。 このデータセットには、2014年以降、650万人の視聴者からの200,000以上の動画に対する8,500万件以上のコメントが含まれています。

私たちは、英国英語とアメリカ英語の区別に似て、コメントセクションに書かれた英語の異なる変種があるかどうかを調べました。

機械学習法を用いて、これらの順列が存在することがわかりました。 さらに、「左ネス」と「右ネス」の観点からそれらをランク付けすることができます。「私たちの知る限りでは、これはニュース視聴者の定量化可能な言語の違いの最初の実証的なデモンストレーションです。

しかし、私たちの第二の発見はさらに予期せぬものでした。

私たちの機械学習翻訳システムでは、「KKK」や「BLM」などの意味が大きく異なる単語が、分析されるYouTubeチャンネルによってまったく同じ文脈で使用されてい

a wordは、スペイン語と英語の二つの異なる言語を翻訳するときに

を保持しています–Google Translateのような自動翻訳システムは、両方の言語のテキストの大 その後、システムは機械学習の方法を適用して翻訳を改善します。

長年にわたり、この技術は、2つの重要な洞察のおかげで、ますます正確になっています。

最初の日付は1950年代にさかのぼり、言語学者のジョン-ルパート-ファースが”あなたはそれが保持している会社の言葉を知っているはずです。”

現代の機械翻訳システムでは、単語が保持する”会社”は、その”文脈”、またはそれを取り巻く単語です。 たとえば、英語の単語”grape”は”grape juice”や”grape vine”などの文脈で発生し、スペイン語の同等の単語”uva”はスペイン語の文章で同じ文脈–jugo de uva、vid de uva–で発生します。

第二の重要な発見は、かなり最近になって来ました。 2013年の調査では、ある言語の単語の文脈を別の言語の文脈に識別し、それによってリンクする方法が見つかりました。 現代の機械翻訳は、このプロセスに大きく依存しています。

私たちがしたことは、このタイプの翻訳を全く新しい方法で使用することです。

“トランプ”が”スノーフレーク”になるとき

それは奇妙に聞こえるかもしれません。 なぜ英語を英語に翻訳するのですか?

さて、アメリカ英語とイギリス英語を考えてみましょう。 多くの単語は両方の言語で同じです。 しかし、微妙な違いがある可能性があります。 たとえば、アメリカ英語の”apartment”はイギリス英語の”flat”に翻訳されることがあります。

我々の研究の目的のために、各ネットワークのコメントセクションで使用されている言語を”MSNBC-English”、”CNN-English”、”Fox-English”、”OneAmerica-English”とラベル付けしました。”コメントを分析した後、私たちの翻訳アルゴリズムは、コメントセクション全体で同一ではなく、同じ文脈で使用される”ずれた単語”の二つの異なるパター

一つのタイプは、両方が表向きは同じことを記述しているという意味で、”フラット”と”アパート”に似ていました。 しかし、私たちが発見した単語のペアは、異なるイントネーションを持っています。 たとえば、あるコミュニティが”Pelosi”と呼んでいるものと、他のコミュニティが”Pelousy”と呼んでいるものがあり、あるニュース言語の”Trump”は別のニュース言語の”Drumpf”に変換されることがわかりました。

二つの言葉が二つの根本的に異なるものを指しているときに、第二の、そしてより深い種類のずれが発生しました。 たとえば、CNN-Englishでは、Ku Klux Klanの略語である”KKK”が、Fox–Englishでは、Black Lives Matterの略記である”BLM”に翻訳されていることがわかりました。 このアルゴリズムは、基本的に、あるコミュニティがKKKについて行ったコメントは、BLMについての他のコメントと非常によく似ていることを見つ KKKとBLMの信念体系は、コメントセクションに応じて、できる限り異なっていますが、それぞれが同様に不吉で脅迫的なものを表しているようです。

CNN-EnglishとFox-Englishは、これらのタイプのミスアライメントを表示する唯一の二つの言語ではありません。 スペクトルの保守的な終わり自体は二つの言語に分かれています。 例えば、Fox-Englishの”mask”は、アメリカ-Englishの”muzzle”に翻訳され、これらのサブコミュニティ間の異なる態度を反映しています。

鏡のような二重性があるようです。 “保守主義”は”自由主義”になり、”赤”は”青”に翻訳され、”クーパー”は”Hannity”に変換されます。”

幼稚な名前呼び出しとしか呼べないものも不足していません。

CNN-英語の「Trumptards」はFox-英語の「snowflakes」に変換され、CNN-英語の「Trumpty」はFox-英語の「Obummer」に変換され、cnn-英語の「republicunts」はFox-英語の「democraps」に変換されます。

Uncharted territory

言語学者は、異なる信念を持つ人々の間で効果的なコミュニケーションが共通の基盤を必要とすることを長い間強調してきました。 私たちの調査結果は、私たちが政治的問題について話す方法がより多様になっていることを示しています。

私たちは疑問に思う:これらの言語の違いが生産的なコミュニケーションに必要な共通の基盤を侵食し始めるとき、私たちは戻ってこない点からど

ソーシャルメディア上の反響室は、これらの言語のずれが政治的談話に根付いている点まで政治的分極を悪化させましたか?

ある言語の”民主主義”は、他の言語の”民主主義”に翻訳されなくなるのはいつですか?

コメントを残す

メールアドレスが公開されることはありません。