não é segredo que a política americana se tornou altamente polarizada. Mesmo assim, há provavelmente poucos americanos vivos que já testemunharam algo que se compara ao primeiro debate presidencial deste outono. Foi realmente o caso de que a nação não poderia fazer melhor do que uma luta de comida verbal, com dois candidatos arremessando insultos de quarta classe e falando entre si?Para nós, o debate discordante era apenas mais um sintoma do discurso Cívico fraying da nação, que, num estudo recente, pudemos mostrar estende-se às palavras que usamos para falar de política.
no início deste ano, começamos a construir um conjunto de dados que consiste em todos os comentários de telespectadores em vídeos do YouTube publicados por quatro redes de televisão – MSNBC, CNN, Fox News e One America News Network – que visam fatias do espectro político. Juntos, o conjunto de dados contém mais de 85 milhões de comentários sobre mais de 200.000 vídeos de 6,5 milhões de telespectadores desde 2014.
estudamos se existem variantes distintas de Inglês escrito nas seções de comentários, semelhante à distinção entre Inglês Britânico e Inglês Americano. Usando métodos de aprendizagem de máquinas, descobrimos que estas permutações existem. Além disso, podemos classificá-los em termos de “esquerda” e “direita”.”Tanto quanto sabemos, esta é a primeira demonstração empírica de diferenças linguísticas quantificáveis em audiências de notícias.
a nossa segunda descoberta, no entanto, foi ainda mais inesperada.
nosso sistema de tradução de aprendizado de máquina descobriu que palavras com significados muito diferentes, como” KKK “e” BLM”, foram usadas nos mesmos contextos, dependendo do canal do YouTube sendo analisado.
the company a word keeps
When translating two different languages-say, Spanish and English-automatic translation systems like Google Translate begin with a large training set of texts in both languages. O sistema, em seguida, aplica métodos de aprendizagem de máquina para se tornar melhor na tradução. Ao longo dos anos, esta tecnologia tornou-se cada vez mais precisa, graças a dois insights-chave.
a primeira data da década de 1950, quando o linguista John Rupert Firth surgiu com o aforismo “você deve saber uma palavra pela empresa que mantém.”
para os modernos sistemas de tradução automática, a” empresa “que uma palavra mantém é o seu” contexto”, ou as palavras que a rodeiam. Por exemplo, a palavra inglesa “uva”, ocorre em contextos como “suco de uva” e “vinha”, enquanto a palavra equivalente em espanhol, uva, ocorre nos mesmos contextos – jugo de uva, vid de uva – em espanhol frases.
a segunda descoberta importante veio muito recentemente. Um estudo de 2013 encontrou uma maneira de identificar – e assim ligar-o contexto de uma palavra em uma língua a seu contexto em outra. A tradução automática moderna depende fortemente deste processo.
o que fizemos foi usar este tipo de tradução de uma forma inteiramente nova: traduzir Inglês para Inglês.
When ‘Trumptards’ become ‘snowflakes’
that may sound bizarre. Por que traduzir Inglês para Inglês?
Well, consider American English and British English. Muitas palavras são as mesmas em ambas as línguas. No entanto, pode haver diferenças subtis. Por exemplo, “apartment” em Inglês Americano pode traduzir para “flat” Em inglês Britânico.
para os propósitos do nosso estudo, nós rotulamos a linguagem usada em cada seção de comentários da rede “MSNBC-inglês,” “CNN-inglês,” “Fox-inglês” e “OneAmerica-inglês.”Depois de analisar os comentários, nossos algoritmos de tradução descobriram dois padrões diferentes de” palavras desalinhadas ” – Termos que não são idênticos em todas as seções de comentários, mas são usados nos mesmos contextos.
um tipo era semelhante a “apartamento” e “apartamento”, no sentido de que ambos estão descrevendo ostensivamente a mesma coisa. No entanto, os pares de palavras que descobrimos têm diferentes entonações. Por exemplo, descobrimos que o que uma comunidade chama de “Pelosi”, a outra chama de “Pelousy”; e “Trump” em uma língua de notícias se traduz em “Drumpf” em outra.
um segundo e mais profundo tipo de desalinhamento ocorreu quando as duas palavras se referem a duas coisas fundamentalmente diferentes.
por exemplo, descobrimos que em CNN-inglês, “KKK” – a abreviatura para Ku Klux Klan – é traduzido por nosso algoritmo para “BLM” – abreviação para Black Lives Matter – em Fox-inglês. O algoritmo está basicamente descobrindo que os comentários feitos por uma comunidade sobre o KKK são muito parecidos com os comentários feitos pela outra sobre o BLM. Enquanto os sistemas de crença do KKK e do BLM são tão diferentes quanto possível, dependendo da seção de comentários, eles parecem representar algo igualmente ameaçador e ameaçador.
CNN-English and Fox-English are not the only two languages displaying these types of misalignments. O fim conservador do próprio espectro divide-se em duas línguas. Por exemplo, “mask” em Fox-inglês traduz-se para “muzzle” em OneAmerica-inglês, refletindo as diferentes atitudes através dessas subcomunidades.
parece haver uma dualidade semelhante a um espelho em jogo. “Conservadorismo” torna-se” liberalismo”,” vermelho “é traduzido para” azul”, enquanto” Cooper “é convertido em “Hannity”.”
também não há falta do que só pode ser chamado de nome infantil.
“Trumptards” in CNN-English translates to “snowflakes” in Fox-English; “Trumpty” in CNN-English translates to ” Obummer “in Fox-English; and” republicunts “in CNN-English translates to” democraps ” in Fox-English.
território desconhecido
os linguistas têm enfatizado há muito como a comunicação eficaz entre pessoas com crenças diferentes requer um terreno comum. Nossas descobertas mostram que a maneira como falamos sobre questões políticas está se tornando mais divergente; dependendo de quem está escrevendo, uma palavra comum pode ser imbuída de um significado completamente diferente. Perguntamo-nos: a que distância Estamos do ponto de não retorno quando estas diferenças linguísticas começam a corroer o terreno comum necessário para a comunicação produtiva?Têm as câmaras de eco nas redes sociais exacerbado a polarização política até ao ponto em que estes desalinhamentos linguísticos se tornaram enraizados no discurso político?
quando a” democracia “em uma variante da linguagem vai parar de se traduzir em” democracia ” na outra?