No es ningún secreto que la política estadounidense se ha polarizado mucho.
Aún así, probablemente hay pocos estadounidenses vivos que hayan presenciado algo que se compare con el primer debate presidencial de este otoño.
¿Era realmente el caso que la nación no podía hacer nada mejor que una pelea verbal de comida, con dos candidatos lanzando insultos de cuarto grado y hablando entre sí?
Para nosotros, el debate discordante era solo un síntoma más del discurso cívico desgastado de la nación, que, en un estudio reciente, pudimos mostrar que se extiende a las palabras que usamos para hablar de política.
A principios de este año, comenzamos a construir un conjunto de datos que consta de todos los comentarios de los espectadores en videos de YouTube publicados por cuatro cadenas de televisión – MSNBC, CNN, Fox News y One America News Network – que se dirigen a segmentos del espectro político. En conjunto, el conjunto de datos contiene más de 85 millones de comentarios sobre más de 200.000 vídeos de 6,5 millones de espectadores desde 2014.
Estudiamos si hay distintas variantes de inglés escritas en las secciones de comentarios, similares a la distinción entre Inglés británico e Inglés Americano.
Utilizando métodos de aprendizaje automático, descubrimos que estas permutaciones existen. Además, podemos clasificarlos en términos de» izquierdas «y » derechas».»Hasta donde sabemos, esta es la primera demostración empírica de diferencias lingüísticas cuantificables en las audiencias de noticias.
Nuestro segundo hallazgo, sin embargo, fue aún más inesperado.
Nuestro sistema de traducción de aprendizaje automático encontró que palabras con significados muy diferentes, como «KKK» y «BLM», se usaban en los mismos contextos, dependiendo del canal de YouTube que se analizaba.
La empresa a word mantiene
Al traducir dos idiomas diferentes, por ejemplo, español e inglés, los sistemas de traducción automática como Google Translate comienzan con un gran conjunto de textos de capacitación en ambos idiomas. A continuación, el sistema aplica métodos de aprendizaje automático para mejorar la traducción.
A lo largo de los años, esta tecnología se ha vuelto cada vez más precisa, gracias a dos conocimientos clave.
La primera se remonta a la década de 1950, cuando el lingüista John Rupert Firth ideó el aforismo «Conocerás una palabra por la compañía que mantiene.»
Para los sistemas modernos de traducción automática, la «compañía» que mantiene una palabra es su «contexto», o las palabras que la rodean. Por ejemplo, la palabra inglesa «grape» aparece en contextos como» grape juice «y» grape vine», mientras que la palabra equivalente en español, uva, aparece en los mismos contextos – jugo de uva, vid de uva – en oraciones en español.
El segundo descubrimiento importante llegó recientemente. Un estudio de 2013 encontró una manera de identificar, y por lo tanto vincular, el contexto de una palabra en un idioma con su contexto en otro. La traducción automática moderna depende en gran medida de este proceso.
Lo que hemos hecho es utilizar este tipo de traducción de una manera completamente nueva: traducir de inglés a inglés.
Cuando las ‘Trumptards’ se convierten en’copos de nieve’
Eso puede sonar extraño. ¿Por qué traducir de inglés a Inglés?
Bueno, considere el Inglés Americano y el Inglés Británico. Muchas palabras son iguales en ambos idiomas. Sin embargo, puede haber diferencias sutiles. Por ejemplo, «apartamento» en inglés americano puede traducirse a «piso» en inglés británico.
Para los propósitos de nuestro estudio, etiquetamos el idioma utilizado en la sección de comentarios de cada cadena «MSNBC-Inglés», «CNN-Inglés», «Fox-Inglés» y «OneAmerica-Inglés.»Después de analizar los comentarios, nuestros algoritmos de traducción descubrieron dos patrones diferentes de» palabras desalineadas», términos que no son idénticos en las secciones de comentarios, pero que se usan en los mismos contextos.
Un tipo era similar a «plano » y» apartamento», en el sentido de que ambos describen ostensiblemente la misma cosa. Sin embargo, los pares de palabras que descubrimos tienen entonaciones diferentes. Por ejemplo, encontramos que lo que una comunidad llama «Pelosi», la otra llama» Pelusa»; y» Trump «en un idioma de noticias se traduce en» Drumpf » en otro.
Se produjo un segundo tipo de desalineación, y más profunda, cuando las dos palabras se refieren a dos cosas fundamentalmente diferentes.
Por ejemplo, encontramos que en CNN-Inglés, » KKK «– la abreviatura del Ku Klux Klan – se traduce por nuestro algoritmo a» BLM » – abreviatura de Black Lives Matter-en Fox-Inglés. El algoritmo básicamente encuentra que los comentarios hechos por una comunidad sobre el KKK son muy similares a los comentarios hechos por la otra sobre BLM. Si bien los sistemas de creencias del KU Klux Klan y el BLM son tan diferentes como pueden ser, dependiendo de la sección de comentarios, cada uno parece representar algo similar ominoso y amenazante.
CNN-English y Fox-English no son los únicos dos idiomas que muestran este tipo de desalineaciones. El extremo conservador del espectro se divide en dos idiomas. Por ejemplo, «máscara «en inglés zorro se traduce como» hocico » en inglés americano, lo que refleja las diferentes actitudes a través de estas subcomunidades.
Parece haber una dualidad similar a un espejo en juego. «Conservadurismo» se convierte en «liberalismo», «rojo» se traduce como «azul», mientras que «Cooper» se convierte en «Hannity».»
Tampoco faltan lo que solo se puede llamar insultos infantiles.
» Trumptards «en CNN-Inglés se traduce como» copos de nieve «en Fox-Inglés;» Trumpty «en CNN-Inglés se traduce como» Obummer «en Fox-Inglés; y» republicunts «en CNN-Inglés se traduce como» democraps » en Fox-Inglés.
Territorio desconocido
Los lingüistas han enfatizado durante mucho tiempo cómo la comunicación efectiva entre personas con creencias diferentes requiere un terreno común. Nuestros hallazgos muestran que la forma en que hablamos sobre asuntos políticos se está volviendo más divergente; dependiendo de quién escriba, una palabra común puede estar impregnada de un significado completamente diferente.
Nos preguntamos: ¿A qué distancia estamos del punto de no retorno cuando estas diferencias lingüísticas comienzan a erosionar el terreno común necesario para una comunicación productiva?
¿Las cámaras de eco en las redes sociales han exacerbado la polarización política hasta el punto en que estos desalineamientos lingüísticos se han arraigado en el discurso político?
¿Cuándo dejará de traducirse «democracia» en una variante lingüística a «democracia» en la otra?