미국 정치가 매우 양극화되었다는 것은 비밀이 아닙니다.
그럼에도 불구하고,이 가을의 첫 번째 대통령 토론과 비교되는 것을 목격 한 살아있는 미국인은 거의 없을 것입니다.
두 후보자가 4 학년 모욕을 던지고 서로 과거 이야기하면서,국가가 구두 음식 싸움보다 더 잘할 수 있었던 것은 정말로 사실 이었습니까?
우리에게 불협화음 논쟁은 국가의 닳아 없어지는 시민 담론의 또 하나의 증상 일 뿐이며,최근의 연구에서 우리는 정치에 관해 이야기 할 때 사용하는 단어까지 확장 할 수 있음을 보여줄 수있었습니다.
올해 초,우리는 정치적 스펙트럼의 조각을 대상으로 네 개의 텔레비전 네트워크–. 이 데이터 세트에는 2014 년 이후 650 만 명의 시청자가 참여한 200,000 개 이상의 동영상에 대한 8,500 만 개 이상의 댓글이 포함되어 있습니다.
우리는 영국 영어와 미국 영어의 구별과 유사한 주석 섹션에 작성된 영어의 고유 한 변형이 있는지 여부를 연구했습니다.
기계 학습 방법을 사용하여 이러한 순열이 존재한다는 것을 발견했습니다. 또한 우리는”왼쪽 다움”과”오른쪽 다움”의 관점에서 순위를 매길 수 있습니다.”우리가 아는 한,이것은 뉴스 관객의 정량화 가능한 언어 적 차이에 대한 최초의 경험적 시연입니다.
그러나 우리의 두 번째 발견은 훨씬 더 예상치 못한 것이었다.
우리의 기계 학습 번역 시스템은 분석중인 유튜브 채널에 따라”한국”과”한국”과 같은 매우 다른 의미를 가진 단어가 동일한 맥락에서 사용된다는 것을 발견했습니다.
이 회사는 단어가 두 개의 서로 다른 언어를 번역 할 때
유지–말,스페인어와 영어–구글과 같은 자동 번역 시스템은 두 언어로 텍스트의 큰 교육 세트로 시작 번역합니다. 이 시스템은 기계 학습 방법을 적용하여 번역을 더 잘합니다.
수년에 걸쳐,이 기술은 두 가지 핵심 통찰력 덕분에 점점 더 정확 해졌습니다.
첫 번째 날짜 다시 1950 년대에 때 언어학자 존 루 퍼 트 퍼스”당신은 그것을 유지 하는 회사에 의해 단어를 알게 될 것 이다 격언을 내놓았다.”
현대 기계 번역 시스템에서 단어가 유지하는”회사”는”컨텍스트”또는 그것을 둘러싼 단어입니다. 예를 들어,영어 단어”포도”는”포도 주스”및”포도 덩굴”과 같은 맥락에서 발생하는 반면 스페인어,우바의 동등한 단어는 스페인어 문장에서 동일한 맥락에서 발생합니다.
두 번째 중요한 발견은 오히려 최근에 나왔다. 2013 년 연구에 따르면 한 언어의 단어 컨텍스트를 다른 언어의 컨텍스트와 식별하여 연결하는 방법이 발견되었습니다. 현대 기계 번역은이 프로세스에 크게 의존합니다.
우리가 한 일은 이러한 유형의 번역을 완전히 새로운 방식으로 사용하는 것,즉 영어를 영어로 번역하는 것입니다.
‘트럼 타드’가’눈송이’가 될 때
은 이상하게 들릴 수 있습니다. 왜 영어를 영어로 번역합니까?
음,미국 영어와 영국 영어를 고려하십시오. 많은 단어는 두 언어에서 동일합니다. 그러나 미묘한 차이가있을 수 있습니다. 예를 들어,미국 영어의”아파트”는 영국 영어의”플랫”으로 번역 될 수 있습니다.
우리 연구의 목적을 위해,우리는 각 네트워크의 코멘트 섹션에 사용 된 언어를 표시했습니다.”주석을 분석 한 후,우리의 번역 알고리즘은”잘못 정렬 된 단어”의 두 가지 패턴,즉 주석 섹션에서 동일하지는 않지만 동일한 컨텍스트에서 사용되는 용어를 발견했습니다.
한 유형은”평면”과”아파트”와 비슷했는데,둘 다 표면 상으로 같은 것을 묘사한다는 의미에서. 그러나 우리가 발견 한 단어 쌍은 다른 억양을 가지고 있습니다. 예를 들어,우리는 한 커뮤니티가”펠로시”라고 부르는 것을,다른 커뮤니티는”펠로시”라고 부르는 것을 발견했습니다.
두 단어가 근본적으로 다른 두 가지를 언급 할 때 두 번째 및 더 깊은 종류의 오정렬이 발생했습니다. 1867>예를 들어,우리는 현지-영어,”한국”–쿠 클럭 스 클랜의 약어–에 의해 번역 된 우리의 알고리즘에 의해”비엘”–에 대 한 속기 검은 생명 문제–폭스-영어. 이 알고리즘은 기본적으로 한 커뮤니티의 댓글이 다른 커뮤니티의 댓글과 매우 비슷하다는 것을 발견했습니다. 한*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일*일
현지-영어와 폭스-영어 만이 이러한 유형의 오정렬을 표시하는 유일한 두 언어는 아닙니다. 스펙트럼 자체의 보수적 인 끝은 두 가지 언어로 나뉩니다. 예를 들어,폭스 영어의”가면”은 하나의”총구”로 번역됩니다.미국 영어,이러한 하위 공동체에 걸쳐 다른 태도를 반영합니다.
놀이에는 거울 같은 이중성이 있는 것 같다. “보수주의”는”자유주의”가되고”빨강”은”파랑”으로 번역되는 반면”쿠퍼”는”해니 티”로 변환됩니다.”
또한 유치한 이름 부르기 만 할 수있는 것이 부족하지 않습니다.
“트럼타드”는 폭스-영어에서”눈송이”로 번역되고,”트럼프티”는 폭스-영어에서”오부머”로 번역되고,”공화국”은 폭스-영어에서”민주화”로 번역된다.
미지의 영역
언어 학자들은 서로 다른 신념을 가진 사람들 사이의 효과적인 의사 소통이 공통점을 필요로하는 방법을 오랫동안 강조해 왔습니다. 우리의 연구 결과는 우리가 정치적 문제에 대해 이야기하는 방식이 점점 더 다양 해지고 있음을 보여줍니다;누가 글을 쓰고 있는지에 따라 일반적인 단어는 완전히 다른 의미로 채워질 수 있습니다.
우리는 이러한 언어적 차이가 생산적인 의사소통에 필요한 공통점을 침식하기 시작할 때 돌아올 수 없는 지점에서 얼마나 멀리 떨어져 있는지 궁금해 한다.
소셜미디어의 에코 챔버스가 정치적 양극화를 악화시켜 이러한 언어적 정렬 불량이 정치적 담론에 뿌리내리게 되었는가?
한 언어의”민주주의”가 다른 언어의”민주주의”로 번역되는 것을 언제 멈출 것인가?