非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍

非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍
文章插图
编译 | 王晔
校对 | 青暮
当今世界随着大数据、人工智能算法、云计算等技术的发展机器翻译技术又掀起一波新浪潮。伴随着该项技术不断发展的是一场由战争与压迫转为和平与发展的历史,同时这项技术的发展背后亦隐藏着巨大的权力纠纷。
二十世纪五六十年代,在特殊的政治、经济、军事等背景下该项技术受到了研究支持,发展成为一种新的监控方式,也是应对竞争者的有力武器。
现实中的翻译并不是单纯地将一堆不懂的对象转换成能够理解的内容。由于不同语种有着不同的特点,强行的翻译不可避免会抹杀一些小众语种的文化特色,甚至会使这些语种逐渐消失。
机器翻译也拥有众多局限性,如小众语种翻译不成熟、无法表现表达语境情感、存在各种翻译错误等。
受利益的驱使,一部分翻译技术的研发和应用打着为了理解、为了和平的旗号,却极具讽刺意味地维护着文化障碍。
技术不是中立的,对待科学应该保持一惯严谨的态度,更不能一味地鼓吹技术的发展。
2019年,美国国土安全部(DHS)宣布了他们的计划,要收集正在请求进入美国的外国人社交媒体用户名,不论是作为旅行者还是移民,作为新“极端审查”程序的一部分来确定他们是否可以进入美国。对于那些在线活动中用除英语以外的语言来交流的,美国公民及移民服务局发布的一份官方手册,指示管理者使用谷歌翻译将他们的社交媒体帖子翻译成英语。尽管谷歌宣告称其翻译服务并不打算用来代替口译译员,但他们仍然维持这种做法。
非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍
文章插图
Source: ProPublica
人类语言翻译的实际运作长期受到权力不对称的影响。例如,几个世纪前,为了欧洲人能够理解互不相关的语言,他们制定了适用于一系列语言社区和非洲大陆的界限,强制创建适用于这些物品的名字,创建语言文件和翻译材料的基础来加强对殖民者的统治。
为了翻译《圣经》从而向世界各地的土著人传教,基督教传教士给一批无文字语言创造了语法规则。历史上实际充斥着殖民者强迫被殖民者学习其国家语言的例子,被殖民者常常因为用母语说话而面临惩罚。在许多情况下,这种语言压迫导致了土著语种的衰落。而且,殖民主体通过强制性的翻译使土著语言变得可以理解的做法,则进一步加深了对他们的奴役。
正如国土安全部审查协议所表明的那样,无论是通过语言压制还是强迫翻译,机器翻译技术的部署延伸了对下属群体进行制造差异化和施加权力的传统。通过这种方式,语言技术成为了一种新的监控手段。事实上,恰恰是这些利益的驱动,促进了20世纪中期机器翻译技术的发展。
机器翻译最初发展时期的社会政治背景塑造了该技术领域的核心目标和假设,即它在商业环境中的持续发展和使用,不仅要方便,而且要在越来越大的范围内巩固资源和权力。鉴于人们对翻译技术使语言所有权的理解复杂化提出了越来越多的质疑,语言社区开始转而抵抗。

1

机器翻译的起源
美国的第一批机器翻译工作是在冷战的推动下进行的。早期的基于规则的系统主要是在军方和其他联邦机构的资助下开发并供其使用的,往往依赖于工程师和语言学家之间的跨学科协作。在政府资助下,经过了一段以学术工作为主的稳定研究。伴随着商业化翻译软件的问世,机器翻译在20世纪90年代的个人计算机革命中,开始广为大众使用。21世纪,谷歌庞大的网页内容索引和大量资金使得统计(以及后来的神经)机器翻译技术得以丰富和应用,从而在网络上部署了当今普遍使用的免费翻译服务。