非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍( 二 )


1949-1997机器翻译的根基:1949-1997
“人们自然会想,翻译的问题是否可以想象为密码学的问题。当我看到一篇俄语写的文章时,我会说,‘这篇文章确实是用英语写的,但它被编码成一些奇怪的符号。我现在要开始解码了。’”
——Warren Weaver, in correspondence to Norbert Wiener, 19472
现代机器技术的根源可以追溯到二战期间的密码学和破译密码工作。曾与先驱信息理论家Claude Shannon合作的美国科学家Warren Weaver对信息理论在人类语言翻译中的应用产生了兴趣。1949年,时任洛克菲勒研究所自然科学部主任的Weaver向少数几个语言学家和工程师分发了一份题为《翻译》的极具影响力的备忘录,其中他提出了将计算机应用于人类语言翻译的行动呼吁。韦弗的备忘录推动了包括华盛顿大学、乔治敦大学、IBM和兰德公司在内的学术界和工业界的各种机构在机器翻译方面的研究工作。
非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍
文章插图
Source: HistoryOfInformation.com
在首次自动翻译中,仅仅决定以哪些语言为目标是一个政治决定,这在当时是由美国和苏联之间的冷战竞争所决定的,尤其是受到增加俄文科学文献期望的影响。Anthony Oettinger当时是哈佛大学的一名本科生,他回忆说,他被招募与韦弗备忘录的接受者之一的计算机科学家Howard Aiken合作,特别是因为他是一名俄语学生。
非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍
文章插图
Source: HistoryOfInformation.com
【 非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍】研究工作继续稳步进行,尽管乔治敦-IBM团队前瞻性地对俄语-英语翻译进行了系统演示,但在20世纪60年代,由于ALPAC报告哀叹机器翻译的质量不佳,否定了其可行性,导致该项目资金缩水。然而,美国政府仍然是机器翻译技术的忠实消费者;在Tom Pedtke于1997年在第六届机器翻译峰会上的主题演讲中,在政府的要求下,他回顾了20世纪90年代的几个关键发展点。例如,1991年缉毒署将资源用于改善西班牙语-英语翻译,而汉语-英语和韩语-英语翻译项目则得到了美国国家安全局、联邦调查局、DARPA和海军的支持。然而,在20世纪90年代末,机器翻译的主要参与者(和消费者)发生了变化。

2

数据驱动的翻译
“目前硅谷发生的最重要的事情不是颠覆。相反,而是体制建设和权力的巩固——其规模和速度在人类历史上可能都是前所未有的。”
——Gideon Lewis-Kraus,《人工智能大觉醒》《纽约时报》杂志,2016年12月14日。
到20世纪90年代中后期,计算机处理能力的进步和个人计算机革命的发展促进了翻译工具的进步。1997年,从乔治敦大学的机器翻译项目发展起来的SYSTRAN与硬件巨头数字设备公司合作,推出了第一个基于网络的免费翻译服务AltaVista。
它最初仅限于英语和少数罗马语之间的翻译,受到了广泛的赞誉;用户研究揭示了这项服务是如何使人们能够与心爱的单语家庭成员进行交流的,并且在翻译问题时提供了独特的娱乐来源,这项成果振奋人心。次年,谷歌成立。作为斯坦福大学的研究生,Sergey Brin和Larry Page已经开始着手为新生建立一个庞大的新兴的万维网内容索引,作为由DARPA、NSF和NASA共同资助的数字图书馆项目的一部分;这项工作将成为谷歌搜索引擎的基础。
到2004年,谷歌已成为一家价值巨大的上市公司,赢得了全世界网民的好评。Brin声称,韩国粉丝的一条信息,被SYSTRAN软件许可误译为“生鱼片的鞋子它希望。谷歌青葱的事!”,这促使谷歌决定扩大包括语言翻译在内的能力。毕竟,在谷歌对所有网页进行索引的过程中,它需要能够包括互联网中那些不是英语的部分。