Google|18世纪就有GTA?词频统计器里的另一部“近现代史”( 三 )


词频统计器还显示 , 17世纪以来的推特使用率居高不下;到了第一次世界大战时期 , 才轮到短视频应用红极一时 。

莎士比亚推文:“生存还是毁灭” , 图源Youtube@Daaninator

一战导火索:斐迪南大公遇刺的珍贵短视频影像 , 图源Youtube@Techlin
在音乐方面 , 迈克尔·杰克逊的名号响彻了整整两个世纪 , 而瑞克·艾斯利大概从17世纪起就开始唱流行金曲了 。


Youtube@MyCoolJacksonTV

图源Youtube@Manuel Vsp
二次元文化也盛行了几百年 , 据悉在第二次世界大战爆发时 , 世界上最受欢迎的日本动漫是《火影忍者》 。

TikTok@dzvjk__senpai

TikTok@katsu.kunn
把搜索关键词换成今天的电子游戏 , 同样会得到令人们瞠目结舌的新发现:我们玩到的游戏其实都是老祖宗们玩剩下的 。

16世纪的《绝地求生》 , 图源TikTok@wncem

17世纪的《Apex英雄》 , 图源TikTok@zrunez_

1945年的《我的世界》 , 图源Youtube@Daaninator
老祖宗们甚至有着在游戏结束时打出“GG”(Good Game)的习惯 , 这大抵体现了他们对礼仪的规范与注重 。

Youtube@Techlin
2
代表权威数据的谷歌图书词频统计器 , 改出了太多令网友们啼笑皆非的“野史” 。 不过需要注意 , 统计器出现这种差之千里的谬误 , 有时也不全是数据的错 。
假如你出于好奇打开统计器复现网友们的搜索结果 , 就会发现一些结果与视频画面对不上 。 视频作者可能通过修改网页元素或者嫁接P图、剪辑的方式 , 制作了假的趋势曲线 。
举例而言 , 前文中提到过的Aimbot(自瞄机器人) , 在1893年以前的著作中毫无记载 。

Case-Insensitive选项能够得出区分大小写的结果
在B站有人查到“shabi”一词最早在美国《独立宣言》颁布的1776年出现 , 这也不符合真实索引结果 。 至少在谷歌英语语料库 , 这个词的纯小写形式直到1824年才首次有人使用 。

就算查到了与视频中一模一样的趋势曲线 , 也不代表真实索引结果具有足够的说服力 。 网友们输入的单词或词组 , 可能对应多种含义 , 而谷歌的程序尚且无法做到划分不同语义的程度 。

《我的世界》游戏风靡全球前 , Minecraft一般指海军的布雷与扫雷艇
例如 , PC、RGB、GG等特定词组的缩写形式 , 结合不同文本语境 , 可指代无数种具体事物;有时还会用作人名或机构名称的缩写 。 如果不进一步限定搜索范围 , 得到的结果不会有规律可循 , 自然缺乏应有的参考价值 。
直接使用统计器搜索某个人名 , 也不是值得过多提倡的行为 。 历史记载中同名同姓者多如牛毛 , 更不用提老外的人名大多出自圣经 , 拥有远比中文夸张的重复率 。
另外 , TikTok与Twitter , 本就是英语中的拟声词 , 在百余年前的英文著作中出现也根本不稀奇 。

1880年的一本诗集中用twitter一词形容鸟叫
当然 , 玩梗没必要太过当真 , 本文也无意否定任何作者为了博观众一笑所耗费的大量心血 , 仅是指出在一部分视频中 , 作为工具本身的谷歌词频统计器没什么需要指摘的地方 。
而在另一些关键词较为明晰的案例中 , 词频趋势曲线在20世纪前的增长态势有迹可循 , 使得统计器间接起到了反映历史与社会变动的职责 。
世界意义上的近现代史 , 正是各大洲各民族建立紧密联系的关键历史时期 , 不同文化的交流与冲突 , 势必为包括英语在内的各种语言带来数不胜数的外来词汇 。
前文提到的Java在当下的语境中常指一种编程语言 , 放到殖民时期多半指的是16世纪初由葡萄牙殖民者发现的东南亚爪哇岛 。 今天的Anime是由日语的“动漫”一词音译而来 , 然而百余年前的英国水手听到这个词 , 顶多联想到美洲大陆出产的某种树脂 。