Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片

Google|18世纪就有GTA?词频统计器里的另一部“近现代史”

文章图片




数据并不是万能的 。
2010年12月 , 谷歌与哈佛大学合作推出了科学实验项目“Google Ngram Viewer” , 中文翻译为“谷歌图书词频统计器” 。
简而言之 , 这个统计器是针对图书出版物的一种“谷歌趋势” 。 统计器提供关键词搜索 , 搜索的范围是谷歌的数字图书馆“谷歌图书” , 分析关键词在图书、报纸、期刊中出现的频率 , 并按照年份依次排开 , 最终基于用户给定的时间跨度 , 提供一条显示关键词流行及发展趋势的曲线 。

横轴为年份 , 纵轴为词频
在语言学范畴上 , 谷歌给定的文本范围可以被称作一种“语料库” , 而谷歌语料库可能是迄今为止最大的人文及社会科学研究语料库 。
刚上线时 , 谷歌语料库中拥有超过500万本图书 , 占世界上所有已出版书籍的4% , 其中以英语书占多数 。 2020年7月 , 谷歌语料库更新至2019版本 , 收录从1500年到2020年2月的书籍文本 , 涵盖英文、简体中文、法文、德文等八种语言 , 图书数量已超过千万本 。