文章图片
大多数知名搜索引擎的搜索索引都有数万亿页 , 比如谷歌、百度、Bing 。 因此 , 让我们讨论排名算法之前 , 让我们先了解Web索引的构建和维护机制 。 分享的这个流程是专门针对Google的 , 但是其他网络搜索引擎比如百度、Bing可能就很相似了 。 还有其他类型的搜索引擎 , 比如只从其网站展示结果的亚马逊、YouTube、维基百科 。
步骤1、网址
所有的事情都从已知的URL列表开始 。 谷歌通过各种流程发现了这些 , 但最常见的三种是:
反向链接
谷歌已经有e已经有一个索引包含了数万亿个网页 , 如果有人把指向你其中一个页面的链接从其中添加出去 , 就可以从中找到 。
您可以使用站点资源管理器 , 使用Ahrefs网站管理员工具免费查看您网站的反向链接 。
- 为Ahrefs网站管理员注册免费工具账号 。
- 在站点资源管理器中粘贴你的域 。
- 转到反向链接报告 。
站点地图 。
网站地图列出了你网站的所有重要页面 。 如果你向Google提交网站地图 , 它可能会帮助他们更快地找到你的网站 。
提交自URL 。
Google还允许单个URL通过GoogleSearchConsole提交 。
步骤2、爬行的步骤
电脑机器人(如Googlebot)访问并下载发现的页面 , 被称为蜘蛛 。
请注意 , Google并不总是按照他们发现页面的顺序来抓取页面 。
Google排队的URL根据几个因素 , 包括:
- PageRankURL 。
- 多长时间更改一次URL 。
- 不管是不是新的 。
步骤3、处理
加工是谷歌从抓取页面中了解和提取关键信息的地方 。 谷歌之外的过程中的每一个细节都没有人知道 , 但提取链接和存储内容进行索引是我们理解的重要部分 。
为了充分处理谷歌 , 谷歌必须渲染页面 , 这是谷歌运行页面代码的地方 , 了解它如何找到用户 。
也就是说 , 有些处理会发生在渲染前后——如图所示 。
第4步、索引
索引是一个被称为搜索索引的大型数据库 , 被添加到未来从爬网页的处理信息中 。 这本质上是一个包含数万亿页面的数字图书馆 , 谷歌的搜索结果来自这些页面 。
这一点很重要 。 当你在搜索引擎中输入查询时 , 您并不是直接在互联网上搜索匹配的结果 。 您正在搜索搜索引擎的网页索引 。 如果网页不在搜索索引中 , 搜索引擎用户将无法找到它 。 这就是为什么你的网站在Google、百度和Bing等主要搜索引擎中如此重要 。
来自https://cn.bluehost.com/blog/seo/15189.html
- 数字营销|按这5个方法选择老域名,网站SEO优化就成功了一半
- 电子商务|跨境电商平台都有哪些?卖家应该如何选择?
- 阿里巴巴|华为之后,中国跨境电商也遭遇美国公司“卡脖子”,该如何破局?
- 黑客|如何防止被黑客勒索?终极解决方法来了:不保存重要数据
- 外部环境变化下,如何回归自身调节情绪状态?
- 显卡|实测三大3A游戏!微星海皇戟X的表现到底如何?
- CPU|AMD锐龙7000处理器,为什么如今会有如此争议?提升空间太小了
- 显卡|显卡如洪水一般开始泄洪,很多显卡跌破首发价格。
- iPhone|iPhone 14系列电池容量曝光 网友:还不如iPhone 13系列
- 如果经常在互联网上冲浪|字符验证码的发展趋势