Google Search是一款全自动化搜索引擎,结合Google自主研发的网页抓取与分析工具“GoogleBot”定期向整个网络发起探索,并从中找出对用户有价值且权威性内容,添加到Google搜索结果中。实际上,Google搜索结果中显示的大多数网页,均非用户手动提交。
本指南从网站运营的角度,介绍了Google搜索各个阶段的工作原理与方式。掌握这些知识以后,您就可以彻底解决网站抓取问题。从而让您的网页更加容易被Google编入索引,并且让您对Google搜索的呈现效果充满信心和期待。
- 想要查看您的网站得分较低的网页?请阅读使用Search Console监控并且优化网站,该指南将教您如何提升网站表现。
Google搜索展现的三个阶段 #
Google对于新发现的网站页面,通常会经历3个阶段,最终决定Google是否会在搜索结果中展现。需求说明的是,并非每个网页都会经历这3个阶段:
- 抓取:Google将会自动运行“抓取工具”程序,从互联网的“池子”中主动发掘各类网页,并保存其中的文本、图片和视频内容。
- 编入索引:随后,Google会将上述保存的文本、图片和视频文件加以分析。并将有价值的信息片段,存储在Google索引的大型数据库中。
- 搜索结果展现(SERP):当用户使用Google搜索相关信息时,Google会筛选与用户查询相关的信息作为精准推荐。
1.1 第一阶段——抓取 #
第一步是Google从互联网中找到可供抓取的网页。由于需要构建巨大的信息数据库,Google必须不断搜索新网页,并按照复杂的分类算法将其添加至已经构建完成的网页列表中。这个过程被统一称为“发现新的网页”的过程。
然而,在定向已知网页中存在的新网页链接时,Google会通过链接发现其他网页。例如产品分类页面包含的产品详情页文本、图片甚至是视频链接。当您以Sitemap列表形式(站点地图)提交一系列网页义工Google抓取时,Google也会乐此不疲地寻找它们的踪迹。
当Google发现网页之后,将会尝试访问网页以了解其中的内容。Googlebot使用算法流程确定需要抓取的目标网页(Loc URL)、抓取频率(Frequency)、网页权重(Priority)以及每个网页的最近更新时间(Lastmod)。这些固定字段和对应的自定义参数,将向谷歌解释页面对于Google搜索展现的重要程度。
但是,Googlebot不会抓取它发现的所有网页。比如某些网页在sitemap.xml文件中,被网站所有者设置为禁止抓取(Disallow)。还有一些不被抓取的功能页面,则需要用户登录网站才能访问。
1.2 第二阶段——编入索引 #
在抓取网页后,Google将会尝试解读网页的所有内容。这一阶段称为“编入索引”。包括处理和分析文字内容以及关键内容标记和属性,例如 <title>元素、图片Alt属性以及视频字幕与标签等。
在索引过程中,Google会经过多次分析并判断:目标网页是否与互联网中的其他网页(已发现编入索引和已发现未编入索引)存在重复或者抄袭,从而决定是否将其归类为规范网页。 规范网页,将获得很大概率显示在搜索结果中。为了选择规范网页,Google将从内容类似的(也称为聚类)网页中,选取最具代表性的网页。而该聚类中的其他网页,将作为备用与补充版本在不同情况下提供展示机会。
除此之外,Google还会收集关于规范网页包含的规范元素,这些元素可能会在不同用户搜索意图与需求时用到。它们可能包括:网页多语言、内容所针对的国家/地区、网页易用性等。
是否会编入索引还取决于网页内容及其元数据。一些常见的编入索引问题可能包括:
- 网页内容质量较低
- 网站的设计与用户体验不符合编入条件
- Robots.txt规则明确禁止编入索引
1.3 第三阶段——展现搜索结果 #
- 您的网站至今仍然无法被Google展现?请在线与SkilledTube专家团队取得联系,免费获取网站Google优化建议。
用户输入查询指令时,Google将会根据用户搜索意图匹配相关的网页,并展示Google认为最有价值且优质的结果。相关性是由数百个因素共同决定,其中可能包括用户的物理位置、语言和使用设备(桌面设备或手机)等实时信息。例如,在用户搜索“汽车租赁服务”后,Google向美国洛杉矶用户显示的结果与向香港用户显示的结果迥然不同。
根据用户的查询要求,搜索结果中展示的搜索功能也会发生变化。例如,如果您搜索“自助披萨店铺”时,系统将会根据您当前位置显示本地搜索结果,而不会推荐图片或者视频。您可以在我们的搜索视觉元素库中,探索Google网页搜索展现最常见的视觉元素。
虽然本指南介绍了Google搜索的工作原理,但是Google仍然深入分析用户搜索意图,一直在努力改进算法。您可以关注 SkilledTube搜索中心博客,及时了解这些算法更新并且精准剖析背后原因。