5 Google搜索控制台的顶级爬网统计信息

谷歌搜索控制台

中有一个报告,这绝对是非常有用的并且很难找到,特别是如果你只是开始你的SEO旅程。 这是每个SEO专业人员的强大工具

之一,即使您甚至无法从谷歌搜索控制台的主界面内访问它。

i在谈论爬网统计报告。在本文中,您将了解为什么本报告如此重要,如何访问它,以及如何将其用于SEO优势。

您的网站如何爬行?

爬网预算

(Googlebot可以和想要爬网的页数对于SEO至关重要,特别是对于大型网站。

如果您网站的爬网预算有问题,谷歌可能不会索引一些宝贵的页面。广告Continue读数下面

并俗说,如果谷歌没有索引一些东西,那么它不存在。

掌握了这种知识,你可以找到可能导致你的SEO问题的异常。

潜入你的爬网统计数据:5密钥见解

访问您的爬网统计数据报告,登录您的Google搜索控制台帐户并导航到

设置>爬网统计

以下是您可以检查的所有数据维度爬网统计报告:

1。主持人想象一下您在shop.website.com上有一家电子商务商店和博客上的博客。

使用爬网统计报告,您可以轻松地看到与之相关的爬网统计数据您网站的每个子域。

不幸的是,这种方法目前不适用于子文件夹。

2。 http status

爬网统计报告的另一个用例是查看爬网URL的状态代码。

这是因为您不希望GoogleBot花费不是资源爬行页面http 200确定。它是浪费你的爬行预算。

读取下面的

读取爬下来的崩溃状态码

状态码

,转到

设置>爬网统计>爬网请求细分

[在这个特殊情况下,在这个特殊情况下,为重定向页面进行了16%的所有请求 如果你看到这样的统计数据,我建议进一步调查和寻找重定向蛇数和其他潜在问题。在我看来,您在此处可以看到的最糟糕的案例之一是大量的5xx错误。

引用谷歌的文档:“如果站点向下减速或响应服务器错误,则限制下降,GoogleBot逐步爬网。”Google Search Console's Crawl stats report showing a breakdown of crawled URLs per HTTP response type.

如果您对本主题感兴趣,Roger Montti写了详细文章Google Search Console's Crawl stats report showing a breakdown of crawled URLs per HTTP response type.在Google搜索控制台中的5xx错误。

3。目的 爬网统计报告将爬网目的分为两类:

URL用于刷新以刷新目的(已知页面的播放,例如,GoogleBot正在访问您的主页以发现新的链接和内容).URLS用于发现目的(第一次爬网的URL)。这个崩溃非常有用,这里是一个例子:

A chart showing an ecommerce website's crawl statistics.

A chart showing an ecommerce website's crawl statistics.

我最近遇到了一个归类为“发现的 – 目前未索引的100万页的网站。

这个问题占该网站上所有页面的90%。(如果你不熟悉它,“发现但不是索引”意味着谷歌发现了一个给定的页面,但没有访问它。如果您在您的城镇中发现了一个新的餐馆,但并没有给它尝试。) 广告联接键在下面的

中的一个选择是等待,希望谷歌逐渐索引这些页面。

Google Search Console's Crawl stats reporting showing a breakdown of crawl purpose.另一种选择是看看da托和诊断问题。所以我登录到Google Search控制台并导航到

设置>爬网统计>爬网请求:HTML 。Google Search Console's Crawl stats reporting showing a breakdown of crawl purpose.原来,平均而言,谷歌每天只访问7460页。

广告Continue读数下面

由于爬网统计报告,我发现,这7460个URL中只有35%是

的发现

原因。

Google Search Console's URL Inspection Tool allows you to look up a given URL's last crawled date..

Google Search Console's URL Inspection Tool allows you to look up a given URL's last crawled date..

这只是每天发现的2611个新页面。

2611超过一百万。

这需要382天对于谷歌来完全索引整个网站。

发现这是一个GameChanger。所有其他搜索选择随着我们完全专注于爬网预算优化的推迟,提出了暗示。

读数下方

4。文件类型

GSC爬网统计数据对JavaScript网站有所帮助。您可以轻松地检查GoogleBot爬网的频率粗略渲染所需的JS文件。

如果您的网站包装有图像和图像搜索对于您的SEO策略至关重要,则此报告也会有很多帮助 – 您可以看出Googlebot如何抓取您的图像。

5。 Googlebot类型 最后,爬网统计报告为您提供了用于爬网网站的Googlebot类型的详细故障。

您可以了解移动或桌面Googlebot所做的请求百分比和图像,视频和广告机器人。其他有用信息 [值得注意的是,爬网统计报告有宝贵的信息,您无法在服务器日志中找到: DNS错误.Page超时.Host问题,例如获取robots.txt文件的问题。使用爬网URL检测工具中的统计数据


您还可以在URL检查工具中访问爬网统计报告之外的一些粒度爬网数据。

我最近与一家大型电子商务网站合作了并且,在一些初步分析之后,注意到两个按下问题:许多产品页面未在Google中索引。产品之间没有内部链接。谷歌发现新内容的唯一方法是通过站点地图和分页类别页面。自然的下一步是访问服务器日志并检查谷歌是否有CR哎呀分页类别页面。但是进入服务器日志往往非常困难,特别是当您使用大型组织时。

谷歌搜索控制台的爬行统计报告来救援。 让我通过我使用的过程指导您,如果您正在努力使用类似的问题,可以使用:

1。首先,在URL检测工具中查找一个URL。我从网站的主要类别中选择了一个分页页。 2。然后,导航到报导>抓取报告。 在这种情况下,该URL是上次检索3几个月前。以下的广告传票读数记住,这是网站的主要类别页面之一,这些网站没有爬行超过三个月了!我更深入并检查了其他类别页面的样本。 结果表明GoogleBot从未访问过许多主要类别页面。他们中的许多人仍然不知道谷歌。 我认为我不需要解释当您在改进任何网站的可见性时拥有该信息的重要性。 爬网统计报告允许您在几分钟内查看这样的内容。 包装 如您所见,即使您可以使用Google搜索控制台,爬网统计报告是一个功能强大的SEO工具多年没有找到它。 它将帮助您诊断索引问题并优化您的爬网预算,以便谷歌可以快速找到和索引您的宝贵内容,这对此尤为重要大站点。 我给了你几个用例来想到,但现在球在你的球场。广告联系读数下面如何使用此数据来提高您的网站的可见性?更多资源: 爬行 – 首先SEO:在爬网之前进行12步指南 7提示优化SEO的爬网预算 如何搜索引擎的工作 图片来源 采取作者所有截图,2021年4月