网站规模的5个最常见的Google索引问题搜索引擎结果页面优化大师

索引101

谷歌对其

没有索引它可以找到的所有页面的事实是开放的事实

。使用Google Search控制台，您可以在网站上看到未索引的网站上的页面。

Google搜索控制台还为您提供有关防止页面索引的特定问题的有用信息。

这些问题包括服务器错误，404s，并且页面可能具有薄或

复制内容

。

但我们从未看到任何数据显示哪些问题是最常见的整个网络。

所以我决定自己收集数据并自己编译统计数据！

在本文中，我们将探讨防止您的页面在Google搜索中出现的最受欢迎的索引问题。

索引101

索引就像构建一个库，除非谷歌与网站交易。

如果您希望您的页面出现在搜索中，则必须正确索引。在Layman的条款中，Google必须找到它们并保存它们。

然后，谷歌可以分析他们的内容，以决定他们可能是相关的查询。

获得索引是获得有机的先决条件谷歌的流量。随着您网站的更多页面获得索引，您可以在搜索结果中出现更多的机会。

这就是为什么您知道谷歌是否可以索引y非常重要我们的内容。

这是我识别索引问题的所作所为

我的日常任务包括从技术SEO
观点来优化网站，使它们更加可见谷歌并因此，我可以访问几十个地点在Google搜索控制台中。

为了透明，我突破了导致我一些有趣的结论的方法。

广告联网读数下方

方法

我开始创建一个页面，组合来自两个来源的数据：我使用了我们的客户端的数据，这些数据随时可用。我询问其他SEO专业人员通过发布Twitter民意调查来与我分享匿名数据直接与一些SEO联系。

SEO，我需要3-10分钟的时间。你能帮助我对索引并与我分享一些非敏感的GSC统计数据吗？当我找到一些有趣的见解时，我将发布一篇文章。

提前谢谢！请r / t

＆＃128591;＆＃128591; https://t.co/vawmulqtsx

– Tomek Rudzki（@Tomekrudzki）11月9日11月9日

两者都证明了富有成效的信息来源。

不包括不可转位的页面

您的兴趣留出一些页面索引。这些包括旧网址，不再相关的文章，电子商务中的过滤器参数等。

网站管理员可以确保谷歌忽略了它们的数量方法包括

robots.txt文件

和 noindex标记。

考虑这些页面会对我的研究结果产生负面影响，因此我删除了页面遇到下面的示例中的任何条件：

由robots.txt阻止。标记为noindex.redirected.rurning http 404状态代码。

不包括非有价值的页面

[为了进一步提高我的样本的质量，我只考虑了站点地图中包含的页面。

基于我的经验， SITIMAPS

是来自给定的有价值URL的最明显表示网站

当然，他们的网站地图有许多网站。有些甚至包括他们

站点地图和robots.txt文件中的相同网址。

但我拿了我在上一步中的重新中。

分类数据

我发现流行的索引问题因网站的大小而异。

这里是我如何分开数据：

小网站（最多10k页）.medium网站（从10k到100k页）.big网站（高达一百万页）.huge网站（超过100万页）.AadvertisementContinue阅读下面

由于我的样本中网站大小的差异，我必须找到一种方法来规范数据。

与特定问题的一个非常大的网站可能超过其他问题，较小的网站可能有。

所以我单独看待每个网站，以对他们挣扎的索引问题进行排序。然后我根据PA的数量分配给索引问题受到给定网站上给定问题影响的GES。

和判决是…

以下是我在各种规模的网站上找到的前五个问题。

爬行 – 目前未索引（质量问题）.DPUPLATE CONTED.DISCOVERDED – 目前未索引（爬网预算/质量问题）.soft 404.CRAWL问题。让我们打破这些问题。

质量

质量问题包括您的页面内容，误导或过于偏见。

如果您的页面没有提供谷歌想要向用户展示的独特，有价值的内容，您将拥有困难的时间索引（并且不应该感到惊讶）。

下面

复制内容

谷歌可以将您的一些页面识别为重复内容，甚至可以识别一些页面如果你迪不是意味着发生这种情况。

常见问题是指向不同页面的规范标签。结果是原始页面未获得索引。

如果确实有重复内容，请使用规范标记属性或301重定向。

这将有助于您确保相同的页面您的网站不竞争彼此，以获取视图，单击和链接。

爬网预算

什么是爬网预算

？基于几个因素，GoogleBot只会在每个网站上抓取一定数量的URL。

这意味着优化是至关重要的;不要让它在你不关心的页面上浪费时间。软404s

404误差是指您提交删除或不存在的页面索引。

软404s

显示“不是找到“信息，但不要将HTTP 404状态代码返回到服务器。将删除的页面重定向到无关的其他人是一个常见的错误。

广告联系读数下面的

多重定向也可以显示为软404错误。努力尽可能缩短重定向链。爬网问题

有很多爬网问题，但一个重要的是robots.txt的问题。如果GoogleBot为您的网站找到一个robots.txt但无法访问它，它根本不会爬网。

最后，让我们看看不同网站大小的结果。小网站

样本大小：44站点

爬网，目前未索引（质量或爬网预算问题）.duplicate content.crawl预算问题.soft 404.crawl问题。

培养基网站

样本大小：8个站点

重复内容.Discovered，目前不索引（爬网预算/质量问题）.Awrawled，目前未索引（质量问题）.soft 404（质量问题） .crawl问题。下面的前往

大网站

样本大小：9站点

爬网，目前没有索引（质量问题）.discovered，目前没有索引（爬网预算/质量问题）.duplicate content.soft 404.crawl问题。巨大的网站

样本大小：9个站点

爬网，目前没有索引（质量问题）.Discovered，目前没有索引（爬网预算/质量问题）。重复内容（未选择的复制，提交的URL，未选择为规范）.soft 404.Crawl问题。常见索引问题的关键外来介绍

是有趣的，根据THESE调查结果，两种尺寸的网站遭受同样的问题。这表明在大型网站的情况下保持质量是多么困难。

大于100K，但小于100万.LARGRGER比100万。然而，外带是：

甚至相对由于爬网预算不足，小网站（10k +）可能无法完全索引。该网站的更大是，爬行预算/质量问题越强。重复的内容问题严重，但根据网站而改变其性质。

PS.关于Google

未知的URL

在我的研究期间，我意识到有一个更常见的问题可以防止页面索引。

下面的广告联系读数

它可能没有赢得其位置排名A.偷猎但仍然很重要，我很惊讶地看到它仍然如此受欢迎。

我在谈论

孤儿网。

您网站上的一些页面可能有没有导致他们的内部链接。

如果GoogleBot没有路径通过您的网站找到一个页面，可能根本找不到它。

解决方案是什么？添加相关页面的链接。

您还可以通过将孤立方式添加到地点地图来手动修复此操作。不幸的是，许多网站管理员仍然忽略了这样做。

更多资源： 11 SEO提示和技巧改善指数

Googlebot不索引右页？ Google提供5种方法来修复

高级技术SEO：一个完整的指南