网站规模的5个最常见的Google索引问题

索引101

谷歌对其

没有索引它可以找到的所有页面的事实是开放的事实

。使用Google Search控制台,您可以在网站上看到未索引的网站上的页面。

Google搜索控制台还为您提供有关防止页面索引的特定问题的有用信息。

这些问题包括服务器错误,404s,并且页面可能具有薄或

复制内容

但我们从未看到任何数据显示哪些问题是最常见的整个网络。

所以我决定自己收集数据并自己编译统计数据!

在本文中,我们将探讨防止您的页面在Google搜索中出现的最受欢迎的索引问题。

索引101

索引就像构建一个库,除非谷歌与网站交易。

如果您希望您的页面出现在搜索中,则必须正确索引。在Layman的条款中,Google必须找到它们并保存它们。

然后,谷歌可以分析他们的内容,以决定他们可能是相关的查询。

获得索引是获得有机的先决条件谷歌的流量。随着您网站的更多页面获得索引,您可以在搜索结果中出现更多的机会。

这就是为什么您知道谷歌是否可以索引y非常重要我们的内容。

这是我识别索引问题的所作所为

提前谢谢!请r / t

🙏🙏 https://t.co/vawmulqtsx

– Tomek Rudzki(@Tomekrudzki)11月9日11月9日

两者都证明了富有成效的信息来源。

不包括不可转位的页面

您的兴趣留出一些页面索引。这些包括旧网址,不再相关的文章,电子商务中的过滤器参数等。

网站管理员可以确保谷歌忽略了它们的数量方法包括

robots.txt文件

noindex标记

考虑这些页面会对我的研究结果产生负面影响,因此我删除了页面遇到下面的示例中的任何条件:

由robots.txt阻止。标记为noindex.redirected.rurning http 404状态代码。

不包括非有价值的页面

[为了进一步提高我的样本的质量,我只考虑了站点地图中包含的页面。

基于我的经验, SITIMAPS

是来自给定的有价值URL的最明显表示网站

当然,他们的网站地图有许多网站。有些甚至包括他们

站点地图和robots.txt文件中的相同网址。

但我拿了我在上一步中的重新中。

分类数据

我发现流行的索引问题因网站的大小而异。

这里是我如何分开数据:

小网站(最多10k页).medium网站(从10k到100k页).big网站(高达一百万页).huge网站(超过100万页).AadvertisementContinue阅读下面

由于我的样本中网站大小的差异,我必须找到一种方法来规范数据。

与特定问题的一个非常大的网站可能超过其他问题,较小的网站可能有。

所以我单独看待每个网站,以对他们挣扎的索引问题进行排序。然后我根据PA的数量分配给索引问题受到给定网站上给定问题影响的GES。

和判决是…

以下是我在各种规模的网站上找到的前五个问题。

爬行 – 目前未索引(质量问题).DPUPLATE CONTED.DISCOVERDED – 目前未索引(爬网预算/质量问题).soft 404.CRAWL问题。让我们打破这些问题。

质量

质量问题包括您的页面内容,误导或过于偏见。

如果您的页面没有提供谷歌想要向用户展示的独特,有价值的内容,您将拥有困难的时间索引(并且不应该感到惊讶)。

下面

复制内容

谷歌可以将您的一些页面识别为重复内容,甚至可以识别一些页面如果你迪不是意味着发生这种情况。

常见问题是指向不同页面的规范标签。结果是原始页面未获得索引。

如果确实有重复内容,请使用规范标记属性或301重定向。

这将有助于您确保相同的页面您的网站不竞争彼此,以获取视图,单击和链接。

爬网预算

什么是爬网预算

?基于几个因素,GoogleBot只会在每个网站上抓取一定数量的URL。

这意味着优化是至关重要的;不要让它在你不关心的页面上浪费时间。 软404s

404误差是指您提交删除或不存在的页面索引。

软404s

显示“不是找到“信息,但不要将HTTP 404状态代码返回到服务器。 将删除的页面重定向到无关的其他人是一个常见的错误。

广告联系读数下面的

多重定向也可以显示为软404错误。努力尽可能缩短重定向链。 爬网问题

有很多爬网问题,但一个重要的是robots.txt的问题。如果GoogleBot为您的网站找到一个robots.txt但无法访问它,它根本不会爬网。

最后,让我们看看不同网站大小的结果。 小网站

样本大小:44站点

爬网,目前未索引(质量或爬网预算问题).duplicate content.crawl预算问题.soft 404.crawl问题。

培养基网站

样本大小:8个站点

重复内容.Discovered,目前不索引(爬网预算/质量问题).Awrawled,目前未索引(质量问题).soft 404(质量问题) .crawl问题。下面的前往

大网站

样本大小:9站点

爬网,目前没有索引(质量问题).discovered,目前没有索引(爬网预算/质量问题).duplicate content.soft 404.crawl问题。巨大的网站

样本大小:9个站点

爬网,目前没有索引(质量问题).Discovered,目前没有索引(爬网预算/质量问题)。重复内容(未选择的复制,提交的URL,未选择为规范).soft 404.Crawl问题。常见索引问题的关键外来介绍

是有趣的,根据THESE调查结果,两种尺寸的网站遭受同样的问题。这表明在大型网站的情况下保持质量是多么困难。

大于100K,但小于100万.LARGRGER比100万。然而,外带是:

甚至相对由于爬网预算不足,小网站(10k +)可能无法完全索引。该网站的更大是,爬行预算/质量问题越强。重复的内容问题严重,但根据网站而改变其性质。

PS.关于Google

未知的URL

在我的研究期间,我意识到有一个更常见的问题可以防止页面索引。

下面的广告联系读数

它可能没有赢得其位置排名A.偷猎但仍然很重要,我很惊讶地看到它仍然如此受欢迎。

我在谈论

孤儿网。

您网站上的一些页面可能有没有导致他们的内部链接。

如果GoogleBot没有路径通过您的网站找到一个页面,可能根本找不到它。

解决方案是什么?添加相关页面的链接。

您还可以通过将孤立方式添加到地点地图来手动修复此操作。不幸的是,许多网站管理员仍然忽略了这样做。

更多资源: 11 SEO提示和技巧改善指数

Googlebot不索引右页? Google提供5种方法来修复

高级技术SEO:一个完整​​的指南