索引101
谷歌对其
没有索引它可以找到的所有页面的事实是开放的事实
。使用Google Search控制台,您可以在网站上看到未索引的网站上的页面。
Google搜索控制台还为您提供有关防止页面索引的特定问题的有用信息。
这些问题包括服务器错误,404s,并且页面可能具有薄或
复制内容
。
但我们从未看到任何数据显示哪些问题是最常见的整个网络。
在本文中,我们将探讨防止您的页面在Google搜索中出现的最受欢迎的索引问题。
索引101
索引就像构建一个库,除非谷歌与网站交易。
如果您希望您的页面出现在搜索中,则必须正确索引。在Layman的条款中,Google必须找到它们并保存它们。
然后,谷歌可以分析他们的内容,以决定他们可能是相关的查询。
获得索引是获得有机的先决条件谷歌的流量。随着您网站的更多页面获得索引,您可以在搜索结果中出现更多的机会。
这就是为什么您知道谷歌是否可以索引y非常重要我们的内容。
这是我识别索引问题的所作所为
我的日常任务包括从技术SEO
观点来优化网站,使它们更加可见谷歌并因此,我可以访问几十个地点在Google搜索控制台中。为了透明,我突破了导致我一些有趣的结论的方法。
广告联网读数下方
方法
我开始创建一个页面,组合来自两个来源的数据:我使用了我们的客户端的数据,这些数据随时可用。我询问其他SEO专业人员通过发布Twitter民意调查来与我分享匿名数据直接与一些SEO联系。
SEO,我需要3-10分钟的时间。 你能帮助我对索引并与我分享一些非敏感的GSC统计数据吗? 当我找到一些有趣的见解时,我将发布一篇文章。
提前谢谢!请r / t
🙏🙏 https://t.co/vawmulqtsx
– Tomek Rudzki(@Tomekrudzki)11月9日11月9日
两者都证明了富有成效的信息来源。
不包括不可转位的页面
您的兴趣留出一些页面索引。这些包括旧网址,不再相关的文章,电子商务中的过滤器参数等。
网站管理员可以确保谷歌忽略了它们的数量方法包括
robots.txt文件
和 noindex标记。
考虑这些页面会对我的研究结果产生负面影响,因此我删除了页面遇到下面的示例中的任何条件:
由robots.txt阻止。标记为noindex.redirected.rurning http 404状态代码。
[为了进一步提高我的样本的质量,我只考虑了站点地图中包含的页面。
基于我的经验, SITIMAPS
是来自给定的有价值URL的最明显表示网站
当然,他们的网站地图有许多网站。有些甚至包括他们
站点地图和robots.txt文件中的相同网址。
但我拿了我在上一步中的重新中。
分类数据
我发现流行的索引问题因网站的大小而异。
这里是我如何分开数据:
小网站(最多10k页).medium网站(从10k到100k页).big网站(高达一百万页).huge网站(超过100万页).AadvertisementContinue阅读下面
由于我的样本中网站大小的差异,我必须找到一种方法来规范数据。
与特定问题的一个非常大的网站可能超过其他问题,较小的网站可能有。
所以我单独看待每个网站,以对他们挣扎的索引问题进行排序。然后我根据PA的数量分配给索引问题受到给定网站上给定问题影响的GES。
和判决是…
以下是我在各种规模的网站上找到的前五个问题。
爬行 – 目前未索引(质量问题).DPUPLATE CONTED.DISCOVERDED – 目前未索引(爬网预算/质量问题).soft 404.CRAWL问题。让我们打破这些问题。
质量
质量问题包括您的页面内容,误导或过于偏见。
如果您的页面没有提供谷歌想要向用户展示的独特,有价值的内容,您将拥有困难的时间索引(并且不应该感到惊讶)。
下面
复制内容
谷歌可以将您的一些页面识别为重复内容,甚至可以识别一些页面如果你迪不是意味着发生这种情况。
常见问题是指向不同页面的规范标签。结果是原始页面未获得索引。
如果确实有重复内容,请使用规范标记属性或301重定向。
这将有助于您确保相同的页面您的网站不竞争彼此,以获取视图,单击和链接。
爬网预算
什么是爬网预算
?基于几个因素,GoogleBot只会在每个网站上抓取一定数量的URL。
这意味着优化是至关重要的;不要让它在你不关心的页面上浪费时间。 软404s
404误差是指您提交删除或不存在的页面索引。
软404s
显示“不是找到“信息,但不要将HTTP 404状态代码返回到服务器。 将删除的页面重定向到无关的其他人是一个常见的错误。
广告联系读数下面的
多重定向也可以显示为软404错误。努力尽可能缩短重定向链。 爬网问题
有很多爬网问题,但一个重要的是robots.txt的问题。如果GoogleBot为您的网站找到一个robots.txt但无法访问它,它根本不会爬网。
最后,让我们看看不同网站大小的结果。 小网站
样本大小:44站点
爬网,目前未索引(质量或爬网预算问题).duplicate content.crawl预算问题.soft 404.crawl问题。
培养基网站
样本大小:8个站点
重复内容.Discovered,目前不索引(爬网预算/质量问题).Awrawled,目前未索引(质量问题).soft 404(质量问题) .crawl问题。下面的前往
大网站
样本大小:9站点
爬网,目前没有索引(质量问题).discovered,目前没有索引(爬网预算/质量问题).duplicate content.soft 404.crawl问题。巨大的网站
样本大小:9个站点
爬网,目前没有索引(质量问题).Discovered,目前没有索引(爬网预算/质量问题)。重复内容(未选择的复制,提交的URL,未选择为规范).soft 404.Crawl问题。常见索引问题的关键外来介绍
是有趣的,根据THESE调查结果,两种尺寸的网站遭受同样的问题。这表明在大型网站的情况下保持质量是多么困难。
大于100K,但小于100万.LARGRGER比100万。然而,外带是:
甚至相对由于爬网预算不足,小网站(10k +)可能无法完全索引。该网站的更大是,爬行预算/质量问题越强。重复的内容问题严重,但根据网站而改变其性质。
PS.关于Google
未知的URL
在我的研究期间,我意识到有一个更常见的问题可以防止页面索引。
下面的广告联系读数
它可能没有赢得其位置排名A.偷猎但仍然很重要,我很惊讶地看到它仍然如此受欢迎。
我在谈论
孤儿网。
您网站上的一些页面可能有没有导致他们的内部链接。
如果GoogleBot没有路径通过您的网站找到一个页面,可能根本找不到它。
解决方案是什么?添加相关页面的链接。
您还可以通过将孤立方式添加到地点地图来手动修复此操作。不幸的是,许多网站管理员仍然忽略了这样做。
Googlebot不索引右页? Google提供5种方法来修复
高级技术SEO:一个完整的指南