谷歌使用预测方法来基于URL模式检测
复制内容,这可能导致页面被错误地标识为重复。为了防止不必要的爬行和索引,谷歌尝试预测页面可能基于其URL包含类似或重复的内容。
当Google抓取具有类似URL模式的页面并找到它们包含相同内容时,它可以确定具有该URL模式的所有其他页面同样的内容也是如此。遗憾的是,对于网站所有者来说,可能意味着具有唯一内容的页面,因为它们具有与实际复制的页面相同的URL模式。然后将从谷歌的索引中遗漏。
本主题是讨论了During谷歌搜索中央SEO环聊录得3月5日。网站老板Ruchit Palel向穆勒询问他的事件网站,其中成千上万的URL没有正确索引。
穆勒的理论之一,为什么发生这种情况是因为用于检测重复内容的预测方法。
在下面的部分中读取穆勒的读数
读取穆勒的响应。
谷歌的John Mueller预测重复内容
谷歌拥有多个级别确定Web页面何时具有重复的内容。
其中一个是直接查看页面内容,另一个是预测页面何时基于其URL重复。
“在我们方面往往发生了什么是我们有多种程度的试图在那里了解在网站上是重复的内容。一个是,当我们直接查看页面的内容时,我们有点看,很好,这个页面有这个内容,这个页面有不同的内容,我们应该将它们视为单独的页面。
另一件事是善良的我们在我们看到我们看到的网站的URL结构的广泛预测方法中,我们在过去,当我们看看这样的网址时,我们已经看到他们具有与之相同的内容像这样的网址。然后我们基本上都会学习那种模式,看起来像这样的网址与看起来这样的网址相同。“
upers读数下面
穆勒继续解释谷歌的原因在爬行和索引方面时要节省资源。
谷歌认为一个页面是另一个页面的重复版本,因为它具有类似的网址,甚至不会抓取所述页面以查看内容真正的内容。
“即使不看我们的个人网址有时可以说,好吧,我们会拯救自己一些爬行和索引,并专注于这些假设或非常可能的复制病例。而且我已经看到了像城市这样的事情发生。
我已经看到了这样的事情,我不知道,汽车是我们看到的另一个,在那里我们的系统基本上我们的系统认识到你指定作为城市名称的是与实际URL不相关的东西。通常我们在网站提供许多具有备用名称的情况时,我们了解这种模式。“
穆勒对H说话ov oom over over检测重复内容的预测方法可能会影响事件网站:
“如此,随着事件站点,我不知道您的网站是否是这种情况,它可能会发生一个事件网站你拍了一个城市,你拍了一个可能一公里的城市,你展示的活动页面完全相同,因为相同的事件与这两个地方都相关。
和你乘坐一个城市可能五公里,你再次展示了同样的事件。从我们身边,可以很容易地在我们说的情况下,我们检查了10个事件URL,并且这个看起来像城市名称的参数实际上是无关紧要的,因为我们检查了其中10个并且它显示了相同的内容。
这是我们系统的东西然后可以说,也许整体城市名称是无关紧要的,我们可以忽略它。
读数下面
网站所有者可以做些什么来纠正这个问题?
作为这个问题的潜在修复,Mueller建议寻找存在重复内容的真实情况并尽可能地限制的情况。
“所以我会的在这样的情况下尝试做的是,看看你是否有这种情况,你有强有力的内容重叠,并尝试找到尽可能限制的方法。
并且可以是使用类似于rel cononical的东西并说,嗯,这个在大城市外面的小城市,我将把规范设置为大城市,因为它显示了山姆e内容。
那么我们真的可以看到你的网站和索引的每个网址,我们可以看到,这个网址和其内容是唯一的,让我们保留所有这些URL索引是很重要的。
或者我们看到明确的信息,您知道的此URL应该与另一个相同,您可能设置重定向或者您在那里有一个rel canonical设置,我们可以专注于那些主要网址并仍然明白城市方面对您的个人页面至关重要。排名信号与重复内容相关联。
最多,谷歌不会索引重复内容,但它不会反映negatively在整个网站上。
请参阅:
谷歌:重复内容不是负排名因子
听到穆勒的响应在下面的视频中: