跟踪Google知识图形算法更新波动率

如核心算法,谷歌的知识图定期更新。

但很少有人讨论了如何,何时,何地是什么 – 直到现在。

我相信这些更新由三件事组成:

算法调整。注入策划训练数据。知识图形数据集的刷新。我的公司Kalicube一直在通过API和通过知识面板追踪谷歌的知识图,几年来。

当我写的

布达佩斯UPDA.例如,在2019年,我看到了置信区的大规模增加。从那以后,没有任何争论的地震。下面读数下面

然而,个别实体的分数波动很大,通常超过75%在任何一个月内会发生变化。

例外情况是2019年12月,过去四个月(我稍后会来)。

从2019年7月到6月20日,我们正在追踪每月(因此每月数字)。

Google's Knowledge Graph Volatility by Month

Google's Knowledge Graph Volatility by Month 自7月20日以来,我们每天都在跟踪,看看我们是否可以发现更粒度的图案。我没有看到任何与Andrea Volpini从Wordlift谈话给我击败兔子洞…

读数下面

和在那里,我发现了OME真正令人惊叹的见解。

本文专门关于API返回的结果以及他们将我们提供的洞察力返回,当谷歌更新其知识图表时 – 包括大小更新的性质和日常 – 如果您向我询问,这是一个游戏更换器。

在过去的8个月内更新

星期日,7月12日,2020.Monday, 2020年7月13日,2020年8月12日。,2020年8月22日。,2020年8月22日。,2020年8月22日。9月9日,2020年9月9日,9月19日,2020年9月19日。周三,2012年10月11日,2月11日,2月11日。星期四,2月11日。 25,2021

Knowledge Graph Updates

Knowledge Graph Updates 您可以检查

更新上Kalicube的知识图传感器这里(每日更新)。

对于核心蓝色链路算法更新的任何人,YOU可能会注意到这两者超出了同步,直到2月2021日更新。

我发现的例外(在我的狂野理论中斜体):

10月11日

更新这是毫不舒服的近距离Moz报道的2020年10月12日的索引错误。并且知识图表在这一大规模举动的扭结上工作了3个月的中断? 2月11日更新在转到通行索引后一天发生的情况(2月10日) 2021)。
可以通过基于索引的索引的基于实体的索引?基于段落的索引是关于Chunking Page,以更好地提取实体。 2月25日更新与2012年2月25日和26日的谷歌SERP中的波动性恰逢其当地报告。这可能是核心算法和知识图类现在是同步和基于实体的结果的标志现在是现实?
这些更新的范围,范围和规模 我们可以用力考虑更新的三个方面:幅度(达到/宽度),这是受影响的实体的百分比(到目前为止,在60-80%之间)。幅度
(范围/高度),或置信度分数的变化(向上或向下),每个实体级别(中间五十的平均幅度大约为10-15%)。换档(比例/深度),这是宏观级别置信分数的变化(布达佩斯更新,这少超过0.1%)。

我们通过跟踪知识图

知识图表具有非常定期的更新。 下面的广告联系读数这些更新每2至3周发生每2至3周,但有时会长时间暂停,如上所述。 更新是暴力和突然的更新。

我们看到60-80%的实体受到影响,并且更改可能在整个数据集中立即。

对各个实体的更新继续介于两者之间。

任何个别实体都可以看到其置信度得分增加或随时下降,无论是否有更新。它可以消失(在烟雾的虚拟浮烟中)和有关该实体的信息可以随时在这些主要更新之间的任何时间改变到知识图形aLgorithm和数据。

存在极端的外围病例

个体实体反应非常不同。在每个更新(甚至在介于两者之间),一些更改都是极端的。置信度分数可以在一天内增加多元化。它可以丢弃多折。并且一个实体可以完全消失(当它重新出现它具有新ID时)。

有一个天花板

很少为整个数据集的平均置信度得分即使在发生重大更新的日子中,也会变化超过十分之一的百分比据推测,从完全挤出其余的占据休息(谢谢Jono Alderson的那个Sugge)。

在布达佩斯更新期间的天花板大量提高之后,天花板似乎没有以任何有意义的方式移动。

自布达佩斯影响以来的每一个更新都会影响到达和范围。由于布达佩斯在规模中引发了重大班次以来,没有。

天花板可能再也不会改变。但它可能。如果它确实如此,那将是

。所以保持调整(理想情况下,准备好)。

在大量的实验之后,我们已经孤立并排除了那些极端的异常值。

我们确实跟踪它们并继续尝试查看任何明显的模式。但这是另一天的故事。我们如何测量

我们已经隔离了变化的三个方面中的每一个,并每天在3000个实体的数据集上测量它们。我们措施:

广告联网读数在以下许多实体看到增加或减少(达到​​/宽度/幅度)。变化在微级(范围/高度/幅度)有很大意义。改变变化是整体分数(比例/深度/移位)。

发生了什么事?

一件事很清楚:这些更新一直是暴力,广泛的,突然。

谷歌的人(也许仍然有)“一个大红色按钮。

比尔Slawski

对我提到的BING专利提到了这一过程的精确专利。 周四最后两个更新如果你不想周末工作,那么开发人员的口头禅“从不改变任何事情。”

谷歌知识图舞

Slawski向我提出了一个概念思考sp.Seals卷。谷歌一直在播放“音乐椅”与数据 – 核心算法和知识图算法具有截然不同的需求。

核心算法具有对流行性的基本依赖性

(入站链路的概率引领到你的网站),而知识图表必然需要将这种受欢迎程度/概率放在一边,并查看可靠性/可能的真实性/权威 – 换句话说,信心。

核心算法侧重于字符串/字串

,而知识图依赖于对实体的理解,而那些相同的单词代表。由于谷歌必须使用核心和知识图算法的更新可能是不同步的,而核心和知识图算法的更新可能是不同步的。每次想要更新时,“重新组织”每个方法的数据,然后切换回来。

记住谷歌在当天跳转回来?

在它只是一个批量上传时新的链接数据。这可能是类似的东西。

截至2021年2月,是舞蹈吗?

如果现在是“解决问题”,它仍然可以看到。 我想象我们会看到一些更加同步的舞蹈和彼此更新导致的一些奇怪的错误。

但到了2021年底,两者将是合并到所有意图和目的,实体的搜索将是我们作为营销人员可以生产和可测量地利用的现实。然而

然而,算法演变和进展,潜在的偏移是地震的。

对谷歌的数据语料库分类到实体并根据对这些实体的理解的信心组织这些信息是

巨大

从组织纯粹的相关性的组织相同的数据(如此到目前为止,案例为止)。广告联系读数读数下方算法的融合? 意见:以下事情让我认为这是谷歌真正实施的那一刻〜202021从字符串到事物“(五年后的PR):当核心算法相对活跃时,从10月到2月的三个月的中断,但知识图更新非常清楚地暂停。这个话题的宣布第11月层是活跃的。基于段落的Indexin引入g到2月的核心算法,似乎专注于提取实体。更新的趋势(这是新的;我们只有两个更新判断,我们的跟踪可能会在这一点上证明我错误) 。

知识图是一个生物

知识图表似乎基于数据 – 湖泊方法而不是当今核心算法的数据河方法(延迟反应与立即效果)。

然而,实体在这些重大更新之间改变和移动的事实以及更新似乎融合的事实表明,我们不仅仅是一种不仅适用于新数据河流的知识图算法,而且是还作为核心算法的零件和地块整合。

这是一个特定的eXample将更新映射到我姓名的信心分数(我的一个实验之一)的更改。

vistigitord下降的广告传票读数不会映射到更新。

是一个在我的一部分上的错误,并表明对各个实体的更新正在进行中,并且可以是极端的!

阅读关于我对

的贡献中的那个特定灾难,通过SE排名

未来我的注意:“大红色按钮”将逐步退休,暴力和突然更新会被更换和换档更换,更加顺畅,更不可见。

在下面

下面的广告传票读数实体在核心蓝色链路算法中的集成将越来越逐渐增量和IMPOS可以跟踪(所以让我们在我们愿意的时候充分利用它)。

很明显,谷歌正在迅速发展朝着对世界的准人理解,其所有算法越来越依赖于对其的理解实体及其对其理解的信心。

SEO世界将需要真正拥抱实体,并通过其知识图表向谷歌进行教育越来越关注。

结论

在这篇文章中,我有目的地坚持我相当自信的事情将被证明是真实的。

我有数百种想法,理论和计划,我的公司每月继续跟踪70,000多个实体 – 每天超过3,000次。

我也在知识图和知识面板上运行超过500个积极的实验(包括我的知识面板)Elf,蓝狗和黄色考拉),所以期待更多新闻。Knowledge Graph API score

在此期间,我只是希望谷歌不会削减我对知识图形API的访问!广告Continue读数下面Knowledge Graph API score 更多资源:

什么是谷歌知识图和它是如何使用谷歌知识图表的方式

如何最大限度地提高您的范围

的个性化实体储存库在知识图

图像积分

[]所有由作者截取的屏幕截图2021年3月123