这已经讨论了近二十年并且基于证据的事实已经存在。
这是潜在语义索引
潜在语义索引(也称为潜在语义分析)是一种分析一组的方法文件I.n命令发现出现在一起的单词的统计共同发生,然后在那些单词和文档的主题中介绍。
LSI向解决问题的两个问题(几个)是问题同义词和多义。
同义词
是对可以描述同一件事的单词的引用。
搜索“浮动食谱”的人等于搜索“煎饼食谱”(英国外面)因为烙饼和煎饼是代名词。
下面
的广告联系读数读取多义读数是指具有多个含义的单词和短语。 Jaguar这个词可以指动物,汽车或美式足球队。
LSI能够统计预测统计网格代表哪个词的含义y分析文件中共发生的单词。
如果“Jaguar”这个词伴随着“杰克逊维尔”这个词,它是统计上可能的,“Jaguar”这个词是一个参考美式足球队。
通过了解单词如何一起出现单词,通过将
LSI
申请LSI
于1988年9月15日提交。这是我们所知道的互联网前几年来的旧技术。
LSI并不新鲜,也不是它边缘。
重要的是要理解,1988年,LSI正在推进简单文本匹配的领域。
LSI在互联网之前并创造了一次N Apple计算机看起来如此:
LSI是在一个流行的商业计算机(IBM AS / 400)看起来这样的:
lsi是一种方法回来的技术。
广告联系读数在下面就像从1988年的计算机一样,状态信息检索中的艺术在过去30多年上已经走了很长的路要走。 LSI对网站不实用
使用整个网的潜在语义索引的主要缺点是必须每次发布和索引新的网页并索引时重新计算要创建统计分析的计算。
在2003年(非谷歌)研究论文
中提到了这种缺点LSI用于检测电子邮件垃圾邮件(使用l过滤垃圾邮件PDF的原始索引)。
“LSI的一个问题是它不支持一次新文件的AD-HOC添加已经生成了语义集。任何单元值的任何更新都将改变每个其他字向量中的系数,因为SVD在其指定的维度中使用所有线性关系以引起viuce,该向量将预测每个文本样本的载体……“
我问了
比尔Slawski
关于LSI的不适合搜索引擎信息检索,他同意,说:
“LSI是为较小静态数据库开发的旧索引方法。有更多与较新技术,如使用字矢量或Word2Vec。
其中一个限制LSI的NS是,如果将新内容添加到用于索引整个语料库的语料库中,则这使得它可以有限的有用性对诸如网的快速改变的语料库。“
在那里谷歌LSI关键字研究论文?搜索社区中的一些相信谷歌在他们的搜索算法中使用“LSI关键字”,因为LSI仍然是尖端技术。
证明它,有些人参考2016
研究论文
称为,改进语义主题聚类,以便与单词共同发生和大型共聚类(PDF)进行搜索查询。
这篇论文绝对不是一个例子潜在语义索引。这是一个完全不同的技术。
实际上,研究论文是如此不如LSI(A.K.A.潜在语义分析)它引用了1999年的LSI研究论文([5] T. Hofmann。概率潜在语义索引。… 1999)作为为什么LSI对该问题没有用的解释的一部分,作者试图解决。
广告联系读取以下是它所说的:
“潜在的Dirichlet分配(LDA)和概率潜伏语义分析(PLSA)是广泛使用的技术在文本数据中揭示潜在主题的技术。 ……这些模型通过隐式利用文档级别词共生成模式来学习隐藏主题。但是
简短的文本 – 例如搜索查询,推文或即时消息 – 遭受数据稀疏性,这会导致传统的问题主题建模技术。“
使用上述研究文件作为证明tha是一个错误T Google使用LSI作为重要的排名因素。本文不是关于LSI,它甚至不是关于分析网页的。
这是2016年关于数据挖掘短搜索查询的有趣的研究论文,以了解它们的意思。
研究论文除了旁边,我们知道谷歌使用BERT和神经匹配技术来了解现实世界中的搜索查询。
长篇故事短暂:使用该研究论文陈述谷歌排名算法
是粗略的。谷歌使用LSI关键词读数概括关于研究论文和头脑等公共文件nts.seo的想法是基于陀螺仪揭示的。
其他一切只是意见。
了解差异很重要。
谷歌的约翰穆勒一直直接涉及揭穿LSI关键词的概念。
没有像LSI关键词那样的事情 – 任何告诉你否则的人都弄错了,对不起。
– 🍌约翰🍌 (@Johnmu)
2019年7月30日
注意到搜索专利专家票据Slawski也直接关于潜在语义索引和SEO的概念。条例草案关于LSI的陈述是基于对
谷歌的算法
的深刻知识,他在基于事实的文章中共享(如
,这里
和
)。
读数下方的广告联系读数Slawski推文关于潜在语义索引的知情意见
潜在语义索引与SEO无关: https://t.co/x6kcet9vsm 1 / 3
– 比尔·斯劳斯基⚓(@bill_slawski)
2020年8月18日
这些术语具有自己的技术以及它们如何确定的过程,并且不使用LSI。他们没有任何“潜伏”。 3/3
– 比尔·斯劳斯基⚓(@bill_slawski) 2020年8月18日
为什么谷歌关联与潜在语义分析
尽管在专利和研究论文方面存在任何证据和LSI / LSA是重要的排名相关因素,但谷歌仍然与潜在语义索引相关联。
这是一个原因谷歌2003年收购了一个名为应用语义的公司。应用的语义创造了一项称为大约的技术。 Circa是一个语义分析算法,用于AdSense,也在
Google Adwords
中。
根据
谷歌的新闻稿
:
“应用语义是语义文本处理和在线广告中的验证创新者,”谷歌联合创始人兼技术总裁谢尔盖布林说。 “此次收购将使Google能够创建新技术,使在线广告对用户,出版商和广告商更有用。
应用的语义产品基于其专利的大道技术,了解,组织和提取来自网站和信息的知识以一种模仿人类思想和更有效的信息检索的方式,以一种方式存储库。 Circa Technology的一个关键应用是应用了语义的AdSense产品,使网络发布者能够了解网页上的关键主题,以提供高度相关和有针对性的广告。“
语义分析和SEO 短语“语义分析”在2000年代初是一个热门的流行语,也许由Ask Jeeves的语义搜索技术部分驱动。
谷歌购买了语义的购买加速了将谷歌与潜在语义索引相关联的趋势尽管没有可靠的证据。
广告联系读数下面因此,到2005年,搜索营销界正在制定这样的未经证实的陈述正如本发明
“”我已经注意到了几个月,我发现了在谷歌上的网站排名变化,并且很清楚他们的算法已经改变了一些事情。
最多的一个重要的变化是谷歌现在为潜在语义索引提供更多权重的可能性(LSI)。
这应该在2003年4月考虑谷歌购买的应用语义并毫无奇怪地毫不奇怪,并据报道,已经使用了他们的Adsense广告潜在的语义索引。“
谷歌使用LSI关键词的SEO神话可能来自于”语义分析“等短语的普及,”语义索引“和”语义搜索“具有SEO流行语,赋予jeeves的语义搜索技术和谷歌购买语义分析公司Appli的生活ed语义。
关于潜在语义索引
LSI是一种非常旧的理解文档的方法。
LSI的性质使其不适合在整个互联网上应用,以便信息检索。
没有明确表明的研究论文潜在语义索引是谷歌搜索排名的重要特征。
本文提出的事实表明,自2000年代初以来,这一直是这种情况。
谷歌使用LSI和LSA的谣言2003年谷歌收购的应用语义后,该公司在制作上下文广告产品Adsense的公司中浮出水面。
借格谷歌已经肯定了谷歌使用没有LSI关键字的多次。
让我再次对他们的背部响亮:没有LSI关键词。
考虑到了大量的证据,证明了LSI关键词的概念是合理的,即LSI关键词的概念是假的。
事实也表明LSI不是谷歌排名的重要组成部分算法。
鉴于AI,自然语言处理和BERT的最新进步,谷歌将突出地使用LSI作为排名特征的想法实际上是为了超越信仰和荒谬。
广告下面读数
更多资源:
网站所有者的完整SEO清单
如何成为一个N SEO专家
如何避免SEO误导
通过作者的特色图像