使用站点性能指标融合统计数据的10个步骤

经常,我们假设SEO最佳实践将在任何竞争对手的任何行业中工作。但大多数最佳实践都没有,每种情况都可能不会“最好”。

我们都知道,在2020年工作的策略不一定将针在2021中作为核心网维(CWV)和其他信号随着前方洗牌。我们必须为我们的企业和客户做得更好。

我是在SEO 15年来的有很多战斗伤疤的心脏数据。分析数千名当地Serps的想法听起来像太多的乐趣。我发现一些令人惊讶的相关性,同样重要的是,建立一个可以季度更新的方法和数据集,以便随着时间的推移来显示变化。

我分析了零售银行业的50,000多个SERP,所以我可以制作在锁定期间排名和搜索行为的大规模变化感。我们对银行网站有很多历史数据,因此比较Pre / Post Covid数据的数据比从头开始更容易。

我会分享我在下面做的方式。但首先,我想分享为什么我认为分享这种类型的研究对于SEO社区来说非常重要。

为什么验证SEO与数据的最佳实践?

这是一个愉快的时间SEO。我们有惊人的工具,可以收集比以往更多的数据。我们蓬勃发展的社区和优秀的

基本培训材料

然而,我们常常将我们的工艺蒸馏成过度简化的“最佳实践”,这被认为是普遍的真实的。但如果SEO中有一个普遍真相,那就是没有普遍的真理。最佳实践可能会被误解或过时,导致对业务失去机会或彻底伤害。我们需要知道,以及CWV将如何影响排名,所以我们可以优先考虑我们的努力。 我们可以通过测试和验证研究的最佳实践来单独和集体提升我们的SEO游戏。它只需要一个好奇的心灵,正确的工具,以及接受结果的意愿,而不是强迫叙述。

未能验证最佳实践是SEO从业者的责任,并表现出不愿意挑战假设。在我的经验中,缺乏数据可以导致高级斯塔克担任重量比SEO专家的建议更重视。

首先询问正确的问题

真正的洞察力来自组合来自多个来源的数据来回答关键问题并确保您的策略被支持有效数据。在我对本地银行的分析中,我首先列出了我想要了解答案的问题:

排名第一的本地银行网站共享哪些特征?谁是实际竞争于SERPS的银行?它主要是其他银行吗?竞争性SERPS如何根据用户搜索的时间/何时/地点/如何进行更改?如何将更小,本地企业从其地区以外的较大竞争对手获得优势? SERP组成如何影响银行对有针对性的关键词排名的能力?有多重要的是RE Web Vitals(CWV)排名?如何随时间变化?

您可以通过用其他本地商业类别替换“银行”来运行同样的分析。潜在问题的列表是无穷无尽的,所以您可以根据您的需求调整它们。

以下是一个重要提醒 – 即使它们对您的假设不确定或矛盾,也可以准备接受答案。数据驱动的SEO必须避免确认偏见如果我们将保持客观。

这里是我在几小时内分析了50,000个搜索结果的方式

我组合了我最喜欢的三个工具来分析SERPS以缩放并收集回答我的问题所需的数据:

统计

为选择关键字的排序报告

尖叫青蛙

爬网站并收集技术sEO数据

Power Bi

要分析大数据集并创建简单可视化

步骤1:确定您的数据需求

我使用美国人口普查局数据来识别所有城市人口超过100,000 ,因为我想要全国各地当地银行Serps的代表。我的清单最终包括314个单独的城市,但您可以自定义列表以满足您的需求。我也想收集桌面和移动搜索的数据,以比较设备类型之间的SERP差异。 第2步:识别关键字

我选择了基于其强大的本地意图和高搜索卷的“{City,St}附近的银行”,与银行服务的更具体的关键字相比。

步骤3:生成统计值T文件以.csv格式

一旦您有关键字和市场列表,就是

准备批量上传的时间

。使用链接中提供的模板使用以下字段创建.csv文件:

项目:新统计项目的名称或现有项目.Folder:新文件夹的名称或现有文件夹。 (这是一个可选的列,您可以留空。)站点:要跟踪的网站的域名。注意,出于我们的目的,您可以在此输入您要跟踪的任何URL。前20名报告将包括目标关键字的所有排名URL,即使在“站点”列中未列出它们.Keyword:您正在添加的搜索查询。标签:按照所需输入任意数量的关键字标记,用逗号分隔。我用了“城市”和“靠近我”的标签查询类型之间的威胁。 (这是您可以留空的可选列。)市场:指定您想要跟踪关键字的市场(国家和语言)。我为美国英语使用了“US-EN”。分配:如果要在特定位置跟踪关键字,请指定城市,州,省,邮政编码和/或邮政编码。我使用了“City,St”格式的城市和州列表.Device:选择是否希望桌面或智能手机结果。我选择了两者。

每个市场,位置和设备类型将乘以您必须跟踪的关键字的数量。我在导入文件中以1,256个关键字(314 Markets x 2关键字x 2设备)结束。

一旦您的文件完成,您可以导入数据并开始跟踪。

第4步:运行前20个报告所有关键字的统计数据

Stat的内置

Google Serp Top 20比较报告以不同的间隔(每日,每周,每月等)捕获来自每个SERP的前20个有机结果随着时间的推移变化。我不需要日常数据,所以我只是让它连续两个日运行并删除了我不需要的数据。我重新运行相同的报告季刊以跟踪随时间的变化。

观看下面的视频学习如何设置本报告!

我的1,256关键词每天产生超过25,000行的数据。每行是一个不同的有机清单,包括关键字,每月搜索卷,等级(包括本地包),基本秩(不包括本地包),排名URL的HTTPS / HTTP协议,排名URL,and你的标签。以下是CSV格式的原始输出的示例:

很容易看出这种数据自身的有用,但它变成了当我们清理它并开始爬行排名URL时更强大。

步骤5:清理并标准化您的Stat URL数据

此时您可能已投入1-2小时收集初始数据。此步骤有点耗时,但数据清理允许您在尖叫青蛙中运行更高级的分析并揭示更有用的见解。

以下是我对统计排名数据进行准备的更改以准备下一个更改尖叫青蛙和电力bi的步骤。您将结束多列的URL。每个人都在以后服务。

将排名URL列复制到一个名为NOR的新列恶毒的URL。通过使用Excel的

文本到列

工具并分离“?”,从标准化的URL字段中删除URL参数。我删除了包含URL参数的新列,因为它们在我的分析中没有有帮助。将新的清洁标准化URL列复制到名为TLD的新列。在TLD列上使用文本到列工具,并分开“/”以删除除域名和子域外的所有内容。删除新列。我选择将子域保持在我的TLD列中,但如果它可以帮助您的分析,可以删除它们。最后,创建一个名为完整URL的列,最终将成为您在尖叫青蛙中抓取的URL列表。要生成完整的URL,只需使用 Excel的Concateate函数以组合协议和标准化的URL列。您的公式将如下所示:=在有效的URL字符串中包含“://”的连接(a1,“://”c1)。

25,000+我的数据集中的行在Excel的局限内很好,因此我能够在一个地方轻松地操纵数据。您可能需要使用数据库(我喜欢BigQuery),因为您的数据集成长。

步骤6:通过网站类型对您的SERP结果进行分类

通过SERP结果撇去,很容易看到银行不是唯一的网站类型,这些网站为具有本地搜索意图的关键字等级。由于我的初始问题之一是SERP组成,我必须识别所有不同类型的网站并标记每个类型的网站,以便进行进一步分析。

这一步骤是迄今为止最耗时和洞察力的。一世花费3小时将初始批量分为25,000多个URL中的一个类别:

机构(银行和信用合作社网站)目录(聚合器,本地业务目录等)评论(当地和国家网站等yelp.com )教育(关于银行的内容域名)政府(关于银行域名和市政场所的银行的内容)职位(职业现场和工作聚合者)新闻(本地和国家新闻网站与银行内容)食品银行(是的,很多食品银行排名为“我附近的银行”关键词)房地产(商业和住宅房地产物业列表)搜索引擎(属于搜索引擎的排名内容)社交媒体(社交媒体网站上的排名内容)其他(完全随机结果无关任何上述)

你的本地SERP可能包含许多这些网站类型和其他不相关的类别,例如食物银行。通过对TLD进行排序和过滤归一成的URL列来加速过程以同时对多行进行分类。例如,所有yelp.com排名都可以归类为“评论”,具有快速复制/粘贴。

此时,您的排名数据集是完整的,您已准备好开始爬行排名您的行业中的网站以了解它们的共同点。

步骤7:用尖叫青蛙爬网

我的初始数据数据识别来自当地银行网站的6,600个唯一页面,这些网站排名前20名有机搜索结果。这太多页面来手动评估。进入尖叫青蛙,是模仿goo的爬虫GLE的Web爬网程序和从网站提取大量SEO数据。

我配置了尖叫的青蛙,以抓取6,600个排名页面,以便更大地分析排名库网站的特征。不要只是让SF放松。请务必正确配置以节省时间并避免爬行不必要的页面。

这些设置确保我们在一个爬网中获得所有问题的所有信息:

列表模式:

粘贴在De-Pupled的完整URL列表中来自您的数据数据。在我的情况下,这是6,600多个URL。

数据库存储模式:数据库存储模式:数据库存储模式:比存储器(RAM)存储,但节省了一点如果您犯错误d关闭您的报告在完成数据之前。

限制爬网深度:限制爬网深度:将其设置为0(零),因此蜘蛛仅爬网您列表上的URL在这些域上的内部链接到其他页面上的其他页面。

API:我强烈推荐使用

Pagespeed Insights集成以拉灯塔速度指标直接进入您的爬网数据。如果您有一个具有API Access的Moz帐户,还可以使用内置集成从 Moz API中拉链接和域数据

一旦您配置了蜘蛛,让它撕裂!取决于您爬行的URL和计算机的速度和内存约束,可能需要几分钟到几个小时。耐心一点!你可能会试试ru在较大的爬行中或额外的计算机上避免挖掘你的主要机器。

步骤8:将尖叫的青蛙爬网数据导出到Excel

将爬网数据转储成Excel非常容易。

步骤9:步骤9:步骤9:加入您的数据集BI

此时,您应该在Excel中有两个数据源:一个用于您的统计排名数据另一个用于你的尖叫青蛙爬网数据。我们的目标是结合两个数据来源,了解有机搜索排名可能会受到在页面SEO元素和站点性能的影响。为此,我们必须首先合并数据。

如果您可以访问Windows PC, Power Bi 的免费版本足以让您入门。首先将两个数据源加载到新的PR中ojject 使用get数据向导。

一旦加载了数据集,它是时候使魔法发生在创建数据中的关系解锁排名和站点特征之间的相关性。要将数据组合在Power BI中,请在Stat Full URL和Screming Frog原始URL字段之间创建多对多的关系。

如果您是BI工具的新工具和数据可视化,别担心!只有很多有用的教程和视频即可快速搜索。此时,它真的很难打破任何东西,您可以尝试使用许多方法来分析您的数据并与许多类型的图表和图表共享见解。

我应该注意到Power BI是我的首选数据可视化工具,但你可以b能够使用Tableau或一些同样强大的。 Google Data Studio不是此分析的选项,因为它只允许多个数据源的左外部连接,并不支持“多对多”的关系。这是一种技术方式,说数据工作室不足以创建我们需要的数据关系。

步骤10:分析和可视化!

Power BI的

内置可视化允许您快速总结和呈现数据。这是我们可以开始分析数据以回答我们提前提出的问题的地方。 结果 – 结果 – 我们学到了什么?

以下是从合并我们的排名和爬网数据中收集的洞察力的几个例子。 SPOILER ALERT – CWV不会强烈影响有机排名…… .YET!

谁重新银行实际竞争于SERPS?它主要是其他银行吗?

在桌面上,大约67%的有机搜索结果属于金融机构(银行和信贷工会),来自评论网站(7%)和在线目录(22%)的繁重竞争。这些信息通过揭露有关目录和审查网站的机会来帮助塑造银行的SEO战略。

网站类别的分发方式如何在桌面设备上的等级变化。突然间,我们可以看到金融机构实际上占据了大部分前3个结果的,而评论网站和目录在第4-10次更为普遍的情况下。

c是多么重要排名矿石Web Vitals(CWV)?随着时间的推移如何变化?

现场性能和站点速度是SEO的热门话题,因为今年5月CWV成为一个排名信号,它只变得更加重要。通过将统计排名和Pagespeed Insights数据从尖叫的青蛙报告进行比较,我们可以开始了解站点速度和排名之间的关系。截至1月2021,具有更高

灯塔性能分数的站点(即它们加载得更快)倾向于比分数更低的网站更好。这有助于证明在现场速度和站点性能方面的投资。

一些CWV元素与更好的排名更紧密地相关,而其他CWV元素更散落。这并不是说CWV并不重要或有意义,而是它是一个5月后进一步分析的速度点。

那么什么?我们可以从这种类型的分析中学到什么?

单独,统计和尖叫的青蛙是令人难以置信的强大的SEO工具。他们提供的数据如果您恰好是SEO,但合并数据和提取关系的能力将使您在任何组织中的值乘以值数据,并在洞察中作用。

除了验证一些普遍接受的SEO之外与数据的知识(“具有更好的排名奖励的速度较快”),更好地利用关系数据,也可以帮助我们避免在不太重要的策略上花费有宝贵的时间(“改善所有费用的累积布局转变!”)。

[当然,相关性并不意味着因果关系,并且聚合数据不保证结果个别网站。但是,如果您是一个负责从有机渠道获取客户收购的银行营销专业人士,您需要将这种类型的数据带到您的利益相关者中,以证明在SEO的增加的投资。 通过分享工具和方法,希望其他人将通过建设和促进其额外的调查结果来进一步接受SEO社区。其他数据集我们可以联合哪些,以加深我们对大型尺度的理解?让我知道你的想法!