在此处找到整个博客的YouTube播放列表: 6部分YouTube系列[设置和使用查询优化检查器]
作为其工作的一部分的人知道,任何人都知道在分析哪些查询和不是向站点上的特定页面发送流量时存在很多值。
这些数据集的最常见用途是将页面上的优化与现有排名和流量对齐,并在排名关键字中识别空白。
但是,使用此数据非常乏味,因为它仅在Google搜索控制台界面中可用,并且您必须一次只看一个页面。
最重要的是,要获取排名中包含的文本的信息GE,您要么需要手动查看它或用尖叫青蛙这样的工具提取它。
您需要这种观点:
……但即使是上述视图也只能是可行的一页,并且如上所述,实际文本提取也必须是分开的。
鉴于SEO社区处置的随时可用数据的明显问题,
inseev互动一直在花费很多时间考虑如何在规模上提高这些过程。
我们将在此帖子中进行审查的一个具体示例是一个简单的脚本,允许您以灵活的格式获取上述数据,以获得许多伟大的分析视图。
更好,此只有几个罪,都可以使用GLE输入变量。
刀具功能的快速违规
该工具自动将文本与Google搜索控制台进行比较
Top查询
页面级让您知道哪些查询是页面的,以及它们在页面上显示的次数。可选的XPath变量还允许您指定要分析文本的页面的一部分。
这意味着您将确切地知道驾驶的点击/展示中不在
中的次数
对于那些不熟悉的人来说,我们还提供了您可以使用的一些快速XPath表达式,以及如何在TH中创建特定于站点的XPath表达式e“输入变量”部分的帖子。
帖子设置使用和数据集
一旦设置了该过程,所需的所有都是填写的一条变量列表,其余部分是自动的对于您。
输出数据集包括多个自动化CSV数据集,以及结构化文件格式,以保持组织。简单的核心分析自动化CSV的枢轴可以为您提供下面的数据集和许多其他有用的布局。
……甚至一些“新度量”?
真正展示了该数据集的影响和有用性,在下面的视频中我们使用COLAB工具来:
https://www.inseev.com/
(在视频中约30页),但您可以执行任意数量的页面)
[3分钟] [3分钟] – 将CSV转换为更具可用的格式
好的,您都设置了初始破坏。希望我们能够在进入有点沉闷的设置过程之前让你兴奋。
请记住,在帖子的末尾,还有一个包括一些有用的用例的部分和一个示例模板!要直接跳转到此帖子的每个部分,请使用以下链接:
一次性设置谷歌Colab中的脚本
运行您的第一个分析
实际使用情况和模板
[快速思考#1] – 内置到该工具的网站刮板不支持JavaScript渲染。如果您的网站使用客户端渲染,则该工具的完整功能不幸的是不起作用。
[快速考虑#2] – 该工具已经由INSEEV团队的成员大量测试。已经找到并确定了大多数错误[专门使用Web Scaper],但与任何其他程序一样,其他问题可能会出现。
如果您遇到任何错误,请随时直接向我们联系 jmelman@inseev.com
Inseev.com
,无论是自己还是inseev的数据工程团队的其他成员都很乐意为您提供帮助。
如果遇到并修复了新的错误,我们将始终将更新的脚本上传到下面的部分中链接的代码存储库,因此所有最新的代码都可以通过所有!
谷歌Colab中的脚本一次设置(在不到20分钟)
您需要的事情:
Google Cloud Platform帐户
Google搜索控制台访问
视频演练:刀具设置过程
下面你会找到st逐步编辑指令为了设置整个过程。但是,如果以下编辑指示不是您的首选方法,我们也记录了设置过程的视频。 如你所见,我们从一个全新的Gmail开始并设置整个过程大约12分钟,输出完全值得时间。
编辑演习:工具设置过程
设置了Google云平台(GCP)项目(如果您已经拥有帐户,则跳过)
将OAUTH 2.0凭据添加到CONFIG.PY文件
第一部分:从GitHub下载文件并在Google DRIVE中设置
下载源文件(无需代码) 1.Navate
2。选择“代码”>“下载zip”
*您也可以使用’
https://github.com/jmelm93/query-optization-checker .git
‘如果你使用命令提示符更舒服。
在Google Drive中启动谷歌Colab
如果您在Google Drive中已经在Google Colaboratory设置中设置,请随时跳过此步骤。
1。在这里导航
。
3。搜索“Colaboratory”>单击申请页面。
4。单击“安装”>“继续”>使用OAuth登录。
1. 1.使用脚本,创建名为“Colab笔记本”的文件夹并创建一个名为“Colab笔记本”的文件夹。
:脚本需要称为“Colab笔记本”文件夹配置为从“Colab笔记本”中的“API”文件夹查找。
误差导致文件夹命名不当。
2。导入文件夹下降从github oadododoge drave。 在此步骤结束时,您应该在您的Google驱动器中包含一个文件夹,其中包含以下项目:
第2部分:设置Google云平台(GCP)项目
如果您已经拥有Google云平台(GCP)帐户,请随时跳过本部分。
Google云
页面。
2。单击“免费”的“免费”CTA(CTA文本可能随时间变化)。
3。使用您选择的OAuth凭据登录。任何Gmail电子邮件都将起作用。 4。按照提示注册您的GCP帐户。
您将被要求提供一张信用卡来注册,但目前有300美元的免费试用版和谷歌指出,直到他们不会向您收取费用哟u升级您的帐户。
第三部分:为Google搜索控制台创建0Auth 2.0客户端ID(GSC)API
1。在这里
导航
。 2。登录到所需的Google Cloud帐户后,单击“启用”。
3。配置同意屏幕。
在同意屏幕创建过程中,选择“外部”,然后继续进入“应用信息”。
示例以下最低要求:
跳过“范围”添加电子邮件
您将使用搜索控制台API身份验证
您将使用搜索控制台API身份验证
进入“测试用户”。可能还有其他电子邮件与拥有Google Drive的电子邮件。一个例子可以是客户端的电子邮件,您可以在其中访问Google搜索控制台UI以查看其KPI。
5。在“创建OAuth客户端ID”表单中,填写:
应用程序类型 =桌面应用
名称 =谷歌Colab = Google Colab
单击“创建”
6。保存“客户端ID”和“客户机密” – 因为它们将从我们下载的GitHub文件中添加到“API”文件夹Config.py文件中。
这些应该在击中“Create” 之后出现弹出窗口
“客户机密”在功能上是您的Google Cloud的密码(不要将此发布到公众/在线分享它)
第四部分:将OAUTH 2.0凭据添加到CONFIG.PY文件
1。返回谷歌drive并导航到“API”文件夹中。 2。单击config.py.
3。选择用“文本编辑器”(或您选择的另一个应用程序)打开以修改config.py文件。
client_id
:从OAuth 2.0客户端ID设置过程
client_secret
:来自OAuth 2.0客户端ID设置过程
google_credentials :与client_id&client_secret
对应的电子邮件
更新后保存文件!
祝贺,无聊的东西结束了。您现在可以开始使用Google Colab文件!
运行您的第一个分析可能是一个小小的Inti中期,但坚持下去,它会变得很快。 下面,我们提供了有关所需的输入变量的详细信息,以及在运行脚本时要记住的事项的注意事项并分析生成的数据集。
在我们走过这些项目之后,还有一些示例项目和视频演练展示了用于利用这些数据集的客户端可交付成果的方法。 设置输入变量
XPath提取与“XPath_Selector”变量
您是否曾希望了解驾驶点击和印象的每个查询,并在
虽然可选择,使用这是高度鼓励的,但我们感觉到它“超额充电s“分析。只需使用XPaths和脚本定义网站部分,脚本将执行其余部分。
在上面的视频中,您可以找到关于如何创建网站特定提取的示例。在另外,以下是一些普遍提取,应该在网上几乎任何网站上工作:
‘//标题’#标识A 标记
‘//H1’
#标识A
标记 ‘// H2’
标签
现场具体特定:
如何只刮XPAIL – 在XPATH之间添加“|”
标题| // h1’#在1运行标记中,您都是和标记 ‘// h1 | // h2 | // h3’ #在1运行 其他变量 [1]图23是以下是每个其他变量的视频概述,每个变量具有简短描述。 ‘Colab_path'[必填] – 其中的路径Colab文件生命。这应该是“/ content / drive /我的驱动器/ colab笔记本/”。 ”domain_lookup'[必需] – 用于分析的网站的主页。 ‘Startdate’和’Enddate’ [必填] – 分析期的日期范围。 ‘GSC_SORTING_FIELD'[必需] – 该工具将如用户定义的顶部N页面拉动。 “顶部”由“clicks_sum”或“repreadmations_sum”定义。有关更详细的描述,请查看视频。 ”gsc_limit_pages_number'[必填] – 表示您希望的结果的结果页数的数值缩小数据集。 ‘brand_exclusions'[可选] – 通常导致品牌查询的字符串序列(例如,包含“inseev”的任何东西将是“Inseev Interactive”的品牌查询。 ‘Impressions_exclusion'[可选] – 用于排除由于缺乏预先存在的印象而可能无关的查询的数值。这主要与具有大规模页面上的具有强的预先存在排名的域名相关。 ”page_inclusions'[可选] – 在其中找到的字符串序列所需的分析页类型。如果您想分析整个域,请将此部分留空。 运行脚本 请记住,一旦脚本完成运行,您就是基因Rally将使用“Step3_Query-Optimizer_Domain-Yyyy-MM-DD.csv”文件进行分析,但还有其他有原始数据集的浏览。 “步骤3_Query-Optimizer_Domain-Yyyy-MM-DD.CSV”文件的实际用例可以在“实际用例和模板中找到。 如上所述,在测试事物的同时存在一些重要的事情: 1。 没有JavaScript爬网:如在帖子的开始时所提到的,这个脚本未设置用于JavaScript爬网,因此如果您的目标网站使用带客户端渲染的JS FrontEnd来填充主要内容(MC ),刮擦不会有用。但是,快速获取顶级XX(用户定义)查询和页面的基本功能仍然可以通过ISEL使用F. 2。 Google Drive / GSC API Auth :您第一次在每个新会话中运行脚本,它将提示您验证Google驱动器和Google搜索控制台凭据。 Google Drive认证:通过脚本与Google Drive相关联的电子邮件验证。 GSC身份验证:验证电子邮件有权使用所需的Google搜索控制台帐户。如果您尝试身份验证并且您收到如下所示的错误,请重新访问“添加电子邮件” LL将COLAB应用程序从第3部分开始进入“测试用户”,步骤3在上面的过程中:设置同意屏幕。 快速提示: GOOGLe Drive帐户和GSC身份验证不必是相同的电子邮件,但他们确实需要与OAuth单独的身份验证。 3。 运行脚本:导航到“Runtime”>“重新启动并运行所有”或使用键盘快捷键Ctrl + Fn9开始运行脚本。 4。 填充的数据集/文件夹结构:脚本填充了三个CSV – 基于“domain_lookup”输入变量,脚本嵌套在文件夹结构中。 自动组织[文件夹]:每次在新域上重新运行脚本时,它将创建一个新的文件夹结构以保持事物组织。 自动组织[文件命名:CSV包括所附导出的日期,所以you’ll总是知道该过程何时ran以及数据集的日期范围。 5。数据集的日期范围:数据集内部有一个“GSC_DATASETID”柱,其包括提取的日期范围。 6。 不熟悉的指标:由此产生的数据集具有我们所知道的所有KPI – 例如 – 例如点击,展示次数,平均(平均值)位置 – 但是也有一些你无法直接从GSC UI获得: ‘count_instans_gsc’ – 查询至少获得的实例数量1在指定日期范围内的印象。场景示例:GSC告诉您,您的平均位置6为“花卉传递”,您只收到了30天的日期范围内的20个印象。没有似乎可能是你真的在6号位置,对吧?嗯,现在你可以看到这可能是可能的,因为你只在30天的日期范围内(例如count_instances_gsc = 1) ‘ &’ min_position’ – 所识别页面在指定日期范围内的Google搜索中显示的最大和最小排名位置。 快速提示#1 :MAX /的大方差Min可以告诉您,您的关键字一直在大量波动。 快速提示#2 :这些KPI与“count_instances_gsc”结合,可以呈现对查询性能和机会的理解。 。 实际用例和模板 接入 推荐的多美国E模板 推荐使用:下载文件并与Excel一起使用。主观发言,我相信Excel与Google Sheets比较了更多的用户友好的枢轴表功能 – 这对于使用此模板至关重要。 替代使用:如果您没有Microsoft Excel或者您更喜欢不同的工具,则可以使用包含枢轴功能的大多数电子表格应用程序。 对于选择替代电子表格软件/应用程序的人: 以下是在设置时模拟的枢转字段。 您可能必须调整在“步骤3 _分析最终DOC”选项卡上的VLookup函数,具体取决于您的更新的枢轴列是否与我所提供的当前枢轴对齐。 Ect示例:标题和H1重新优化(视频演练) 项目描述通过查看GSC查询KPI与当前页元素来通过审查GSC查询KPIS和标记。使用产生的结果重新优化预先存在的页面的和标签。 项目假设:此过程假定将关键字插入两者 标签是有关相关性优化的强烈SEO实践,并且将相关关键字变体包含在这些区域中是重要的(例如,与匹配的SERP意图的非完全匹配关键字)。 项目示例:在页面文本刷新/重新优化 项目描述:定位驾驶点击和印象的关键字,对主内容(MC)内的第一段中不存在的内容中的编辑部内容。在编辑页面中执行介绍内容的页面刷新,以包括高价值关键字机会。 项目假设:此过程假设将关键字插入一段内容的第一个句子是相关性优化的强烈SEO实践,并且将相关关键字变体包含在一起是重要的这些区域(例如,具有匹配的SERP意图的非完全匹配关键字)。 最终的想法 我们希望这篇文章有所帮助,并为您打开了概念使用Python和Google Colab来提升您的相关性操作时间化策略。如整个职位所提到的,请记住以下内容: GitHub存储库将在未来的任何更改中更新。 有可能未被发现的错误。如果发生这些,inseev很乐意提供帮助!事实上,我们实际上会感谢您致力于调查和修复错误(如果出现任何情况)。这样,其他人没有遇到同样的问题。除了上述情况外,如果您对数据分析项目的COLAB(双关语)有任何想法,请随时与思想联系。
现场具体特定:
如何只刮XPAIL – 在XPATH之间添加“|”
标题| // h1’#在1运行标记中,您都是和标记 ‘// h1 | // h2 | // h3’ #在1运行 其他变量 [1]图23是以下是每个其他变量的视频概述,每个变量具有简短描述。 ‘Colab_path'[必填] – 其中的路径Colab文件生命。这应该是“/ content / drive /我的驱动器/ colab笔记本/”。 ”domain_lookup'[必需] – 用于分析的网站的主页。 ‘Startdate’和’Enddate’ [必填] – 分析期的日期范围。 ‘GSC_SORTING_FIELD'[必需] – 该工具将如用户定义的顶部N页面拉动。 “顶部”由“clicks_sum”或“repreadmations_sum”定义。有关更详细的描述,请查看视频。 ”gsc_limit_pages_number'[必填] – 表示您希望的结果的结果页数的数值缩小数据集。 ‘brand_exclusions'[可选] – 通常导致品牌查询的字符串序列(例如,包含“inseev”的任何东西将是“Inseev Interactive”的品牌查询。 ‘Impressions_exclusion'[可选] – 用于排除由于缺乏预先存在的印象而可能无关的查询的数值。这主要与具有大规模页面上的具有强的预先存在排名的域名相关。 ”page_inclusions'[可选] – 在其中找到的字符串序列所需的分析页类型。如果您想分析整个域,请将此部分留空。 运行脚本 请记住,一旦脚本完成运行,您就是基因Rally将使用“Step3_Query-Optimizer_Domain-Yyyy-MM-DD.csv”文件进行分析,但还有其他有原始数据集的浏览。 “步骤3_Query-Optimizer_Domain-Yyyy-MM-DD.CSV”文件的实际用例可以在“实际用例和模板中找到。 如上所述,在测试事物的同时存在一些重要的事情: 1。 没有JavaScript爬网:如在帖子的开始时所提到的,这个脚本未设置用于JavaScript爬网,因此如果您的目标网站使用带客户端渲染的JS FrontEnd来填充主要内容(MC ),刮擦不会有用。但是,快速获取顶级XX(用户定义)查询和页面的基本功能仍然可以通过ISEL使用F. 2。 Google Drive / GSC API Auth :您第一次在每个新会话中运行脚本,它将提示您验证Google驱动器和Google搜索控制台凭据。 Google Drive认证:通过脚本与Google Drive相关联的电子邮件验证。 GSC身份验证:验证电子邮件有权使用所需的Google搜索控制台帐户。如果您尝试身份验证并且您收到如下所示的错误,请重新访问“添加电子邮件” LL将COLAB应用程序从第3部分开始进入“测试用户”,步骤3在上面的过程中:设置同意屏幕。 快速提示: GOOGLe Drive帐户和GSC身份验证不必是相同的电子邮件,但他们确实需要与OAuth单独的身份验证。 3。 运行脚本:导航到“Runtime”>“重新启动并运行所有”或使用键盘快捷键Ctrl + Fn9开始运行脚本。 4。 填充的数据集/文件夹结构:脚本填充了三个CSV – 基于“domain_lookup”输入变量,脚本嵌套在文件夹结构中。 自动组织[文件夹]:每次在新域上重新运行脚本时,它将创建一个新的文件夹结构以保持事物组织。 自动组织[文件命名:CSV包括所附导出的日期,所以you’ll总是知道该过程何时ran以及数据集的日期范围。 5。数据集的日期范围:数据集内部有一个“GSC_DATASETID”柱,其包括提取的日期范围。 6。 不熟悉的指标:由此产生的数据集具有我们所知道的所有KPI – 例如 – 例如点击,展示次数,平均(平均值)位置 – 但是也有一些你无法直接从GSC UI获得: ‘count_instans_gsc’ – 查询至少获得的实例数量1在指定日期范围内的印象。场景示例:GSC告诉您,您的平均位置6为“花卉传递”,您只收到了30天的日期范围内的20个印象。没有似乎可能是你真的在6号位置,对吧?嗯,现在你可以看到这可能是可能的,因为你只在30天的日期范围内(例如count_instances_gsc = 1) ‘ &’ min_position’ – 所识别页面在指定日期范围内的Google搜索中显示的最大和最小排名位置。 快速提示#1 :MAX /的大方差Min可以告诉您,您的关键字一直在大量波动。 快速提示#2 :这些KPI与“count_instances_gsc”结合,可以呈现对查询性能和机会的理解。 。 实际用例和模板 接入 推荐的多美国E模板 推荐使用:下载文件并与Excel一起使用。主观发言,我相信Excel与Google Sheets比较了更多的用户友好的枢轴表功能 – 这对于使用此模板至关重要。 替代使用:如果您没有Microsoft Excel或者您更喜欢不同的工具,则可以使用包含枢轴功能的大多数电子表格应用程序。 对于选择替代电子表格软件/应用程序的人: 以下是在设置时模拟的枢转字段。 您可能必须调整在“步骤3 _分析最终DOC”选项卡上的VLookup函数,具体取决于您的更新的枢轴列是否与我所提供的当前枢轴对齐。 Ect示例:标题和H1重新优化(视频演练) 项目描述通过查看GSC查询KPI与当前页元素来通过审查GSC查询KPIS和标记。使用产生的结果重新优化预先存在的页面的和标签。 项目假设:此过程假定将关键字插入两者 标签是有关相关性优化的强烈SEO实践,并且将相关关键字变体包含在这些区域中是重要的(例如,与匹配的SERP意图的非完全匹配关键字)。 项目示例:在页面文本刷新/重新优化 项目描述:定位驾驶点击和印象的关键字,对主内容(MC)内的第一段中不存在的内容中的编辑部内容。在编辑页面中执行介绍内容的页面刷新,以包括高价值关键字机会。 项目假设:此过程假设将关键字插入一段内容的第一个句子是相关性优化的强烈SEO实践,并且将相关关键字变体包含在一起是重要的这些区域(例如,具有匹配的SERP意图的非完全匹配关键字)。 最终的想法 我们希望这篇文章有所帮助,并为您打开了概念使用Python和Google Colab来提升您的相关性操作时间化策略。如整个职位所提到的,请记住以下内容: GitHub存储库将在未来的任何更改中更新。 有可能未被发现的错误。如果发生这些,inseev很乐意提供帮助!事实上,我们实际上会感谢您致力于调查和修复错误(如果出现任何情况)。这样,其他人没有遇到同样的问题。除了上述情况外,如果您对数据分析项目的COLAB(双关语)有任何想法,请随时与思想联系。