什么是网址审查工具(Inspection Tool)?

Google Search Console(以下简称GSC )是网站管理者、SEOer 操作SEO 时的必备工具,也是我们与Google 沟通最直接的工具,其中提供的第一手数据是我们衡量网站SEO 表现最主要的资料来源。其中, GSC 里有关检索、索引状态的分析报告,更是无其他第三方工具可取代的、不可或缺的重要要存在。

本文单独就GSC 的「网址审查工具」作介绍,希望能为各位帮上忙。

目录

1.什么是网址审查工具(Inspection Tool)?

2.用法1:手动提交网址

3.用法2:检查网址的检索、索引状况

4.用法3:检查页面渲染状况

5.用法4:检查强化项目

6.网址审查工具跟「 site: 」哪个准?差异是?

状况1:site:example.com 会列出一些有设置301转址的网址

状况2:site: 指令或无法过滤重复内容

状况3:网址审查工具、site: 指令不一致

7.2个快速批量检查索引的工具

工具1:Search Analytics for Sheets 外挂(免费)

工具2:Screaming Frog 串接GSC 帐户(免费版有数量限制)

8.重点整理Summary

9.参考资料

进入网址审查工具的方法:

在页面顶部「检查YourDomain 中的任何网址」贴上想检查的网址后按Enter

点击侧边栏「网址审查」,画面会自动跳转至网址审查栏,同样输入网址并按Enter 即可

点击不同报表(Ex. 网页体验报表)网址栏位的放大镜图示进入

用法1:手动提交网址

通过于GSC 网址审查栏位键入网址,可以以手动的方式「提醒」Google把该网址「插队」至爬虫的检索伫列。

操作方法如下:

1.进入网址检查工具后,点击「要求建立索引」按钮

2.等待GSC作业

点击「要求建立索引」按钮后,GSC会先测试网址是否为可索引的状态,如果可以索引,就会出现「已要求建立索引」的通知。但要注意的是,此做法是向Google表示此网址应优先被检索,而不等于点击后Google就会直接将网址编入索引。

假如网址因一些原因处于不能检索或索引的状态,例如被robots.txt阻挡爬取、页面设有noindex的话,GSC会显示如下画面:

就小编实际经验来说,此方法作用不大,对加快网址索引没太大帮助。

用法2:检查网址的检索、索引状况

首先是网址检查结果,可快速知道网页有没有被索引,此检测结果位于页面上方,使用者可以马上知道该网址是否已编入索引:

1.网址检查结果


常见有以下5 种状况:

网址在Google服务中

网址不在Google服务中

网址在Google 服务中,但出现问题

这个网址是替代版本

另外,还有【网址不在Google 服务中:编入索引时发生错误】,较少遇到。

虽分作5种情况,看似复杂,但其实都是从「网址在Google 服务中」、「网址不在Google 服务中」两种情况延伸出来:

ü「在Google服务中」:表示该网址已被Google索引,等于可以出现在搜寻结果;

ü「不在Google 服务中」:代表网址未被索引,等于不会出现在搜寻结果。

下方的「网页索引状态」中会列出更详细的资料,以下按列出顺序一一说明:

1.索引状态

此区列出该网址在「索引>网页」(原「涵盖范围」报表)中属于哪些状况。

2.发现方式

记录Google发现该网址的方式,又分为「Sitemap」和「参照网页」两个来源。

Sitemap:顾名思义就是Google 有没有从Sitemap.xml 档中检索到这个网址,如有会列出Sitemap的来源,如无则显示「不适用」。

例如,本网站并无将分类页网址加入至Sitemap.xml中。下图为导览列的「最新资讯」页的检测情况,可看到Sitemap.xml 栏位记录为「不适用」。换一个角度,本栏位方便网站管理者,判断Sitemap.xml档有无把重要页面都包含其中。

参照网页:列出Google发现受检测网址的连结来源,最多列出4个来源网址,记录Google 在最先在哪些网页(址)发现受检测的网址,像是从哪个内部、外部连结指向过来,或是从哪些网址转址而来。如无,则显示「未侦测到任何参照网页」。

然而,根据实务经验,GSC在这里的记录仅作参考用,不全然「正确」。例如,以下是分解茶网站首页的检测结果,首页的连结出现在站内各页左上角的Logo 处,等于全站所有页面都含有这个连结,但GSC 此处却记录为「未侦测到任何参照网页」,不过这并不代表首页处于连结失联的状况,有可能只是Google 先从Sitemap.xml 档发现到首页,因此参照网页栏位才没有数据。

换言之,假若看到检测网址显示「未侦测到任何参照网页」,先不用太担心站内连结是否布局不佳,或该页面失联为Orphan Page 。如想检查部连结的情况,应使用GSC 的「连结」报表,

换个角度,假如无法在参照网页列出的网址上找到检测网址,其实也不用太在意,有可能只是Google还在记录较早期的情况罢了。以小编的经验,这种状况较常见在检测重复版本网址时用到,像是我们想要确认这个重复内容网址(Ex.奇怪的参数网址)是从哪里来的,哪些页面在指向这个怪网址。但有可能在网站已作修正后,网址审查工具仍然列出。

同理,假如你遇到「参照网页」一直在列出旧网域、已修正的重复版本网址,若已确定已执行过301转址,其实就不用担心是不是没有转址干净,不必过于在意。

小编的个人经验推测「参照网页」的更新速度可能不高,故未即时反映Google最近的检索情况,而且Google 也有保留「最先发现检测对象」网址的倾向。话虽如此,有时候也能从「参照网页」上有一些意外收获,例如小编就曾经透过此栏位,发现客户还有一个没好好作301转址处理的旧网站。

因此,从可信程度来说,可以较相信「 Sitemap 」来源的记录,而「参照网页」则需配合一些如Screaming Frog 或Ahrefs – Internal Backlink 等第三方工具作复查。

4.检索

本区块较重要的栏位是「上次检索时间」,记录的是Google最近一次检索网址的时间,页面当前显示的资料都是该时间点检索而来。

实务上,当重要页面的检索时间离测试当日距离太远,则需要留意页面是否内部连结不足,或网站近期的检索次数是否有下降,即Google 近期是不是有降低检索我们网站的次数。

比较可惜的是,此处的时间无法与上栏的参照网页作结合分析,我们无法得知哪笔网址是刚被检索过的(但就上文的分析而言,说不定也没记录在上面)。

5.产生索引

使用者宣告的标准网址:如有在页面埋设Canonical 标签, Canonical 指定的网址将显示于此。如无设定,则显示「无」。

Google 所选的标准网址: Google 判断标准版本的依据包括:内容重复程度、内外部连结、 Canonical 标签、301转址。我们知道, Canonical 不是强制元素,设置后Google 有选择买不买单的权力。此栏是Google 用来告诉我们它选定哪个网址为标准版本。换句话说,Google 判断受检测网址是否为标准网址时,有三种状况:

与使用者宣告网址一致:表示Google 选定的标准网址与Canonical 埋设的一致

受检测网址:表示Google 选定的网址与我们丢工具测试的网址一致,但可能与Canonial 设定有所不同

列出另一网址:表示Google 选择了一条检测网址、 Canonical 标签以外的网址

用法3:检查页面渲染状况

我们都知道Google搜寻运作的机制是:检索器(爬虫)发现>检索>索引网站页面后,再根据关键字查询列出排名结果。然而,爬虫检索页面时「看到」的内容,不一定与使用者在浏览器看到的相同,例如瀑布流、一些使用JS渲染的元素,这些构建页面的技术,有可能基于各种情况无法渲染成功。

面对这种情况,其中一个重要的判断依据,便是网址审查工具的「查看已检索页面」功能,我们可以使用本工具来检视、确定页面重要文字、区块是否能被Google「看到」,亦即有没有被正确地渲染出来。

延伸阅读:JavaScript SEO 终极指南(SEOer必看)

操作方法如下:

1.点击示意图右上方「测试线上网址」,让工具线上立即模拟爬虫渲染页面,结果出来之后可以看到右上方多出「即时测试」的页签,点击「查看已测试的网页」。

*如不先经过「测试线上网址」的步骤,看到的会是Google上一次检索页面时的渲染结果,不一定与现时状况一致,因此保险起见均建议先「测试线上网址」。

1.测试结果分「HTML」、「萤幕截图」、「更多资讯」三类。

HTML:此处列出的HTML便是Google 检索页面实际渲染出来的结果,在搜寻框键入重要资讯的元素(Ex.文字、连结,元素),搜寻成功代表该元素能被正确「看到」。

萤幕截图:与「HTML」类似,只是此处会以视觉化形式呈现。美中不足的是并不会把整页的渲染结果呈现出来,只能显示其中一部分。

更多资讯:此处较重要的是「网页资讯」子项目,这里工具会告诉我们渲染过程中成功和失败的资源数,也会把失败原因大致列出(Ex.遭到robots.txt 封锁)。就小编的实际经验来说,此处的测试有时间限制,Time-out也会导致资源载入不完整(失败条件归类为「其他错误」),因此如遇某些元素一直无法渲染出来,摸不着头脑的时候,建议可以多使用其他模拟工具综合比较渲染结果,或是多测试几个版型相同,或使用怀疑存在渲染问题的页面,多方比较测试较为保险。

此处提供一个可以弥补「萤幕截图」视觉化渲染结果不全面的小撇步。

将渲染结果中的HTML 原始码CTRL+A(MAC:Command+A )复制全部,在浏览器另开一个新的页面,然后Ctrl+Shirft+I(MAC:Command+Shirft+I)打开开发者工具,用复制过来的原始码取代该页签的原始码后敲一下Enter ,这时你看到的内容便是Google 渲染后看到的,可补充工具内部「萤幕截图」不完整的缺点。

线上也有一些第三方工具,例如Sereaming Frog、Merkle – Fetch & Render等工具,可以模拟爬虫的渲染结果,下图为Mekle 的渲染结果:

不过,相比之下毕竟网址审查工具是Google 官方工具,因此在正确性上较值得信赖,有其不可替代的地方。

用法4:检查强化项目

强化项目由「行动装置可用性」、「AMP」、「结构化资料」三类项目组成,显示受检测网址这三类项目的设定情况。

行动装置可用性:检查页面是否适合在行动装置上使用。

AMP:检查页面的AMP版本是否能正确索引(如有)

结构化资料:检测埋设的结构化资料标记是否正确。

如果您的网站刚刚上线,Google或因资料搜集不足,强化项目栏位可能会没有资料。

网址审查工具跟「 site: 」哪个准?差异是?

对SEO 有一定认识的朋友,应该都有听过或用过site: 指令, 它是Google 的搜寻指令之一,常用于检测网站、页面的索引状况。用法如下:

site:[example.com] :找出特定网域[exampl.com] 的搜寻结果

site:[example.com/blog/] :找出特定网域[exampl.com] blog 子目录下的搜寻结果

site:[example.com] {关键字}:找出特定网域[exampl.com] 中与{关键字}有关的结果

习惯上,也常常使用site:yoururl 检测页面有没有被Google 索引,例如:

将检测网址搭配site: 指令拿去搜寻,如果Google 能返回检测网址,代表这笔网址已被索引。一般情况而言是正确的,这也是Google 官方建议的检测方式。不过,site: 的检测方式,与网址审查工具提出结果是一致的吗?

然而,就小编的经验来说,site: 指令不时出现一些令人疑惑的状态,多少令人疑怀其准确性。接下来,补充几个使用site: 指令检查索引况时需要注意的地方。毕竟,唯有恰如其分地使用工具,才能正确使用,并最大化其功效。

先说结论:

1.单笔网址的索引检查可以使用site: 作辅助,但若是想用在检查网站、子目录的索引总数,数字或跟实际量体有很大落差,尤以大型网站为什;

2.网址审查工具、site: 指令的结果可能会有不一致。

状况1:site:example.com 会列出一些有设置301转址的网址

有执行301转址的网址按理会移出索引(John 表示Google 不会索引已转址的网址),但很常看到一些已经有做301转址的网域,使用site:old-domain.com 仍能搜出东西,例如Moz 的旧网域https://www.seomoz.org/:

在site:www.seomoz.org/ 的情况下,Google 仍列出约4920 笔结果, Moz 搬家到新网域https://moz.com/ 已有一段时间,实际点击这些网址也可得知都有设置301转址,即使是某些网址失误没有设置,按常理也不应该有4000 多笔(不太相信Moz 人员会放任这个问题不处理)。

因此,当我们使用site: 指令作单一网址有无被索引的根据时,会不会刚好那条URL 恰好跟上例相似,让我们误以为网址有被索引,但实际上并没有?

状况2:site: 指令或无法过滤重复内容

根据Google 官方早年的文件,site: 指令存在以下问题:

Historically, Google has avoided showing pages that appear to be duplicate (for example, pages with the same title and description) in search results.Our goal is to provide useful results to the searcher.However, with a site: command, searchers are likely looking for a full list of results from that site, so we are making a change to do that. In some cases, a site: search doesn't show a full list of results even when the pages are different, and we are resolving that issue as well.

英转中翻译:「从历史上看,Google 一直避免在搜寻结果中显示看似重复的页面(例如具有相同标题和描述的页面)。我们的目标是向搜寻者提供有用的结果。但是通过site: 指令的搜寻者很可能正在寻找来自该网站的完整结果列表,因此我们正在做出调整以做到这一点。在特定情况下,即使页面不同,site: 搜索也不会显示完整的结果列表,我们也正在解决这个问题。

SEL早年也有撰文讨论重复内容然显示在site: 指令搜寻结果中的问题,值得留心、注意。

状况3:网址审查工具、site: 指令不一致

小编最近在检查某网站新上线页面有没有被索引时,就有遇到网址在网址审查工具显示「网页已编入索引」,但使用site:URL 却没有结果,而直接搜寻网址又有列出。情况如下:

1.网址审查工具显示页面已被索引


2. 但使用site:test-URL 却显示没有结果

3.直接搜寻网址又能吐出结果

如上文所述,Google 官方是以site: 作为网站或网址有无被成功索引的依据:

接着又说:

其次,Google 官方也表示:

此处语境是:当使用site:your-URL 未能显示该页面,但网址审查工具又显示网页已成功索引。

小编初步推测当中存在时间落差,当某网址Google 确定将其收入索引资料库,还需一段作业时间才能「正常地」出现在搜寻结果(site:),并非「建立索引」后就会马上「出现在搜寻结束」中。

按时间顺序来说,网址审查工具能较早地知道该网址会不会被索引,故此才存在如此吊诡且矛盾的状况。以「搭飞机」作例子,搭飞机通过安检确定可登机后(=已编入索引/建立索引),还需先在候机室等候一段时间,待广播后才能一一登机(=出现在搜寻结果中)。

其次,小编推测网页本身的内容品质也是影响因素的原因如下:site: 指令本质上是一种有限制条件的Google 搜寻,自然也受「权威度」、「相关度」两大判断因素影响,并不是站内有相关页面,Google 就一定会它列在搜寻结果上。

以上文提到的例子来说,有机会是Google 认为那个页面目前品质欠佳,故纵使已编入索引也不倾向在搜寻结果中列出。

小结:

1. site: 可以用来查询单一URL 是否被索引;

2.不建议使用site: 指令当作检视某网站、子目录的索引页面数量的依据,可能列出不完整或列出实际已不存在的页面。

可以用John 在Twitter 的一个回复作呼应:

2个快速批量检查索引的工具

网址审查工具虽然功能强大,但每次只能检测一笔网址,不利于网站管理者检查页面的检索、索引状况。小编接下来提供两个可以一口气检测复数网址的工具:「 Search Analytics for Sheets 」和「 Screaming Frog 」。

工具1:Search Analytics for Sheets 外挂(免费)

Search Analytics for Sheets 是官方推出应用在Google Sheets 上,用来串接GSC 资源后可以汇出相关数据的小外挂。此外挂的优势是能够在一张表格中同时查看多维度的数据,而且还不受GSC 预设只显示前1000笔资料的限制。目前此工具提供串接网址审查工具的功能,虽然是尚为Beta 版本,但小编实测下来相关资料都能正常显示,可以一口气检视大量网址的索引状况。

1.安装并启用Search Analytics for Sheets

在GSC 所在资源的Google Drive 中,建立一个新的Google Sheets ,在工具列依次点击「扩充功能>取得外挂程式」,在跳出的视窗中搜寻「 Search Analytics for Sheets 」并进行安装。

2.资料汇出设定

以下为外挂控制面皮的选项说明:

Verified:选择欲汇出的资源

Date Range:选择资料的汇出日期范围

Search Type:选择Default(Web) ,因为目前的需求是检测网址的索引状况

Filiter By:保持预设

Aggregation Typs:保持预设

Rows returend:汇出资料的笔数,建议根据网站量体选择相应的数量,预设有1000、5000,everything(全部)三个选项

Results Sheet:资料新增位置,视个人需求、习惯选择

Include Fresh Data:即GSC 目前还在处理中,为最近几天的不完整资料

URL Inspection(beta):务必勾选,以汇出相关数据 

选择相关条件后,点击Request Data 汇出数据。

1.汇出数据范本


上图为汇出报表的截图,以表格的方式列出上文提及的种种资料,例如「URL Inspection Result」、「Coverage」、「Google Cananical」、「User Canonical」等,也包括AMP 、结构化资料等强化项目。不过,此报表未列出「参照网页」和「行动装置可用性」,但考虑到强化项目本身在GSC 另有报表可以检查其状况,因此此报表就实用性而言还是很高。

可以看到,这外挂程式可以在一张表格里一口气列出大量网址的检索、索引资料,执行时间比GSC 更快、更有效率,非常适合大量查看页面检索及索引状况。况且,表格还包含成效报表的点击、曝光等基础数据,上图【步骤2】的「Group By」如把Query 也纳入汇出范围的话,还可以作更完整的进站关键字分析,可说是GSC 的一大辅助工具。

由于本文的主题是网址审查工具,因为省略介绍很多Search Analytics for Sheets 的强大功能,对这个官方外挂有兴趣的朋友可以参考Harris 先生的教学文章。

工具2:Screaming Frog 串接GSC 帐户(免费版有数量限制)

我们也可以使用SEO 界最强大工具之一的Screaming Frog ,通过串接GSC 所在的Google 帐号,也可以汇入网址审查工具相关的资料。

1.开启设定页面

工具列依序点击「Confriguration>API Acess>Google Search Console」,

2.串接GSC 、网址审查工具

在跳出视窗点击「Connect to NEW Account」,这时会跳出浏器页面,请选择资源所属的Google 帐号并作授权。接着切换至「URL Inspection」页签,勾选「Enable Inspection Tool」、「Use Multiple Property 」,串接网址审查工具。

3.串接成功

现在在Screaming Frog 会多出一个「API」的状态栏,接着再按Start 开始爬取网站。由于串接API ,因此工具运行的时间会比平常稍久一点,需要一点点耐性。

4.搜爬完毕后,可以看到会多出与GSC 相关的栏位

为便于使用数据,可点击Export 将表格资料汇出为csv 档或上传至Google Drvie 中,方便进一步分析。

重点整理Summary

1.网址审查工具反映Google 官方对资源内不同网址检索、索引的处理方法,以这些资料为基础可检讨网站的相关问题,如:网站架构安排、内部连结布局、重复内容处理等;

2.使用「测试线上网址」功能,可模拟爬虫页面的渲染结果,了解网站应用的技术在Google 眼中是否具备「可见性」、「符合收录标准」、「可否被爬取」;

3.要注意「 site:url 」搜寻指令与网址审查工具两者的结果存在落差;

4.网址审查工具、site: 用途不同,可互补不足,但均无法取代对方;

5.可以使用Search Analytics for Sheets 或Screaming Frog 一口气汇出整站的资料,方便分析相关情况。

参考资料

网址检查工具– Search Console说明

https://support.google.com/webmasters/answer/9012289

为什么Google 搜寻找不到我的网页?– Google 官方文件

https://support.google.com/webmasters/answer/7474347

如何确认网页被Google 索引(index)了?三个确认方法及强化作法,搞定索引问题!– Frank Chiu  https://frankchiu.io/seo-indexing-intro/

学习使用Site指令,诊断《 Google索引》状况– Harris 先生  https://www.yesharris.com/site-command-basic/

Google Search Console URL Inspection Tool: Ultimate Guide – ContentKing  https://www.contentkingapp.com/academy/url-inspection-tool/

How to use the URL Inspection Tool – JC Chouinard  https://www.jcchouinard.com/url-inspection-tool/

How To Check the Indexing Status of a Large Website – Onely  https://www.onely.com/blog/how-to-check-the-indexing-status-of-a-large-website/

My Ultimate Guide to Indexing SEO Isn't Indexed – Onely  https://www.onely.com/blog/my-ultimate-guide-to-indexing-seo-isnt-indexed/

SEO Test: Site Command – Dejan Marketing  https://dejanmarketing.com/seo-test-site-command/

文章来源于SEO分解茶


点赞(1) 打赏

评论列表 共有 0 条评论

暂无评论

服务号

订阅号

备注【拉群】

商务洽谈

微信联系站长

发表
评论
立即
投稿
返回
顶部