URL 参数或查询字符串是 URL 的一部分,通常位于问号 (?) 之后,用于与 URL 一起传递数据。它们可以是修改页面内容的主动参数,也可以是主要用于跟踪且不更改内容的被动参数。
它们由键值对组成,其中键告诉您正在传递什么数据,而值是您正在传递的数据,例如标识符。它们看起来像 ?key=value 但如果有一对以上,则可以用与号 (&) 分隔,例如 ?key=value&key2=value2。
URL参数部分的解释。
在本指南中,我们将介绍您需要了解的有关 URL 参数的内容。
如何使用参数
正如我在介绍中提到的,参数可以是活动的的或被动的。让我们看一些例子。
活动参数
活动参数以某种方式修改页面的内容。
过滤器。删除一些内容,在用户想要查看的页面上留下更具体的内容。例如电子商务中的分面导航。
?color=yellow
排序。以某种方式重新排序内容,例如按价格或评级。
?sort=highest_rated
分页。将内容划分为一系列相关页面。
?p=2
翻译。更改内容的语言。
?lang=de
搜索。查询网站以获取用户正在寻找的信息。
在搜索引擎yep.com 上,我们使用键“q”进行查询,该值包含有关用户查询的信息。
?q=ahrefs
被动参数
被动参数不改变内容。它们通常用于跟踪。让我们看一些例子。
附属 ID。传递用于跟踪销售和注册来源的标识符。
?id=ahrefs
广告标签。跟踪广告活动。
?utm_source=newsletter
会话 ID。标识特定用户。在现代网站上使用会话 ID 来跟踪用户并不常见。
?sessionid=12345
视频时间戳。跳转到视频中的指定时间戳。
?t=135
搜索引擎优化的影响
当涉及到 SEO 时,URL 参数可能会导致许多不同的问题,尤其是在使用多个参数的情况下。以下是您可能会遇到的一些问题。
被动参数可能会导致重复内容的问题。通常,您希望它们被抓取,并且每个页面都应该有一个规范设置为主版本。
有时您可能希望使用robots.txt完全阻止这些参数被抓取- 但仅在您可能遇到抓取预算问题的情况下。稍后我们将对此进行更多介绍。
Google 将在称为规范化的过程中选择要索引的页面版本,并且链接等信号将合并到该索引版本。
活动参数可能会创建具有近乎重复的内容或与其他内容非常相似的内容的页面。它们也可能是完全不同的内容。您需要检查参数的实际用途。
内部链接
您应该避免使用被动参数,例如用于跟踪内部链接(从您网站上的一个页面到另一个页面的链接)。
这在大型网站上仍然是一种非常普遍的做法,但我想强调的是,这是一种陈旧过时的做法。
大多数分析系统都有事件跟踪,您可以使用它来记录数据,而无需向您的 URL 添加参数。
在大多数情况下,可以在内部链接上使用活动参数。
抓取
带有参数或大量不同组合的无限 URL 路径可能会导致抓取问题。保持一致的顺序,并且没有允许添加其他参数的路径。
您可以使用Site Audit中Structure Explorer工具下的Depth报告轻松找到潜在的无限路径。网站有 9 个以上的级别并不常见,因此这是一个强有力的指标,表明实际上可能存在无限路径或其他问题。
Structure Explorer中的深度报告。
谷歌会在抓取时进行调整,因为它识别出无限的路径或某些模式。它将尝试限制对它认为无用或重复的 URL 的抓取。
国际化
URL 参数有时用于国际网站。这些被列为特定于语言环境的 URL的一个选项。但即使是谷歌也表示不推荐。它增加了复杂性,更可能会出错。您也无法在 Google Search Console 中对这些 URL 进行地理定位。
电子商务
参数通常用于电子商务中的所有内容——从跟踪到分页,再到分面导航。这些主题可能非常复杂。
JavaScript
人们使用 # 而不是 ? 作为片段标识符,特别是对于那些用于跟踪的被动参数。这通常不是一个好主意。但在特定情况下,可以这样做来替换不必要的参数。
问题是服务器忽略 # 之后的任何内容,并且许多系统根本不会或无法识别使用 # 的参数。
另外,# 已经有一个指定的用例,就是滚动到页面的一部分。这是在客户端完成的,JavaScript 开发人员也可以使用它来转到具有不同内容的页面。
检查
检查您的站点上使用了哪些参数。在Site Audit 的 Page Explorer工具中,您可以搜索包含问号 (?) 的 URL。
在Page Explorer中搜索参数
您可以使用高级过滤器查找具有多个参数的页面或开始排除参数以帮助您识别网站上使用的所有各种参数。
一旦您知道使用了哪些参数,我建议您查看一些页面以了解这些参数的实际作用。
您还可以检查重复报告中的准确或近似重复。视觉效果使您可以轻松查看您是否有许多相同或相似页面的版本,以及它们是否具有匹配的规范标签来选择首选版本。您可以单击每个集群以获取更多信息。
复制内容树图视图以显示集群。
“批量导出”下还有一个选项,可让您一次导出所有重复的内容。我发现这个选项更容易用于更大的数据集。
控制参数
过去,Google 在 Google Search Console 中有一个 URL 参数工具,您可以在其中根据是否更改页面内容来选择如何处理不同的参数。该工具已于 2022 年初弃用。以下是 Google 对此的评价:
2009 年,当 Search Console 的前身网站管理员工具中推出 URL 参数工具时,互联网是一个比今天更加狂野的地方。SessionID 参数非常常见,CMS 难以组织参数,浏览器经常断开链接。使用 URL 参数工具,网站所有者可以通过指定某些参数如何影响其网站上的内容来精细控制 Google 如何抓取他们的网站。
多年来,谷歌在猜测网站上哪些参数有用,哪些参数——简单地说——无用方面变得更好了。事实上,目前在 URL Parameters 工具中指定的参数配置中只有大约 1% 对爬取有用。由于该工具对 Google 和 Search Console 用户的价值较低,我们将在 1 个月内弃用 URL 参数工具。
虽然没有提到,但我怀疑某些用户可能一直在使用该工具伤害自己。我过去遇到过这种情况,有人设置了错误的设置,说内容没有改变,但确实发生了。这从该网站的索引中删除了几十万页。哎呀!
您可以让 Google 抓取并弄清楚如何为您处理参数,但您也可以利用一些控件。
规范标签
规范标签可以帮助将信号整合到选定的 URL,但需要抓取页面的每个附加版本。正如我之前提到的,Google 可能会在识别模式时进行调整,并且随着时间的推移,这些规范化的 URL 可能会被抓取的次数减少。
这是我默认选择的。但是,如果一个站点有很多问题并且参数失控,我可能会考虑其他一些选项。
无索引
noindex 元机器人标记从索引中删除页面。这需要抓取一个页面。但同样,它可能会随着时间的推移而减少。如果您需要将信号整合到其他页面,我将避免使用 noindex。
在 robots.txt 中阻止
robots.txt 中的屏蔽参数意味着这些页面可能仍会被编入索引。它们不太可能出现在正常搜索中。
问题是这些页面不会被抓取,也不会整合信号。如果要合并信号,请避免阻止参数。
站点审核
在站点审核中设置项目时,抓取设置中有一个名为“删除 URL 参数”的切换,您可以使用它来忽略任何带有参数的 URL。
您还可以使用模式匹配在爬网设置中排除参数化 URL。
阻止站点审查中的参数。
边注。有趣的事实:我们只将页面的规范化版本计入您的抓取积分。
最后的想法
总结一下,URL 参数有很多不同的用例,它们可能会也可能不会给您的网站带来问题。一切都是看实际情况。
翻译作品,原作者:Patrick Stox
相关文章:
文章为作者独立观点,不代表DLZ123立场。如有侵权,请联系我们。( 版权为作者所有,如需转载,请联系作者 )
网站运营至今,离不开小伙伴们的支持。 为了给小伙伴们提供一个互相交流的平台和资源的对接,特地开通了独立站交流群。
群里有不少运营大神,不时会分享一些运营技巧,更有一些资源收藏爱好者不时分享一些优质的学习资料。
现在可以扫码进群,备注【加群】。 ( 群完全免费,不广告不卖课!)
发表评论 取消回复