重复内容是指可以通过多个 URL 访问相同或非常相似的内容。这些重复页面是通过多种方式无意中创建的 - 例如,同时具有HTTP和HTTPS 版本的页面;www 和非 www 页面版本;UTM参数;分页等。这时我们就需要对我们的网址进行规范化,确定首选网址。
为什么规范化很重要?
当搜索引擎抓取许多具有相同(或非常相似)内容的 URL 时,可能会导致许多SEO问题。首先,如果搜索爬虫必须浏览太多重复的内容,他们可能会错过一些独特的内容。
其次,大规模重复可能会削弱你的排名能力。重复内容会导致关键字蚕食。当网站上的多个页面竞争相同的排名时,就会发生这种情况。并在此过程中损害彼此的排名。
最后,即使你的内容确实排名,搜索引擎也可能会选择错误的 URL。
通过正确使用规范标签,你可以帮助 Google 了解你网站的结构。并确定重复页面的最佳版本。
重复内容的可能原因
l以下是适用于所有类型网站的重复内容的其他一些常见原因:
l具有搜索参数的参数化 URL (例如example.com?q=search-term)
l具有会话 ID 的参数化 URL(例如,https://example.com?sessionid=3)
l拥有单独的可打印页面版本 (例如example.com/page 和example.com/print/page)
l不同类别下的帖子具有唯一的 URL (例如example.com/ services / SEO/ 和example.com/specials /SEO/)
l拥有适用于不同设备类型的页面 (例如example.com 和m.example.com)
l拥有 页面的AMP和非 AMP版本 (例如example.com/page 和amp.example/page)
l在非 www 和 www 变体 (例如,http://example.com 和http://www.example.com)上提供相同的内容
l在非Https 和Https 变体上提供相同的内容 (例如,http://www.example.com 和https://www.example.com)
l使用或不使用尾部斜杠提供相同的内容 (例如,https://example.com/page/ 和http://www.example.com/page)
l在页面的默认版本 (例如索引页面)上提供相同的内容(例如,https://www.example.com/、https://www.example.com/index.htm、https://www.example. com/index.html、https://www.example.com/index.php、https://www.example.com/default.htm等)
l使用或不使用大写字母提供相同的内容 (例如,https://example.com/page/ 和http://www.example.com/Page/)
l整个分页系列中具有相同或非常相似的内容(例如:https: //www.example.com/和Https://www.example.com/?page=2)
l为定位不同位置而创建的 URL(例如:https://en-us.example.com/ 和https://en-gb.example.com)
l联合内容:如果你有一个网站将其内容联合发布或被合作伙伴利用,你需要确保出现在搜索结果中的是你的版本。
Google官方提供的规范化网址方法
若要向 Google 搜索指定重复网页或非常相似网页的规范网址,你可以使用多种方法指明你更愿意使用哪个网址。这些方法按照其对规范化的影响程度排列如下:
重定向:强信号,表明重定向的目标应成为规范网址。
rel="canonical" link 注释:强信号,表明所指定的网址应成为规范网址。
站点地图包含:弱信号,有助于站点地图中包含的网址成为规范网址。
请注意,这些方法可以叠加,因此组合使用会更有效。 这意味着,如果你使用两种或更多种方法,将会增加你的首选规范网址出现在搜索结果中的几率。
这里查看更多https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls?hl=zh-cn
Google 如何确定页面的规范版本
当 Google 在索引过程中遇到多个看起来相似的页面时,它会选择一个页面作为规范页面。但谷歌是如何确定这一点的呢?他们考虑了以下一些因素:
1.移动设备优于桌面设备:通过移动优先索引方法,Google 将选择在搜索结果中优先考虑页面的移动版本而不是桌面版本,因为更多的用户使用移动设备访问网络,并且 Google 的目标是在移动设备上提供最佳的用户体验。
2.基于HTTP的HTTPS:与非安全页面 (HTTP) 相比,一般来说,Google 更喜欢提供安全页面 (HTTPS)。
3.“干净”的 URL 优于带参数的 URL:谷歌喜欢更短、更干净的网址,因为它认为它们对用户更友好。例如,https://www.example.com/canonicalization/将比https://www.example.com/blog/canonicalization?2023=july/获得更高的优先级
4.PDF 和其他文件格式的页面:Google 通常会选择网页作为规范版本,因为它们比 PDF 或其他文件格式更容易被用户访问。
5.语言:如果你创建了针对多种语言和位置的页面,Google 可能会将查询语言视为规范语言,这意味着如果用户使用法语执行搜索,Google 会选择你的法语页面作为规范页面。
6.整体页面信号:Google 评估各种页面信号,包括用户体验 (UX)、专业知识、权威性、可信度 (EEAT) 和语言相关性。在这些领域表现出强烈信号的页面更有可能被选为规范版本。
优化我们的首选页面以符合 Google 的偏好将增加我们所需的规范页面被选择的可能性。
阅读更多:https://www.womenintechseo.com/knowledge/dealing-with-duplicate-content-canonicalization-in-detail/
如何知道你的网站是否存在规范化问题?
1.查看源码
在大多数浏览器中,你可以右键单击查看源代码,或者只需在地址栏中键入它,如下所示: 查看源代码:https://moz.com/learn/seo/cano...源代码,在<head>中搜索canonical标签。如果存在,它应该如下所示:
1.使用Google Search Console
使用Google Search Console(https://search.google.com/search-console/about)了解 Google 认为你网站上任何页面的规范 URL 。登录后,在顶部搜索 URL。
当“URL 检查”报告准备就绪时,打开“页面索引”部分。向下滚动查看“Google 选择的规范”。
如果这不是你的首选 URL,你需要检查页面上的重复数据删除策略。 首先,请确保“用户声明的规范”存在且正确。
要批量检查,可以使用Ahrefs, SEMrush, Screaming Frog等工具。另外,可以查看谷歌的Canonical 报告,如下图
你如何解决此类问题?请按照以下步骤改进并提交给Google:
1.HTTPS:与 (HTTP) 相比,Google 更喜欢安全页面 (HTTPS)。给你的网站安装SSL安全证书可以增强信号并符合 Google 对安全浏览体验的偏好。
2.“干净”的 URL 结构:拥有干净且用户友好的 URL,没有过多的参数或分页细节,向 Google 发出信号,表明这些是主要页面,应该优先考虑。简化你首选页面的 URL 结构可以增强规范信号。
3.内部链接:内部链接表明你的页面的重要性和相关性。确保你在内部链接时仅到规范版本(而不链接到非规范版本),这样 Google 就很难忽视你的预期选择。
4.hreflang注释:在你的页面上包含Hreflang 注释可以让 Google 了解你的位置和/或语言定位。这有助于确保提供最相关的页面版本。
5.网站地图:在站点地图中包含 URL 可以向 Google 表明你认为这些页面很有价值并且值得优先考虑。因此,将规范 URL 放在站点地图中可以增强信号,使 Google 更难以忽视。
6.外链:当其他网站链接到你的首选页面时,它会向 Google 发出强烈信号,表明用户发现你的内容有价值且有用。如果你正在从事公关或其他类型的链接建设活动,请确保你请求链接到你的页面的规范版本(而不是非规范版本)。
7.301 重定向:这里要小心!仅当没有令人信服的理由导致页面存在多个版本,并且你的目的是永久合并这些页面版本时,才应考虑 301 重定向。在这种情况下实施 301 重定向不仅可以确保用户登陆正确的版本,还可以传输链接权限和其他排名信号。
所有这些规范化因素结合在一起,告诉 Google 你喜欢哪个 URL,并帮助证明你页面上的规范链接元素是经过深思熟虑的。
指定规范URL的方法
规范标签是一种告诉搜索引擎特定 URL 代表页面主副本的方法。使用规范标签可以防止由于多个 URL 上出现相同或“重复”内容而导致的问题。实际上,规范标签告诉搜索引擎你希望在搜索结果中显示哪个版本的 URL。一般规范标签位于网页HTML 源代码的 <head> 部分,如下所示:
<link rel="canonical" href="https://example.com/preferred-url-here/" />
通常,规范标签从备用页面指向首选页面。但首选页面也会使用自引用规范。
WordPress站网址规范化方法
你可以使用WordPress SEO 插件在 WordPress 网站上设置规范 URL 。 例如,Yoast SEO 插件,Rank Math SEO等。
其他方法
通常,你可以使用规范标签指定规范 URL 首选项。但你还可以尝试其他方法:
l在HTTP标头中使用 rel="canonical"(最适合非HTML 文档)
Link:<https://www.example.com/downloads/filename.pdf>; rel="canonical"
l将重复页面重定向到规范页面(最适合不需要保留的重复页面)
Google建议使用 3xx 重定向(服务器端重定向)以获得最快结果。一个常见的 SEO 问题是规范标签是否像 301 重定向一样传递链接资产(PageRank、权威等)。在大多数情况下,他们似乎是这样,但这可能是一个危险的问题。请记住,这两种解决方案为搜索爬虫和网站访问者创建了两种截然不同的结果。
如果你 301 重定向页面 A--> 页面 B,那么人类访问者将自动被带到页面 B,而永远不会看到页面 A。如果你 rel-canonical 页面 A--> 页面 B,那么搜索引擎将知道页面 B 是规范,但人们将能够访问这两个 URL。确保你的解决方案符合预期结果。
l仅在站点地图中列出规范 URL(所有网站所有者的最佳实践)
据谷歌称,“站点地图中列出的所有页面都被建议为规范页面” 。这意味着最好仅在站点地图中提交规范 URL(和非重复页面) 。并保留备用网址。
注意:如果你为特定页面设置规范标签,但随后在站点地图中包含该页面的不同设置,或者内部链接到该非规范页面,它会发送混合信号,并可能导致搜索引擎忽略规范标签并自己选择规范版本。所以保持一致性以向搜索引擎强调你的意图。
文章为作者独立观点,不代表DLZ123立场。如有侵权,请联系我们。( 版权为作者所有,如需转载,请联系作者 )
网站运营至今,离不开小伙伴们的支持。 为了给小伙伴们提供一个互相交流的平台和资源的对接,特地开通了独立站交流群。
群里有不少运营大神,不时会分享一些运营技巧,更有一些资源收藏爱好者不时分享一些优质的学习资料。
现在可以扫码进群,备注【加群】。 ( 群完全免费,不广告不卖课!)
发表评论 取消回复