这篇为 Google Search Console 教学指南中的一部分,用以说明『提交的网址发生转址式404 错误』情境。
不知道大家有没有看过有个词,叫『soft 404』,中文翻译成『软404/ 转址式404』。
一般而言,当你访问网页时,浏览器会发送请求到服务器,然后服务器把你页面的内容传送给你。
并且会附上一个响应代码,这个响应代码是浏览器跟服务器之间的对话,用来告诉浏览器有没有问题。
如果说没问题,网页代码就会出现200;如果有要跳转到别页,可能会出现301 或302 代码;如果说出现错误,就会有404 错误代码。
那今天要提到的就是跟404 状态码有相关的『soft 404』。
当我们网页内容被删掉时、该页面错误、网址输入错误时,正常来说会看见『该页面不存在』,并且页面响应码会出现『404』的状况。不过响应码不能直接在页面中看到,可以透过Chrome 的插件『Redirect Path』查看。
什么是转址式404(Soft 404)
转址式404(Soft 404)就是页面看起来是错误页面,但是响应码却是200之页面
当你的内容有出现类似『此页面不存在』的情况,或是页面内容过于单薄的情况,Google 便有可能将其判断为丢失页面内容。会有所谓soft 404 的状况出现,就是为了让Google 的爬虫能够更有效的爬取网站资源,并且节省爬取预算,这样子Google 就能够自动将这些原本要爬取错误页面的资源,用来爬取更多网站重要页面。
我们不知道Google 判断的依据为何,但可以知道的是,此判断依据会类似于熊猫演算法想处理的页面,也就是那些页面品质低且重复性非常高的页面,也因此解决这些问题将能同时解决soft 404 以及熊猫演算法相关问题。
解决404 错误
除了soft 404 外,一般的404 页面也需要解决,可能的出现404 错误的原因主要有两点:
1. 错误链接
有时候有可能只是你链接网址写错了,将你网站中的错误链接找出并且将其修正,以防Google 浪费资源爬取错误页面。
内部链接对Google 来说是传递权重的一个方式,所以当你内部链接出现错误的话也会导致权重传递失败喔。
2. 页面下架或遭删除
有时候有可能因为某些原因,网页内容被下架或是删除,这时候也很有可能出现这种页面错误的状况。
如果可以,将下架页面301 跳转至相似页面,切记一定要相似页面,否则此跳转就没有传递权重的效果在,Google 将会把不相关的301/302 跳转视作soft 404喔,并将错误链接改成正确的链接。
如何检查404 错误及转址式404
工具爬取
这边以Screaming Frog 为工具,要找到网站中错误页面其实并不容易,如果网站不大的话推荐使用Screaming Frog,这边用transbiz 为例,将他们网站丢到Screaming frog 里面爬取后。
1.找到 Response Code > Client Error
2.点选左上方任意网址(都是错误网址)
3.点击下方的inlink,你就能看到哪些页面中放置着错误链接
4.到这些页面寻找错误链接并修正(原始码找Url、锚文字搜索等)
Google Search Console 查看
在Google Search Console 中,涵盖范围是个相当好用的功能,他能看到大多数索引所遇到的问题,图中就是我们要关注的重点。
早期我以为转址式404 是错误页面会跳转到404 页面,不过从刚刚的说明中,你应该要能知道转址式404 可能发生的原因,点击进去看看不同页面是什么问题并且逐一解决,这边简单提几个转址式404 常见案例。
1. 错误页面无正确404 响应码:
这就要从响应码去设定了,这边记得找自家网页工程师请他设定服务器能够在页面错误时显示404 状态码即可解决。
2. 网页内容过少或是无内容:
因为Google 爬虫有搭配AI 机器学习演算法,对于低品质内容及无内容页面判断的越来越准确,所以今天如果你的内容被表示转址式404,经你查看后发现原来只是内容过少,且该页是重要页面的话,记得多补上一些相关内容,并透过相关的主题页面增加内部链接连至该页面。
3. 重复内容:
当你的页面有大量重复性内容时也有可能被判断是转址式404,所以找出几乎相同的页面,然后找到权重较高之页面(可能是排名较好、外部链接较多、PA 分数较高等等),然后合并内容进行301 转址。
4. 不相关页面之301/302 跳转
这点比较少人知道,这也是John Muller 在某一次的Webmaster Central office-hours hangout中所提到的,很多SEO 人员其实会以为网站搬迁时,只要301 转址权重都能转移过去,有些则是全部转址到新网域首页,但其实这样对网站权重转移是没有帮助的!这点可以参见Ahrefs 的文章『301 vs. 302 Redirects for SEO』有详细说明,所以这篇文章才提到了3 次,只有相似页面能够转址相似页面。
总结
404 错误跟soft 404(转址式404),对于Google 而言都在『检索』及『索引』的阶段,对于排名的影响相对小,所以在网站规模不大时可能感觉不出问题。
可是因为检索预算的关系,当网站越来越大时,影响到Google 对网页检索及索引的状态时,对于排名就很有可能造成影响了。
特定页面重要性很可能被降低,因为这牵涉到重复页面问题、内部连结权重传递、内容质量不足等问题,必须去逐步抽丝剥茧比对才能找到问题。
执行SEO的每个环节其实都有都自己的重要性,像是索引、排名等,执行的每个动作也对各自环节有不同程度的影响性,我们必须透过不停的实验、思考、厘清,才不会在优化排名的过程中迷路了。
404 状态码存在的目的:页面出现错误时,Google 能第一时间知道,并且不影响索引
soft 404 存在的目的:方便Google 判定低品质及可能是错误的页面,以利Google 索引正确且重要的页面
哪些404 页面需要修正:网页中错误的网址;变动页面造成的网址改变;遭到删除的页面
哪些可能造成soft 404:错误页面未设定404 状态码;页面内容过少甚至没有内容;重复内容比例太高;不相关页面进行301/302 跳转
翻译作品,原作者:SEOTEA
更多文章:
Shopify SEO:增加自然搜索流量的 10 个简单技巧
JavaScript SEO 终极指南(Google SEOer必看)
文章为作者独立观点,不代表DLZ123立场。如有侵权,请联系我们。( 版权为作者所有,如需转载,请联系作者 )
网站运营至今,离不开小伙伴们的支持。 为了给小伙伴们提供一个互相交流的平台和资源的对接,特地开通了独立站交流群。
群里有不少运营大神,不时会分享一些运营技巧,更有一些资源收藏爱好者不时分享一些优质的学习资料。
现在可以扫码进群,备注【加群】。 ( 群完全免费,不广告不卖课!)
发表评论 取消回复