什么是4xx错误?

4xx错误是该URL返回由400至499中的任何HTTP状态码。区段400至499的状态是指所有客户端错误,这些错误来自请求,而非伺服器端的回应。这个区段的错误类型有很多,但最常见的一般有404、403或401。

404(找不到网页): 404的意思是该URL不存在任何页面。 这类错误通常都是来自这三个问题:

  • 链接内anchor标签输入的href值不正确。
  • 页面已不存在或已被移到另一条URL
  • 实际页面的URL或档案名称输入错误,导致anchor标签的href值与其不相附。

403(被禁止): 这个错误指客户端并没有访问该内容的权限。最常见的原因是该URL是目录列表(非页面内容)而伺服器又禁止了浏览器进行目录浏览。

若访问者未能提供正确的验证资料,一些伺服器会返回403状态码,即使在这个情况下正确的状态码应为401。403错误应该在不论访客是否提供正确验证资料也被禁止访问的情况下使用。

401(未授权): 被访问的URL要求验证(登入)以进行浏览,若你尝试获取登入页后的网站内容,你有机会会收到这条讯息。

为什么这个问题值得关注?

4xx错误对于一个网站而言是个大问题。它们应该是被最优先处理的问题,对SEO而言也一样。

首先,页面内容未能被搜索引擎获取,它们便不能被包含在搜索结果页,而该页面将无法得到任何自然流量。其次,当搜索引擎发现某URL返回4xx错误,它们一般会把这些页面从收录中移除,一旦它们被移除,要搜索引擎将他们重新收录可以是一个难题,即使这些问题已被修复。最后,搜索引擎可能会对有太多4xx错误的网站有不好的印象,影响网站的整体收录表现。

如何修复

4xx错误的修复通常都不太困难,修复方式则视乎导致问题的源头。

所有4xx错误(大部分时候都是404错误

首先你需要看看每条URL来判断相应页面应否存在于这些URL中,这个过程不会太困难,看看有没有明显的错别字或看看这些页面是否已经被转移到另一条URL。

如果你可以找到URL上的错别字,你应该在修复站内所有链接到这个URL的地方,你可以用每行左方的展开按钮或点击每行的到该页面的内部链接数来知道这个页面可以从站内什么地方到达。现在你只需要查看该页面原始码来找出那条带错别字的URL并进行修正。

如果页面己被移走,修复问题的理想方式会是为这条旧URL创建301重定向到新的URL。如果你没法进行301重定向,你则需要找出所有旧链接并把它们指到新的URL。

如果链接URL并没有错别字,也不是被移走了,那就很有可能是页面自身URL带错别字。检查伺服器上的目录和文件名,如果你有用URL rewrites,确认它们没有包含错别字。

403错误

确认该URL指向含有内容的页面而不是目录列表,这是最常见的403错误原因。如果你的URL是一个目录列表,你应该将所有链接指向这条URL或使用301重定向指向新的URL。

如果伺服器封锁或不接受来自Dragonbot的请求,伺服器会发出403回覆。在这个情况你需要改变伺服器的设置,令它接受来自Dragonbot的请求

401错误

查看该页面是否不需登入就可以正常访问。 如果该页面不应先登入方可查看,你需要改变伺服器设置或程式码以允许未验证用户检视该页面。若该页面只应允许登入用户查看,考虑使用robots.txt将这些页面排除。

Did this answer your question?