软404(Soft 404)—网站的软肋

2010-09-26
  • 1412
  • 0

什么是“404状态码”?

404状态码应该是SEO人员比较熟悉的HTTP状态码,用于表示服务器在响应客户端请求时,未找到文件或目录。随着网站的发展,不可避免的要经历资源更换、改版等工作,这都将导致网页上引用的URL资源(网页、图片等)被删除或者转移,当用户登录网页,对已经被删除或转移的资源发送访问请求时,服务器将返回404状态码。

什么是“软404”?

针对404状态码这一现象,较好的处理方式是自定义友好的404页面,将流量引导至相关页面或者直接引导至首页。但事实上,404页面有“软硬之分”,“硬404”即是上文中提到的针对无效资源返回404状态码,而“软404”则是指针对无效的资源,本应返回“404”状态码,服务器却返回的是200状态码(访问成功)。

“软404页面”不仅会给用户带来困惑,而且会消耗搜索引擎资源,假定搜索引擎每天在每个网站中消耗的资源是固定的,如果搜索引擎蜘蛛在抓取大量的“软404”时耗费了大量的资源,那么搜索引擎蜘蛛消耗在网站上一些真正希望被索引的内容页面上的资源就会大大减少,从而影响网站的索引覆盖率(收录量)。

如何监测并解决“软404”?

Google网站管理员工具中已经能监测“软404”。

图为 Google网站管理员工具中的软404Soft 404)监测

要解决“软404”的问题,最简单的方法就是针对不存在的资源或目录返回404状态码而不是返回200状态码。当然彻底的解决方法是从网站模板中移除已经不存在的资源,这样做不仅能提高用户体验,同时也能提高网站性能。