在对一个网站提出SEO方案的过程中,如何处理重复页面是比较重要的环节。什么是重复页面?重复页面是指在一个或多个网站中存在的内容差异较小的多个页面。
重复页面产生的原因:
1.网站改版
网站改版过程中,特别是Url重构,最易产生多Url对应单页面情况,这属于网站内部重复页面。
2.采集内容
大量采集其它网站内容,也容易被搜索引擎视为重复页面,也牵涉到搜索引擎对原创文章的识别,这属于广域的重复页面。
3.广告代码
很多网站在投放外部广告之后,带回含?带参的链接,例如:www.example.com/?from=hao123 ,此链接和www.example.com均指向同一页面(首页),但在搜索引擎看来这是两个链接。
站内重复页面的危害:搜索引擎在通常情况下,默认将重复页面中某一页面当做标准页,此标准页Url可能并不是正常优化中使用的Url,可能产生百度不收录、收录但快照更新慢等后果。用户自主分享链接时,并不知道重复页面的存在,也有可能使用重复页面Url作为外部链接,使目标Url损失外部链接权重。
重复页面解决方案:例网址A、B、C,同时指向页面P,其中正常优化的是A页面,B、C为重复页面。
1.网址规范化、301跳转,将多余的网址B、C301重定向到网址A。
2.robots屏蔽;在robots.txt文件中添加对网址B、C的访问屏蔽,如果是一类页面,则可以使用规则屏蔽,Disallow: (B|C)
3.使用Canonial 标签;Google在处理重复页面方面考虑得比较周到,可以使用Canonial标签指定某网页的标准页,具体使用方法:将<link rel="canonical" href="http://www.example.com/ "/>添加到www.example.com的<Head>标签之间。
如果您对重复页面处理有更好的建议,欢迎留言讨论。