百度“飓风算法”与网站内容生产

2018-04-16
  • 1136
  • 0

20177月份,百度大张旗鼓的推出“飓风算法”,号称“严厉打击恶劣采集”。一时间SEOer们人人自危。毕竟所谓“内链为王,外链为皇”是SEOer们在嘴上念叨了十几年甚至几十年的一句话。而网站的内容可是以“王生存的土壤”的身份存在的。99%的SEOer都不敢说没有为了网站优化而采集过互联网的內容。这怎么能不把SEOer们吓的屁滚尿流。而且在飓风算法上线一个月左右的时候,曾经出现过一次大批量的网站收录和流量波动。虽然最终绝大多数都回复了正常。但还是有极少部分的网站近乎永远的退出了我们的视野。那么到底百度的飓风算法的命中目标和判断方式如何呢?

其实答案早就已经很明显了,甚至可以说,答案就在提示里。百度的飓风算法的公告页有一句话,也是本文第一行就提到的“严厉打击恶劣采集”很显然,飓风算法真正打击的是“恶劣(标重点标红加粗加H1标签放大字号)采集”。而轻度的采集或许也会受到飓风算法的影响,但是影响就轻的多。有些人一定会问,那么“恶劣采集”的恶劣的判断维度又是什么呢?

具体精确到值,那个结果是除了百度算法研究部门和这个部门的领导之外无人知道的。但是大致的影响范围却可以从飓风算法上线至今的种种迹象判断一二:

首先,虽然不推荐这种方式,但是还是要说,“伪原创”貌似不在本次飓风算法打击的范围内。当然如果你非要说你复制了一篇八百字文章,就改了五六十个字或者替换了一些同义词或者文字顺序就算伪原创了,那当我什么没说。在文言文的领域,对一些经典文献的解释形成的长篇文字叫“注”意思是注解,而对“注”进行二次解释形成的长篇文字叫“疏”。我个人认为所谓的伪原创其实就是“注”或者“疏”,而不是仅对原文进行一些简单的修改。

其次,转载的内容也不在飓风算法的打击范围。因为百度本身就对优质内容聚合的页面或者频道有高度的评价,并赋予其高权重,给与高排名,从而带来高流量。因为这部分内容相对来说更加能满足搜索引擎用户的体验。但这种情况的前提是“转载”而非“复制”或者“采集”。区分“转载”或者“采集”的方法也很简单。看主体内容区域是否有指向内容来源的锚链接就知道了。当然如果你添加了链接,然后又加了nofollow标签,你当我没说……这也是百度所谓的星火计划的一部分。利用这一点也可以为高质量的原创内容提供更多的有价值的外链和权重。ZAC老师所说的“外链”也正是这个概念。

第三,轻度的采集虽然会受到飓风算法的影响,影响的幅度还算不是很大。或者可以说是看你违规程度较轻,给你一个悔改的机会……

无论是飓风算法还是任何的搜索引擎算法。都是搜索引擎运营商从运营角度出发,为了给用户提供更受用户认可的内容而做出的对收录的网页的限制。其实只要真正从用户的角度出发,从新的角度提供用户需求的内容。并且以搜索引擎能识别的形态展现。同时尽量避免冗余的不应存在的内容。无论怎么做,都会获得一个好的结果的。