千万级内链系统架构上

2018-02-08
  • 935
  • 0

内链,顾名思义,就是在自己的网站内容中,把相关核心关键词提出来,加上相关的页面链接,链接到站内或者站外相关的内容页面上,用于提升相关页面的相关性,合理的内链结构,能提高搜索引擎的收录与网站权重。对SEO来说是非常重要的一个环节。

 

但是目前为止,大量网站平台的内链建设并不合理。主要原来是技术难度比较大,实施和处理都是非常麻烦的,对技术的高要求,导致这项工作目前很多平台都是人工参与实施。

 

为什么难度大,难以实施,下面做一个详细的分析。

 

传统方式的内链如何添加生效?

 

在常用的文章或者新闻为主的网站内,做文章的内链、自动生成标签的时候,通常有下面2种做法:

a、 前置做法:编辑在写文章的时候,尽量按要求往里面加入关键词信息。契合SEO的要求。

b、 后置做法:写完文章之后,使用工具或者人工检查 是否包含要优化的关键词,没有的话添加上,有的话,加上内链。要做内链的关键词不多的时候,可以用这种方式。

c、 技术化实施:比前2种方式更高级和复杂的一种方式。首先在数据库中,存在2张表,表1,比如为content表,用于保存文章信息,比如:标题、关键词、描述、内容、发布时间、发布作者等,表2,比如可以使用links表,用于保存内链表。记录下需要优化和添加的内链信息。比如:id、anchor锚文本、link链接信息。

 

在具体执行的时候,在保存文章的时候,执行一段代码,循环判断文章内是否包含关键词,如果有的话,给关键词加上链接信息。生成内链之后保存。

 

总结:传统方式的内链会有很大的问题。Ab方法需要大量的人工参与。C方法程序处理了,但是问题随之而来。如果超过1万关键词,10万、100万,会产生什么结果?在保存的时间,每篇文章都需要去判断是否包含关键词。假如是100万的关键词需要做内链。那每新增1篇文章,都需要遍历检查100万词,检查是否包含关键词,判断是否应该增加内链。这个处理的速度会非常 非常 慢。花费极大量的时间才会保存成功。

 

不管想不想要,需不需要处理,传统方式建立内链,必然会遍历一遍,造成极大的资源浪费。

 

那新的考验下,如何建立千万级的内链系统呢。我们下回继续分享。