谈到网站URL和网站结构时,大家似乎觉得这两个问题很简单,从技术和理论角度分析,确实简单;但是从网站长期运营和搜索引擎友好方面去分析,网站URL和结构已经成为网站搜索引擎友好的最大基础性问题,网站URL和结构问题,早发现早优化,越是往后放,最后就成了制约网站运营和产品开发的决定性因素。
URL规范:
URL分为静态URL和动态URL,网站不管采用静态URL,还是动态URL,最后URL链接都要与具体对应页面发生关系,换句话说是页面状态决定了动态URL,还是静态URL,事实上页面本身完全可以不存在,内容存放在数据库中,如果数据库内容没有被前台页面调用,那么数据库的内容其实没有任何意义,对网站来说。当数据库内容被前台调用时,那么就产生了页面,至于页面使用动态URL还是静态URL,这个决定于网站本身和技术能力的问题。如果单从用户和搜索引擎角度考虑,把页面生成静态URL是最好的策略,考虑到网站内容数据海量和服务器承载压力,静态URL和动态URL配套使用是最佳的解决方案。说到这里,静态URL还可以细分为纯静态URL和伪静态URL,动态URL非常容易理解。这里我们先解释一下什么是静态URL?什么是动态URL?
静态URL:
静态网页使用语言:HTML(超文本标记语言) 纯静态URL后缀多以html、htm形式,例如:http://visa.byecity.com/country-france.html 伪静态URL后缀文件名称+“/”形式,例如:http://www.byecity.com/eurailpass/
动态URL:
动态网页使用语言:HTML+ASP 或 HTML+PHP 或 HTML+JSP 等 动态URL后缀多以编程语ASP 、PHP、JSP,或是传参数形式,例如:http://package.byecity.com/Package.aspx?Id=529 动态URL、纯静态以及伪静态URL优势和劣势: 动态URL的优势是大幅度降低了技术维护工作量,易对网站进行规范化管理,是交互式、购物车、在线注册等特定功能必须使用的,而劣势是动态URL当用户访问时,才从数据库里待用内容并载入预前设定好的页面模板,对于用户访问速度造成了一定的延时影响,同时也消耗了服务器端带宽,不利用大规模用户群同时访问,对网站发展具有很多的局限性;且对搜索引擎蜘蛛爬行造成很大的不便,动态页面大部分是搜索引擎无法爬行和抓取的。
纯静态URL的优势是用户访问速度快,用户体验度高,对搜索引擎也很友好,纯静态链接地址被搜索引擎视为真实存在的页面,不易产生坏死链接,搜索引擎蜘蛛爬行速度快;而劣势是每次有新内容或是更新内容时都要直接生产静态页面,对服务器性能是一个严峻的考验,磁盘和内存消耗很大,同时也会轻微的影响服务器端反映速度,消耗了一部分带宽,但比动态URL消耗要小的多。
伪静态URL的出现是动态和纯静态的折中解决方案,伪静态最大的好处就是有利于搜索引擎,对用户体验也比较友好,在服务器端与动态URL的工作原理基本相似,但有不同之处,技术人员对整站动态URL制定新规范,对原来传参URL进行有规律的重写,如:http://group.byecity.com/destination-country.aspx?countryId=133,可以伪静态成,http://group.byecity.com/destination-country/133/ ,可以在服务器端批量将动态URL重写成伪静态等待搜索引擎蜘蛛来爬行和抓取。
URL规范化建议:实时更新的内容采用伪静态形式,不经常更新的内采用静态化形式,特定功能或交互式用动态URL形式。
网站结构:网站结构分为:物理结构与逻辑结构,物理路径是网站真实存在的物理绝对路径,而逻辑结构是网站虚拟的相对路径,比如:http://www.byecity.com/theme/maldives/ 为物理路径结构,而http://www.byecity.com/.../maldives/ 为虚拟路径结构,换句话说具体文件存放的地址是否真实。网站结构与URL的关系非常密切,互相影响。
一般情况下,网站结构采用物理路径还是逻辑路径都是通过URL来区别的,静态URL一般情况是真实反应了页面的物理存放路径,而伪静态多为虚拟路径,但不是说所有的伪静态已经都是虚拟路径。其实网站采用物理路径结构还是虚拟路径结构,对用户访问不会造成任何影响,但是对搜索引擎的影响是比较大的。很多网站静态页面,也就是静态URL也采用了相对虚拟路径,如:<a href="yazhou.html" target="_blank">亚洲</a>,正确的写法应该是<a href=http://visa.byecity.com/yazhou.html target=" _blank">亚洲</a> 。
物理结构与逻辑结构对搜索引擎没有绝对的有利或是不利,不管是物理结构还是逻辑结构,层级过多都对搜索引擎产生不利的影响。经过四年SEO经验得出,扁平式的物理结构架构与底层数据逻辑结构嵌套模式,才是最佳的网站结构模式。
网站频道、栏目、专题采用扁平式物理架构,路径层数不超过3层,这样网站的基本框架就成型了,如果单一的采用逻辑结构,网站内容存放和管理绝对一团糟,为网站坏死链接打下了基础,日后造成的负面作用会非常之大。超出扁平式3层结构的底层数据,可以采用逻辑结构,保证底层数据易被搜索引擎抓取,且获得高权重,什么是底层数据呢?底层数据可以认为是终端页、详情页、或是存放路径比较深的页面。
例如:酒店 | 机票 | 自由行 | 团队游 | 目的地指南 频道采用扁平式物理结构 具体酒店页面 具体旅游线路页面 终端页可采用逻辑结构(一般的终端页路径层级已经远远超出了3-5层) 总结:本次主要对网站URL规范和网站结构进行了分析,不单从SEO角度考虑,更多的是从网站运营和产品管理本身出发,以及网站对搜索引擎、网站运营管理成本,特别是对用户体验的诸多有利和不利影响做了具体说明,理论源于实践,如有与现有部分理论有冲突之处,还需要大家一起去验证、实践,在实践中认识问题和分析问题,还原一个真实、完整的理论体系。谢谢大家的关注和阅读!
需要讨论可以QQ:365080971 MSN:phookzhao@live.cn
作者:赵宜君
职业:搜索引擎营销咨询师
公司:Netconcepts.cn (中国区)