学会《google网站质量指南》学会谷歌优化

2010-03-23
  • 3179
  • 1

针对google进行优化,我们有个现成的老师,那就是《google网站质量指南》,里面那些最基本的东西,是构建整个SEO理论的基石,以后所有的技巧都是从这些基础的东西发展而来的。而读《google网站质量指南》,不像研究搜索引擎的基本原理一样,有很多晦涩难懂的东西。《google网站质量指南》里非常偏重于直接告诉你如何去做是最好的。下面我分析一些《google网站质量指南》里的文章,看看里面向我们展示了多少技巧。

 

《google网站质量指南》要从这里开始阅读:http://www.google.com/support/webmasters/

这里只是一个总的目录,以后的几百篇文章都没有一个清晰的列表,要顺着一个个的链接下去才能读完。

先来看这一篇:《我的网站在搜索方面表现不佳》 网址:

http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=34444

首先,文章一开始就讲述了搜索引擎的目标和搜索结果是怎么出来的:

“我们的目标是为每个查询返回高度匹配的结果。搜索结果是通过我们的搜索索引返回的”。

我们都知道搜索引擎一定会遵循为用户返回高度匹配的结果的。在谈到搜索结果是如何出来的时候,google这里用的字眼是“通过搜索索引返回的”。 “搜索索引”有一个链接,那篇文章里面解释了搜索引擎的工作流程。如果仔细看的话,会发现很多有意思的东西。如提到索引的时候,它写到:

“Googlebot 会处理所抓取的每个网页,以便将其找到的所有字词和这些字词在每个网页上的位置都汇编到包含大量索引的列表中”。

“如果您的网站已与网络上的其他网站建立起可靠的链接,那么,我们很有可能会在下次抓取时再度添加您的网站”。

用“可靠的链接”来描述优质的外部链接非常合适,其中包括了:链接你的网站的权重、链接存在的时间长久度、链接页面内容的合适度等等。

 

“查看您的网站是否被 Google 编入了索引

确保 Google 能够找到并抓取您的网站

确保 Google 能够将您的网站编入索引

确保您的内容实用且具有相关性”

这4点是这篇文章内容的提纲。我不知道大家看到这4点的时候看到了什么。我看到的内容是:1、2、3点说的是收录量,第4点说的是排名。而关于收录量,又分为三步:先查询网站有多少页面被收录,然后再确保有没有爬虫抓取过你的网站,最后看看网站的收录量有多少。这个步骤恰好是我优化大型网站的时候的步骤。我还会用很多的数据来查看这些方面都做到了什么程度。

在谈到“查看您的网站是否被 Google 编入了索引”这一点的时候,google写了一个简单的方法判断你的网站有没有被惩罚:

“在 Google 上搜索 www.[您的域名].com。如果您的网站未出现在搜索结果中,或在搜索结果中的排名不佳,那么,这说明,您的网站可能由于违反了网站管理员指南而受到了处罚。”

 

这里要注意的是,如果搜索你的域名,排名不佳的话也可能是你的域名受到了惩罚。

在“确保 Google 能够找到并抓取您的网站”这一项内容中,google稍微写了一下爬虫在页面上的抓取模式:

“我们的抓取过程是根据网页网址的列表进行的,该列表是在之前进行的抓取过程中生成的,且用网站管理员提供的站点地图数据进行扩充。在 Googlebot 访问每个网站时,它会检测每个网页上的链接,并将这些链接添加到它要抓取的网页列表中。”

搜索引擎爬虫到达了一个页面后,这个页面上的所有链接都是会收集的。但是很多链接不一定会被爬虫接着访问,而是放在一个网址列表里,等着下次来访问。至于下一次什么时候来访问,访问了是不是会被收录,就看其他因素了。这里写得不详细,所以不是很好理解。要更深入的理解整个过程,可以查看搜索引擎原理之类的书籍就可以理解了。以后我会写一下爬虫的具体访问过程,其中分为单个爬虫如何处理、多个爬虫如何协同处理的。

 

google还有写:

“如果您最近调整了您的网站结构,或将网站移到了新的域中,那么,以前排名较高的网页现在可能会排名不佳。为避免出现这种情况,请在您的 .htaccess 文件中使用 301 重定向(“永久重定向”)来灵活地重定向用户、Googlebot 和其他信息采集软件。”

这里要着重看“灵活地重定向”几个字。很多人在做301重定向的时候是不能灵活的处理的,因为他们的URL没有规划好,所以只能简单的把所有的某类URL重定向到同一个URL。其实为了保证效果,最好是用正则表达式继承前面URL的特征来跳转。另外顺便提一下,百度这样的搜索引擎对于不是用.htaccess 文件做的跳转是识别不好的。所以有些网站用PHP代码做301跳转后,百度依然不识别。

 

另外还写到:

“即便您的网站已经编入索引,站点地图仍是向 Google 提供有关您的网站和您认为最重要网址的信息的一种方法。”

这里强调了sitemap.xml文件不光是帮助收录的,更是让搜索引擎了解你的网站的。特别注意sitemap.xml文件里权重的设置。

在“确保您的内容具有相关性且实用”这一项里,写了两点平常大家不去注意的内容。如:

“通过查看热门搜索查询页来了解用户到达您网站的方式。第一个列表会显示您的网站最常出现在哪些 Google 搜索中。第二个列表则显示用户通过点击哪些 Google 搜索来进入您的网站。此信息非常有用,因为它能使您深入了解用户搜索的内容(第一个列表),以及哪些搜索内容可吸引用户点击您的网站(第二个列表)。

了解 Google 查看您网站的方式。关键字页会显示其他网站链接到您网站时所使用的关键字和短语。了解其他用户查看您网站的方式可帮助您弄清如何最有效地定位您的受众。”

接下来还写了一个让你增加流量的方法:

“优秀的图片内容可能是增加点击量的绝佳方法。我们建议您在发布图片时,仔细考虑如何尽可能为用户带来最佳体验并遵循我们的图片指南。”

上面写的只不过是个引子,里面需要学习的还很多,一步一步去读懂它,你才能真正算是一个seoer。祝大家学习愉快。