网站分析—不能度量就无法改进

2010-11-02
  • 1797
  • 0

网站运营中,与您跨专业的老板或者客户沟通时,难免会用到专用名词,甚至他们只关心结果。那么,你在为此烦恼的时候,也许网站分析可以帮助你。网站分析更能获得海量信息,因而也更具洞察力。然而,如果只是不加分析地单从表面上应用这些海量数据,后果也是不堪设想的。

网站分析是网站的体温计,时刻监测着网站的整体状况。作为方法学,它是一种分析和改善在线体验的研究。离开网站分析,网站运营很可能变得像无头苍蝇一般。

不能度量,就无法改进。网站分析在衡量工作绩效与工作改进上提供了客观依据。我们从访客的角度,来了解正在运营的网站,哪些该做,哪些可行,就算做出了错误的判断,网站分析也提供了迅速发现错误的反馈机制。

通过网站分析获取一些基本信息,从而了解网站的流量和访客。包括以下几点

网站的日访客数量

访问最多的内容

网站的变化率(注册量、下载量、销售量)

访客信息(地理位置、浏览器语言、停留时间)

平均页面访问深度

您通过以上这些指标为起点,可以拓展自身网络分析的知识。

网站分析方法

页面标签(客户端)技术是一种从访客代理浏览器端收集数据的技术,在网站中的每个页面放置JavaScript代码进行收集的。

优点:

  1. 收集客户端数据;
  2. 实时收集和处理客户端数据;
  3. 追踪客户端事件(js、flash、Web2.0);
  4. 不受代理和服务器端缓存影响,提供精准的会话追踪;
  5. 自动升级,数据存放在云端。

缺点:

  1. 会手防火墙阻止;
  2. 不能追踪带宽或下载完成;
  3. 不能追踪搜索引擎蜘蛛。

日志文件(服务器端)技术独立于访客代理浏览器,在Web服务器上收集数据,这是一种基于服务器端的数据收集技术。原理是:采集所有的发送到服务器端的请求,包括页面文件、图像、其它文件下载等。

优点:

  1. 可以处理历史数据;
  2. 不受防火墙阻隔;
  3. 可以追踪带宽或者下载完成;
  4. 可以追踪蜘蛛;
  5. 可以追踪移动用户。

缺点:

  1. 受代理和服务器端缓存影响;
  2. 不能追踪事件(比如单击、鼠标滑过等);
  3. 手动升级;蜘蛛会增加浏览数据。

由此可以看出他们获得元数据的来源不同,各有特点。如何选择,这完全取决于你的需求。如果两种方法结合在一起使用,往往能获得取长补短的效果。

影响数据准确性的因素

  • 一个IP地址对应多个用户(DHCP)

服务器端只能通过来自同一个IP来追踪一个访客。但这个缺点可以通过Cookies克服。

  • 浏览器页面缓存

客户端缓存是浏览器开发商为了节省带宽、提高浏览速度将之前浏览的网页存储在硬盘中。在这种情况下,浏览同一个网页时,是直接在客户端读取的。因此不会被记录在服务器端日志里。基本上服务器端缓存应用在任何的网络加速技术中,服务器将网页缓存下来,在下次访问的时候直接提供缓存。这意味着,后续的所有请求都是来自缓存而不是网站本身。这会造成一些数据没有被收集在内。

  • 蜘蛛抓取增加了统计数据

您的网站除了人类访问之外,还有搜索引擎蜘蛛抓取。这些蜘蛛都会被服务器端日志文件记录下来。这里需要注意的是,区别蜘蛛和人类并不容易,并且蜘蛛的抓取也会占访客相当大的一部分比例。这样看的话,日志文件技术经常会高估用户数量。

为大家介绍多款优秀的开源或者免费的网站分析系统

标签分析工具

Google Analytics

网址:http://www.google.com/intl/zh-CN_ALL/analytics/

描述:提供了一种托管的网页标签服务。免费,数据交叉分析,自定义报告、转化分析、分析可定制化等。详情参看Google分析师帮助中心

Piwik

网址:http://piwik.org/demo/

描述:开源授权协议GPLv3。Piwik可以给你详细的统计信息,比如网页 浏览人数, 访问最多的页面, 搜索引擎关键词等等,并且采用了大量的AJAX/Flash技术,使得在操作上更加便易。此外,它还采用了插件扩展及开放API架构,可以让开发人员根据自已的实际需求创建更多的功能。

演示地址:http://dejkam.com/twatch/

tracewatch

网址:http://www.tracewatch.com/

描述:开源的Web流量分析程序,实时分析,可以提供深度分析报告。

演示地址:http://dejkam.com/twatch/

日志分析工具

AWStats

网址:http://www.oschina.net/news/5406/awstats-6.95-released

描述:开源授权协议GPL。AWStats 是一个免费的强大而有个性的工具,带来先进的网络,流量,FTP或邮件服务器统计图. 本日志分析器作为CGI或从命令行在数个图形网页中显示你日志中包含的所有可能信息. 它利用一部分档案资料就能经常很快地处理大量日志档案, 它能分析日志文件来自从各大服务器工具 ,如 Apache日志档案(NCSA combined/XLF/ELF log format or common/CLF log format), WebStar,IIS (W3C的日志格式)及许多其他网站,Proxy(代理服务器)、Wap、流量服务器、邮件服务器和一些FTP服务器。

演示地址:http://dejkam.com/twatch/