刚接触网站分析的同学,往往觉得网站分析十分神秘和不可思议。因为他们觉得,在网站上加上一小段JavaScript 代码,就能收集到那么多的网站访客浏览的数据,实在是神奇的很。其实,只要了解下网站分析背后的工作原理,你就会恍然大悟,觉得一切都那么理所当然。好了,这篇文章就来说说网站分析类工具基本的工作原理吧。

目前主流的网站分析工具都是基于JavaScript 和Cookie 的方式来工作的,这种方法被称为页面标记法。JavaScript 是一种广泛应用于浏览器客户端的脚本语言,可用来响应用户浏览器中的事件,读写Cookie,获取用户浏览器的相关信息……总之,功能相当强大!而Cookie 是一种存储在内存或硬盘的小型文本,用来辨识用户身份,Cookie 有名称、值、有效期、所属域名等属性,如Universal Analytics 就使用一个名称为_ga有效期为两年的第一方Cookie 来区分用户(本文中的用户和访客同义)。

网站分析工具的工作原理大致可以分为四大块,即数据收集、系统配置、数据处理及报表展现。以下就从这四个方面展开来说说网站分析工具的工作原理吧。 Read More →

Update:2016.03.09 大约从2016.02月开始,GA 报告中已经开始自动排除大部分垃圾流量。

如果一个站点使用了多个不同的网站分析工具进行统计,通常并不推荐粗暴地将两者的数据进行比较,而是应当关注同样工具统计到的网站数据的趋势。也正是如此,使得导致不同网站分析工具数据差异的另一因素常常并不容易被我们发现,这一因素就是垃圾流量。

这里的垃圾流量,指的是对网站毫无作用且会影响网站数据报表质量的流量。以下以GA 中的垃圾流量为例进行介绍。GA 中的垃圾流量通常可以分为两大类:

一类被称为ghost referral,这些流量事实上从来没有来到你的网站,也不会出现在你网站服务器的日志中,但你可以在引荐报表中发现它们,它们影响了GA 中的数据;

另一类是爬虫流量,包括搜索引擎爬虫流量和非搜索引擎爬虫流量,这些流量会影响GA 中各渠道流量占比及会话次数、跳出率、停留时间等关键指标。

那么,下面我们就一起来看下,你的GA 报表中是不是也存在着这样的垃圾流量。

一、识别方法:

Read More →