如何有效排查GA的直接流量?

在日常对营销活动进行数据分析时,总会发现一些“莫名其妙”的直接流量,怎么排查与分析它们?

很多客户、网站主或者运营人员看到GA报告中的数据,就认为这些Direct流量没法解释,觉得这类流量的存在,其背后没有明显的目的或者原由。

作为一个数据分析师,经常也会遇到“直接流量”这种情况,在下文中,我总结了几个着手分析的角度分享给各位,希望能有所帮助。

但在开始之前,我们先来看下GA中的直接流量是什么?

从字面意思理解就是“直接进入网站的流量”,在GA中,一般会把没有HTTP Referrer的识别为直接流量。

什么情况下会没有HTTP Referrer呢?

  • 本身就没有HTTP Referrer

(1)从我们电脑的本地文件打开的网址,例如Word、Excel、PDF等

(2)聊天窗口打开,例如微信、QQ、钉钉等APP

(3)浏览器收藏夹、书签打开

(4)直接输入网址

  • HTTP Referrer传送失败

这种情况下就是说HTTP Referrer的信息本来是传递的,但是由于各种原因没有传输成功,例如用户在HTTPS域名的网站,跳转至HTTP的网站,Referrer就会传输失败,相反的,HTTP跳至HTTPS就没有这种问题。

知道了什么是直接流量,以及所产生的原因,我们再进账户看数据的时候,有时还是觉得数据不太对,可能会看到类似于以下截图中的数据表现:

点击此处添加图片说明文字

截图中的直接流量占整体流量的37%以上,有些账户的直接流量占比会到50%,甚至于说70%以上。

如果按照上述的原因对此进行分析,似乎也不能完全的说明问题,比如真的会有这么多的人是通过Word、聊天窗口、浏览器收藏夹这些方式来到网站么?这就是一个疑问点,假设成立的话,这些人就应该不止一次来过网站,可以算作老用户,但是当我们去看新老用户占比的时候,数据表现可能又是下面这个样子:

点击此处添加图片说明文字

回访用户才占到总量的4%都不到。

所以,完全不能说明问题。

这时候,对数据比较敏感的人可能会想到,这是不是一些虚假流量,比如广告投放的虚假流量或者是一些爬虫带来的数据,确实可能有这些方面产生的可能性。

那么,怎么有效排查和分析呢?我们接着往下看。

一、引荐排除

GA中有个功能叫做‘引荐排除列表’,目的就是为了防止会话的切分,如果排除那些会带来流量的第三方网域,引荐来源仍将触发新会话,但该引荐来源网域的来源/媒介信息在报告中会显示为“(direct/none)”。

二、不同的漫游或服务

有时我们用一台电脑或一部手机访问时,在访问过程中出现了漫游或切换服务器的情况,也会出现识别为直接流量的现象,但这种现象通常非常少见。

三、检查浏览器和操作系统版本

先看一些数据,这有利于我们后期做参考。

2020年全球数据显示,PC端Chrome浏览器的使用量占比约70%,Firefox占比约10%,Safari以及IE占比分别在5%左右;同样MO端Chrome占比在60%,Safari占比20%,Samsung、UC、Opera占比分别在5%。

如果你发现账户中‘BlackBerry’、‘IE’、‘UC’、‘not set’这种相对来说较为小众的浏览器带来的直接流量占比非常高,那就要小心了。

操作系统版本也是同样的道理,正常情况下浏览器会自动更新版本,就算是有的用户不喜欢总是更新版本,那所用的浏览器版本也不会太低。

例如目前Chrome最新的版本是10,用7和8的用户也是存在的,如果看到有大量用户使用5或者更低的版本,首先要自检一下网站对于不同版本的适配性问题,如果没有适配性的差异,那就需要从这些入站用户的细致分析着手了,例如用户行为、转化等多个方面,如果被判断为疑似的垃圾或虚假流量,就在账户的过滤器进行排除,以免影响正常数据的分析。

点击此处添加图片说明文字

四、检查屏幕分辨率

PC端用户使用的屏幕分辨率大部分在1920*1080,1366*768,1536*864等这些较为大众的分辨率尺寸,移动端一般在360*640,384*800,360*780,375*667等尺寸。

如果你看到Direct流量中某些较为小众的屏幕分辨率排名比较靠前,例如下面截图中的尺寸,那就可以使用类似浏览器版本的检查方式进行分析。

点击此处添加图片说明文字

以上的几个方面只是帮助我们寻找账户中出现直接流量的可能原因,如果你通过这些方法已经判定出来有问题,接下来就可以使用GA自带的过滤器功能,将这些流量进行排除。

有垃圾流量不可怕,可怕的是在已知存在垃圾流量的情况下,却忽略它,并在数据分析中掺杂了垃圾流量进行分析,得出错误的结论与营销指导。

发表评论

邮箱地址不会被公开。 必填项已用*标注