随着消费者行为的多样化和市场环境的复杂化,如何准确衡量和分析广告投放的效果,已成为企业决策的关键。然而,在触脉咨询近期推出的《Google Analytics 4衡量与应用质量成熟度白皮书》中(点击领取),我们发现在有不少出海企业在GA4的使用过程中,归因逻辑问题以87%的最高比例,成为影响数据准确性和广告投放策略制定的核心难题。
归因是指通过分析和分配用户在完成转化前与各个营销渠道和广告互动的贡献度,从而确定各个渠道对最终转化的影响。归因模型可以是一条规则、 一组规则或一套以数据为依据的算法,其作用在于确定如何将转化功劳分配给转化路径中的各个接触点。
简单来说,归因模型可以帮助企业回答“哪个广告渠道或活动在多大程度上促成了用户的转化”这一问题。
在当下的数字环境中,用户通常不会在第一次接触广告时就立即转化。相反,他们可能会经历多次接触,如看到展示广告、点击社交媒体链接、通过搜索引擎找到网站等。在整个转化过程中,用户访问的每一个渠道,都必然有它的贡献,我们并不能简单粗暴的把转化直接归功于离转化最近的那个渠道,况且在多个广告平台中,离转化最近的那个渠道并不相同。
正是因为现在大家都采用多渠道、多设备、多平台的营销方式,企业在使用Google Analytics 4(GA4)和Google Ads(Ads)以及其他广告平台如Meta(Facebook)时,几乎都会遇到以下几个关键问题:
- 为什么Google Ads和GA4之间或者和其他广告平台的转化数据不一致?
- 为什么广告账户的总转化数据会超出整体转化数?
- 如何确定衡量KPI达成情况的标准?
- 如何为特定渠道选择合适的搭配策略?
基于以上这些问题,我们以最终转化为起点,把归因的问题或者排查方向归类成四个主要的方向,今天主要和大家讨论的是第一个排查方向,转化数据的差异是怎么造成的。
1、如何采集的转化
当我们的网站或者转化按钮上有多个工具或渠道的代码时,每个工具或者渠道其实都有自己识别和归因转化的逻辑。所以当我们发现多个工具中对于转化数据的记录有差异时,我们要做的第一件事情就是从转化的定义上来开始排查的,比如这个转化是怎么采集到的数据?触发机制一致吗?计数逻辑是一样的吗?数据收集后会做排重吗?
确认数据采集工具
以GA4和Ads为例,我们首先要确认的就是转化数据是通过什么代码识别出来的:是依据GA4的转化代码,还是Ads的转化代码?
- 如果我们平时在Ads里边账户看的conversion目标用的是GA4同步过来的,那我们要去看GA4代码的触发机制
- 如果是Ads同步过来的,我们要去确认Ads代码的触发机制
确认代码采集方式
代码采集方式通常分为前端采集和后端采集两种。
前端采集是指代码部署网页上,通过网页上的一些加载触发机制实现。后端采集基本上指的是说您的后台服务器收到转化之后,然后再通过发请求的方式发给指定的GA4账户。
相较于前端采集,后端采集其实会比较准一些。因为当我们采用前端采集时,代码是部署在网页上的,这种方式可能受制于一些前端的现实条件,比如说网页加载的比较慢,这就会出现用户其实已经打开你的网页了,但是因为加载速度慢,用户在GA4代码或者Ads代码触发之前就已经到了下一个页面了,那当前页面的行为就会采集不到。
如果您的GA4代码和Ads代码都使用的前端采集的方式,但是由于代码触发有先后顺序,也会出现代码采集到的数据有差异。
除此之外,在电商网站中,对于下单后退单或者修改订单这类信息,可能在前端是采集不到的,所以在技术资源允许的情况下,建议大家需要从后端把和转化相关的核心数据发给GA4,这种做法可以在一定程度上避免GA4采集的转化总数和后台的差异。
确认数据触发机制
如果您的代码均采用的是前端采集的方式,此时就要确认代码的触发机制是否相同。
例如电商网站的支付成功按钮,可能在GA4中是指真实支付成功时触发一个单独的事件,而Ads中的转化或者支付成功,是指用户打开了“感谢页面”。
如果是这样的话,那GA4中记录的就是有多少次下单成功,而Ads中记录的是有多少次抵达了“感谢页面”,这必然就会导致数据口径上的差异。
所以如果都是用前端采集的方式,我们需要做的事情就是尽量保证触发时机是相同的;如果存在前端和后端同时采集且后端数据相对准确的话,就建议以后端的数据为准。
其它原因
另外可能影响到采集的还有几个因素,比如用户隐私授权差异和订单排重差异。
1、用户隐私授权差异
比如触脉在今年上半年一直在讲的Google Consent Mode(了解什么是Consent Mode)。当用户选择了拒绝网站收集自己的个人信息,那此时GA4会发送带Consent Mode参数的代码,但Ads中有可能没有设置参数,此时发送的是未带参数的代码,那必然就会产生数据差异。
2、订单排重差异
不管在部署GA4代码还是Ads代码,在部署电商的转化代码时,都会建议大家随代码采集订单号。因为收集订单号之后,我们在目标设置的时候就可以基于订单号做排重。
回到我们前面举的例子,可能在GA4中是指真实支付成功时触发一个单独的事件,而Google Ads中的转化或者支付成功,是指用户打开了“感谢页面”,那此时用感谢页面的抵达次数和排重后的订单号的数量做比较,产生数据差异就是必然的了。
总结下来,当我们发现GA4和Ads数据出现差异时,明确差异形成的原因是第一要务,排查方向可以参考:
- 确认转化数据以哪个数据采集为准
- 两个采集工具在代码采集方式上是否一致
- 同端采集时,触发机制是否一致
- 是否存在用户隐私授权和订单排查这种常见问题导致的差异问题
一些减少数据差异的建议
在触脉咨询的实际操作和实践过程中,总结出几条建议分享给大家
1、共享GA4“关键事件”给Google Ads
在实际操作过程中,建议大家尽量精简数据识别的口径,不要在网站上添加多套代码。
在针对同时使用GA4和Google Ads的情况,可以在条件允许的情况下将GA4作为主要数据采集和衡量的口径,把GA4的数据共享给Ads。
这样就可以避免可能我们的网站上因为分别有Ads的pixel和GA4的purchase,在查看转化数据的时候需要先对齐两个工具的代码采集方式、触发机制等原因造成的数据差异这些问题。直接用一套GA4的代码就可以实现拉齐两个工具的转化数据,避免数据差异的问题。
如何操作
当我们把GA4和Ads集成后,如下图所示,可以把在投放过程中比较关键的转化事件标记为“关键事件”,标记后,Ads中就会收到这个转化事件。在实际投放过程中,我们就可以考虑是否需要把这个关键事件定义为Ads的目标去投放。(详细了解关键事件:https://support.google.com/analytics/answer/13965727)
设置路径:GA4→管理→媒体资源设置→数据显示→事件→将事件标记为关键事件
如何查看
进行以上操作后,此时因为两个工具实际上就会统一使用GA4的数据口径收集和展示数据报告,所以在归因、转化收集以及数据共享机制上都可以有效减少数据差异情况的出现。
数据报告查看路径:GA4→广告报告→规划→Google Ads→选择关键事件
关键事件的限制
- 您需要拥有媒体资源的管理员或者编辑者权限,才能将事件标记为关键事件。
- 对于标准版媒体资源,最多可以将 30 个事件标记为关键事件;对于GA4 360 版媒体资源,最多可以将 50 个事件标记为关键事件。
- 将事件标记为关键事件会从创建之时起影响报告,但不会更改历史数据。将事件标记为关键事件后,相应事件最长需要 24 小时才会显示在标准报告中。
- 如果需要停止收集关键事件数据,请在“事件”页面上取消将该事件标记为关键事件。关闭“标记为关键事件”不会影响您已经收集的数据;过往事件仍会在报告中显示为关键事件。
2、渠道识别
是“全”渠道识别吗?
对于GA4这类监测工具,可以说是传统意义上的全渠道识别。它不会刻意屏蔽或不识别某一个渠道的数据。前提是当我们通过正确配置了代码或者流量识别标记的前提下,比如网页端的UTM标记,APP端的代码Universal link或AppLink等。
对于广告投放平台来说,更多的是在于自有渠道的识别。
以下图为例,一个用户的转化路径上可能包括至少三个渠道,当流量标记正确的情况下,GA4可以识别到这个用户在转化前曾通过三个渠道来过网站。
而对于Google Ads来说,它只能识别到7月1日点击过Ads广告,对于Meta(FB)来说,它只能识别到的是6月1日的一次点击。
同时对于能归因到多长时间内的转化,也是由各广告账户中的回溯期决定的。比如我们在Meta(FB)中设置的回溯期是14天,那么上图中6月1日的这个点击是归因不到的,自然也不会出现在报告中。如果回溯期设置的是90天,对于这个转化来说,Meta(FB)中就会记录一次转化数据。
所以在GA4、Ads和Meta(FB)中,我们看到的转化数据差异也可能是渠道识别以及账户中的回溯期设置造成的。
这也就解释了我们最开始提到的另一个问题,“为什么广告账户的总转化数据会超出整体转化数?”,原因就是一个转化在不同的广告账户中会被独立记录为转化数据。
广告账户只能通过自有渠道的标识识别转化,所以同一个转化数据,在不同的渠道中就会被分别记录。如果您需要一个更完整或更统一的记录转化的口径,就需要一套可以做全渠道识别的类似GA4这样的工具。
渠道识别原理(GA4网页端)
我们以网页端的流量识别顺序为例:
优先级1:UTM标记或广告流量标记
在GA4网页端,最重要的事情就是打UTM标记。
如上图所示,GA4整体流量识别的第一层是当用户抵达您的网站时,判断用户进站的着陆页链接上有没有人工进行标记的UTM参数或者GCLID这类的广告标识。如果有,GA4就会以这个标识中携带的信息为准。所以就要求大家在分发广告渠道配置着陆页的时候都一定要加上UTM标记。
除了标记广告平台外,一些能够带来流量的免费渠道,比如二维码、PDF都可以添加UTM标记,这样才能把这些渠道的贡献归因到您投放的广告或者宣传上。
优先级2:引荐信息:搜索引擎、视频网站、购物网站、设计网站
对于GA4来说,如果没有识别到UTM标记或者GCLID之类的广告识别标识的话,那它就会去查找先前的网页路径。
基于识别到的一些信息,GA4会做例如搜索引擎、视频网站或者购物网站的一些分类。但是对于GA4来说,因为没有流量标记,所以GA4会认为这是第三方带进来的自然流量。比如搜索就会是自然搜索视频。
优先级3:引荐信息:其它对于不能归类的网站,GA4会统一归类成引荐流量。
优先级4:直接流量
如果既没有流量标记,也没有第三方网站的引荐信息,这时GA4就会识别为直接流量。
总的来说,GA4做的是“全”渠道识别,而广告平台做的是自有渠道/平台的流量识别,在归因的逻辑和原理上有本质的区别,所以必然会有数据差异。
3、归因模型
不同平台间归因回溯期和归因模型的配置的差异也必然会产生数据的差异。
回溯期
回溯期的定义的是一段时间范围,在这段时间内,如果用户的行为(如点击或查看广告)与最终的转化行为(如购买或注册)相关联,这个行为就可以被认为是有效的并被计入广告分析中。
简单来说,回溯期就是定义在转化发生前多长时间内的用户互动(如点击或查看)可以被认为对转化有贡献,进而在这些互动中进行流量归因的分配。比如我们在广告平台设置了30天的点击回溯期,那么当用户在点击广告后的30天内完成购买,这次购买就可以被归因到那次点击。
如果超过了30天,即使用户最终购买了产品,那次点击也不会被计入广告效果中。所以我们当发现数据差异的时候,还要分别在Google Ads和GA4中检查回溯期的配置时间,假设两个平台一个设置的是7天,一个设置的是30天,回溯期不同,那产生数据差异也是必然的。
归因模型选择
除了回溯期,还要检查进行数据对比的两个平台的归因模型分别选的是什么?例如,我们在Ads账户中选择了推荐的“以数据为依据的归因”模型,在GA4中为了看数据方便选了“末次归因”,由于归因模型的差别,数据一定也是会有差异的。
归因模型的选择和回溯期的设置,会影响工具在回溯的时候能够涵盖的渠道范围,那必然分给每个渠道配额就不太一样。
该选择哪个归因模型
传统意义上的归因模型有末次点击、首次点击、线性归因、根据位置以及时间衰减五大类归因模型,但这几类归因模型都有它本身的局限性,我们在实际的业务场景中很难简单粗暴的选择其中一种作为全渠道全路径的归因依据,所以在谷歌的整个系统里边,会更建议大家选择以数据驱动的归因。
以数据为依据的归因模型会根据在路径中增加每个广告互动后,估算的转化概率带来的变化来分配转化功劳。以数据为依据的归因算法在计算功劳时还会将多种相关因素考虑在内,包括广告互动与转化之间相隔的时间、广告的格式类型以及其他查询信号。
假设在一个传统的转化路径中有搜索渠道和EDM渠道,如果此时在中间插入了一个展示广告的渠道,那整个的转化路径就变了。转化路径改变后,转化的概率是会上升还是下降呢?会上升多少?下降多少?新增的展示广告这个渠道在新渠道组合的中间位置时贡献度是多少?这些问题在我们做归因分析时就比较困难,此时对于这类复杂的问题,我们就可以直接交给模型处理。
在日常操作数据查看和分析的过程中,建议大家在GA4中和Ads中都使用以数据为驱动的归因模型,保持账户设置的一致,这样我们才能最大限度的减少因为归因模型选择不一致导致的数据差异的问题。
但是,不管在GA4中还是Ads中,对于不同的分析需求和场景,都有特定的归因报告可以帮大家看到一些相关的数据,这其实也是一个比较大的话题,在我们这篇文章中就先不展开了。
4、用户识别
除了归因模型本身以外,还有一个会造成数据差异的影响因素就是用户识别。用户识别中分两层,分别是会话和用户。
会话(访问)
会话(访问)是GA4中特有的一个概念,在广告账户大多都没有访问或者会话,或者说是“访次”的概念,大都是基于用户来识别,所以基于会话/访问的归因,都是“对不上”的。
在GA4中,会话(访问)指的是一段连续时间的互动,从用户进到网站开始,这个访问就开始了。如果用户有连续30分钟不和网站或者APP做任何的交互(即使网页或者APP还在打开状态),静默了30分钟,此时GA4会认为一个访问结束。
所以用GA4的数据和广告平台的数据在对比时,实际是用“访次”和“用户”来对比,大概率是会出现数据差异。举个例子。以下图这一个用户的转化路径为例,
在GA4中查看“带来首次互动来源”的这张报告时,带来会话的是Facebook,其中:
- 用户数:1
- 会话(访问)数:2。此处虽然用户通过3个渠道进入网站,但是在后面入站的时候访问时长是6分钟,还在一次会话内
- 转化数:1,归因给Google Ads
如果查看的是“带来会话的来源”,看的就是这次会话是谁带来的,那对应的2次会话:
- 第一次会话(6月1日),Facebook:用户数是1,会话数也是1
- 第二次会话(7月1日),Google Ads:用户数是1,会话数是1(访问在30分钟内),转化数是1
- 所以如果当我们在GA4中查看的是有访问概念的报告,而在Ads中查看的是转化报告的话,也一定会出现数据差异。
用户识别
一方数据共享
第二个有可能产生数据差异的原因,就是用户识别的方式不同。这里主要说的是您是否把一方的数据共享给GA4或者Google Ads。
对于GA4或者Google Ads来说,都是有比较进阶的用户识别模式。当您把一方数据的标识提供给GA4或者Google Ads之后,那工具就不会再看基于Cookie的这些三方数据标识。
Cookie是跟着浏览器走的,比如说用户可能在电脑端安装了四个浏览器,同时访问一个网站的话,如果不去识别一方ID,不考虑登录的情况下,那其实在默认情况下识别的是4个不相关的人,因为这个Cookie ID是跟着浏览器走的,浏览器是独立存在的。
那如果说在这个情况下我们有一方数据的加持,也就是说这个用户虽然登录了这四个浏览器,但登录时用的是同一个账号登录的。当您把这个信息共享给GA4或者Google Ads,那GA4或者Google Ads就会优先使用您共享过来的这个ID来作为用户识别的标识,这个就是一方数据共享的价值了,这样就能很好的识别这实际是同一个人而不是四个人。
增强型转化
GA4和Google Ads还有另外一个功能叫做增强型转化。实现方式是当用户转化的时候,您共享一个加密的用户邮箱或者电话给谷歌,谷歌就可以在底层数据中去匹配谷歌账户,判断这些行为是否都属于同一个用户。
如果您的GA4代码部署的比较全面,有User ID,有增强型转化衡量,但是Ads中只是普通的监测代码,就会出现数据识别上的差异。这种情况下,对于GA4来说,它可以更准确的把用户的这些行为都归因为一个人,归因结果更准确。
反之如果您在Ads中开启了增强型衡量且部署了相应的代码,并把一方数据共享给谷歌,那么在做跨端分析时就会更精准一些。比如借助增强型衡量我们可以识别到一个用户的完整路径其实是先在APP点了两次广告,又在网页端点了一次广告后最终形成转化。
总结一下
代码端:
- 转化衡量技术条件允许:推荐后端;交易成功,注册成功这些信息在实际后台收到数据之后,再通过后台的服务器发给GA4或者Google Ads。让工具数据和后台数据统一数据口径,避免因为前台/后台产生数据差异
- 网页端选GA4还是Ads作为转化衡量方式:推荐GA4;通过将GA4的关键事件共享给Google Ads,使用统一的数据衡量方式,避免因为两套不同的跟踪代码造成的数据差异
- APP端推荐转化方式:推荐Firebase;
账户配置:
- GA4用户识别选择混合模式;尽量用一方的ID来识别用户,而不是单纯的靠三方ID识别。这样大家去做归因也好,得到一些分析结论也好,才是更符合实际业务需求的。
- Google Ads关联GA4选择“启用自动标记功能”;当GA4和Ads关联后,尽量用GCLID,而不是用UTM标记,避免手动打标错误可能带来的数据影响。
归因模型:
- Google Ads/GA4归因模型均选基于数据驱动的归因,注意回溯期尽量配置一致;
用户识别:
- GA4部署user_id;如果能把一方数据共享给谷歌就尽量共享,这样才能有更准确的标识来识别用户。
- GA4和Ads部署Consent Mode且建议Advanced模式;
- 部署Enhanced Conversion;
- Consent Mode内容详见:活动回顾 | 隐私授权管理弹窗及谷歌Consent Mode专题分享(第二场)
如果您在使用GA4和广告平台(Ads、Meta等)遇到订单数据差异的问题,可联系触脉咨询为您做数据差异原因的排查以及通过技术手段帮您有效缩小订单数据差异。
触脉咨询(TrueMetrics)是谷歌官方认证的Google Analytics授权销售合作伙伴及Google Marketing Platform服务认证合作伙伴,拥有丰富的GA工具使用及数据服务经验。
若您的团队在GA4工具使用、UA数据备份以及自有数据使用中遇到任何困难,都可以联系我们获取服务支持。我们的咨询团队可以为您提供全面的数据咨询服务以及使用培训等。
如有需要,我们的团队也将与您一起量身定制解决方案以满足您的特定业务需求,帮助您更好地掌握数据分析技能,进而提升业务增长。
如需业务联系或服务采购,您通过以下任一方式与我们联系:
- 电话:400-080-5098
- 邮箱:vip@truemetrics.cn
- 微信公众号:触脉咨询
- 微信客服:truemetrics_service,或直接扫描下方二维码添加客服