自动化|Martech 营销自动化从 AB 测试开始( 二 )


从心理上,消费者往往不知道自己要什么,但从行为上,我们能知道他们的真实选择偏好,企业也由此可以动态做出决策。通过 AB 测试,确保每个决策都为企业带来正向收益,实现复利效应,带动持续增长。
二、解释几个 AB 测试相关术语1. 流量互斥层是为了让多个实验能够并行不相互干扰,且都获得足够的流量而研发的流量分层技术。把总体流量“复制”无数遍,形成无数个流量层,让总体流量可以被无数次复用,从而提高实验效率。各层之间的流量是正交的,你可以简单理解为:在流量层选择正确的前提下,流量经过科学的分配,可以保证各实验的结果不会受到其他层实验的干扰。
2. 流量正交实验每个独立实验为一层,一份流量穿越每层实验时,都会随机打散再重组,保证每层流量数量相同。
举个例子。假设现在有 2 个实验。

  1. 实验 A(实验组标记为 A1,对照组标记为 A2)分布于实验层 1,取用该层 100% 的流量;
  2. 实验 B(实验组标记为 B1,对照组标记为 B2)分布于实验层 2,也取用该层100% 的流量。
(要注意,实验层 1和实验层 2实际上是同一批用户,实验层 2 只是复用了实验层 1 的流量)
  1. 如果把 A1 组的流量分成 2 半,一份放进 B1 组,一份放进 B2 组;
  2. 再把 A2 组的流量也分成2半,一份放进 B1 组,一份放进 B2 组。
那么两个实验对于流量的调用就会如下图所示。此时实验 A 和实验 B 之间,就形成了流量“正交”。
自动化|Martech 营销自动化从 AB 测试开始
文章插图
我们可以发现,因为 A1 组的一半流量在 B1 中,另一半流量在 B2 中,因此即使 A1 的策略会对实验 B 产生影响,那么这种影响也均匀的分布在了实验 B 的两个组之中;在这种情况下,如果 B1 组的指标上涨了,那么就可以排除 B1 是受 A1 影响才形成上涨。这就是流量正交存在的意义。
3. 互斥实验所有互斥实验使用同一流量层用户,但不共享用户,如果一个用户 / 设备命中了实验 A,就不会命中互斥的其他实验。
4. 实验指标在开始一个实验时,目的是对比对照组和实验组的某个或者某几个指标。如,分析活动页面主图的点击次数时,需要上报注册的点击事件,然后在 AB 测试中配置指标,即可看到实验中及实验后的指标对比。
5. 流量过滤对 AB 测试的目标用户增加一些限制条件,规定被实验命中的用户必须符合(或不符合)条件,比如针对某个用户分群,某些用户标签进行过滤,进而精准找到测试目标人群,这种限制条件即“流量过滤”。
6. 白名单用户在实验正式开启之前,通常需要先选择几名用户进入测试阶段,观察实验是否能够正常获取想要收集的数据,或执行流程是否符合预期。参与这一步的用户被称为“白名单用户”。
7. 置信区间置信度区间就是用来对一组实验数据的结果进行估计的区间范围。
举个例子,我们现在进行一个实验来体现活动落地页中的图案改变对用户购买率的影响,其中采用了新策略 B 的实验组,购买率提升均值为 5%,置信区间为[1.5%,8.5%]。
怎么理解此处的置信区间呢?由于在 AB 实验中我们采取小流量抽样的方式,样本不能完全代表总体,那么实际上策略 B 如果在总体流量中生效,不见得会获得 5% 的增长。
如果我们设策略 B 在总体流量中推行所导致的真实增长率为 μ,那么在这个案例中,μ 的真实取值会在 [1.5%,8.5%] 之间。
值得注意的是,μ 并不是 100% 概率落在这一区间里,在计算置信区间的过程中,我们会先取一个置信度,计算这一置信度下的置信区间是多少,AB 实验中我们通常计算 95% 置信度下的置信区间。