【数据分析求职】AB实验框架+高频考点汇总(一)


AB测试作为互联网量化策略及ROI的黄金准则

无论是秋招还是社招,都是大厂考 知识点


比如,常被问到:

▶ BI分析师在AB流程中担任怎样的角色?

▶ AB测试的优缺点是什么?

 实验不显著怎么办?


只有了解AB测试的流程及实验原理

我们才能以不变应万变


因此!篇 图片

着重介绍 AB实验框架,让你最短时间内系统了解基本点

内含 轻案例  + 面试 真题  

---------------------------正文手动分割线---------------------------

本文结构速览:
1. AB测试是啥

2. 为啥进行AB测试

3. AB实验设计步骤(含案例)

4. 实验效果评估方法

5. 经典面试题(含答案)😊


一、AB测试是什么


简单来说,AB测试就是通过将测试对象随机分成两组,然后控制其他变量一致的前提下,对其中一组进行某种行为或者功能的干预。继而计算AB效果的差异。

学术说法:AB测试是基于统计学原理, 通过合理流量分配, 高效、准确选取局部指标价值最大化方案的一系列方法论的总和。

二、为什么要进行AB测试


由于功能设计者个人思维的局限性以及全量用户的不可调研性, 导致了一个功能的预期效果可能与实际上线后的效果存在认知、实用上的差异。

一般来讲, AB测试通常有可以划分为两大目的:

  • 判断方案的优劣: 究竟是A方案好些, 还是B方案好些。
  • 计算方案带来的ROI: 最近上了一个帖子功能, 究竟给平台带来了多数DAU, 多数额外使用时长。


通俗一点来说,AB测试可以避免我们拍脑袋决策,科学量化优化方案的效果。


三、实验设计的步骤


话不多说,关于实验设计基本步骤,直接上图:




现状分析并建立假设:分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了


设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。


设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。


分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。


采集并分析数据:收集实验数据,进行有效性和效果判断:统计显著性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显著性不能达到95%甚至90%,则需要决定是否中止试验。


做出决策:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。


划重点

作为数据分析师,我们真正参与的流程主要是现状分析以及采集并分析数据。


案例分析:

某电商平台想对新用户进行发券刺激,提高新用户的转化率及留存。并验证该发券行为的增量及ROI。下面结合AB设计步骤阐述每一步的具体工作内容。


Step1:我们需要先对平台新用户的现状进行分析,比如每日新客的用户量级、留存情况。并结合历史数据,评估不同面额对用户转化率的提升等。

Stpe2:确认好发券样式及触发条件(比如用户打开APP立即触发发券弹窗)。Step3:UI及交互进行设计并开发上线。Step4 :确认好分流机制,比如hash分流(后续将展开说明一下分流的机制。)
Step5:积累实验数据,并分析实验效果。
Step6:评估实验效果,确认是否优化或者发布上线。

四、实验效果评估


假设检验在之前的文章中已经详细讲解了假设检验的原理,再次就不进行阐述。

最常用的假设检验方法有Z检验(正态分布检验)、T检验、卡方检验、F检验等。


因为AB测试是检验来自两个组样本平均数的差异性,从而判断它们各自代表的总体的差异是否著,因此使用的是两个总体均值之差的检验。

当两组的样本量n,m充分大时,根据中心极限定理,我们可以通过 Z检验 进行实验效果的评估。


五、经典面试题

面试题1AB测试的优缺点是什么?

▼ 优点:
  • 科学量化策略的效果,避免拍脑袋决定造成的损失。

  • 对比不同的策略,找到核心问题,探索业务增长点。

  • 数据驱动,形成优化闭环。

  • 通过AB测试,为创新项目提供数据支持和保障。

▼ 缺点:

  • 数据采集积累,降低了策略的迭代效率。

  • 不同策略的维护和开发,增加了开发工作量。


面试题2实验效果不显著怎么办?

实验效果不显著的原因可以分成两类:
  • 第一类:线上策略不佳,无明显差异。

  • 第二类:实验的灵敏度不够高。


针对第二类问题,我们可以通过以下方法进行优化

  • 增加样本量:根据显著性检验的原理,只要实验组和对照组差值及样本方差不变的情况下,样本量足够大,我们总是可以得到显著性的结果。
  • 减少样本均值的方差:减少样本均值方差的方法有减少离群值的影响,缩减方差(CUPED)的方法。

  • 更换指标:更换一个方差更小的指标,比如某购物平台,实验指标一开始是用户购买的平均金额,我们可以更换为用户是否购买。对同一批样本,是否购买属于0-1分布,样本的均值方差自然比用户购买的平均金额小很多。


以上就是AB实验的框架系统介绍。


后续针对AB实验,结合实际问题开启系列文章:

比如效果分析基础步骤是啥?有哪些坑?
效果不显著该如何应对?
CUPED是什么?....

如果有用,记得一键三连,支持 原创经验分享!~🤓

希望可以帮到正在找工作的你,加油~


#高频知识点汇总##数据分析师##春招##实习#
全部评论
赞👍
1 回复 分享
发布于 2021-12-29 09:59
AB test就是假设检验吗,是不是AB test用的方法是假设检验?
1 回复 分享
发布于 2022-07-21 12:41
步骤清晰,马上实验一下,不懂的可以问问老哥不😘
1 回复 分享
发布于 2021-12-29 09:36
up,我有个疑问,abtest只能做类似ui设计这种测试么,我之前看公司ab页面的选择是app和h5,我以为是丢数据进去做实验组和对照组就可以
点赞 回复 分享
发布于 2022-08-21 10:10 上海
有订单表(tb_order),该表有3个字段,订单号(order_id),订单金额(amount),支付时间(order_time),请编写sql取出每笔订单的前一笔订单号(订单号非自增)。 提供一种思路:使用开窗函数对时间排序,然后做自关联 select b.order_id ,a.order_id      from     (select order_id,order_time,row_number() over(order by order_time) rn         from tb_order ) a     left outer join     (select order_id,order_time,row_number() over(order by order_time) rn         from tb_order ) b     on a.rn = b.rn + 1 老哥求这个怎么写
点赞 回复 分享
发布于 2022-01-10 18:50
🎉恭喜牛友成功参与 【创作激励计划】高频知识点汇总专场,并通过审核! 前50位用户可直接获得牛可乐抱枕1个哦~ ------------------- 创作激励计划5大主题专场等你来写,最高可领取500元京东卡和500元实物奖品! 👉快来参加吧:https://www.nowcoder.com/discuss/804743
点赞 回复 分享
发布于 2021-12-29 10:52

相关推荐

1.第一种人呢以92和计算机强双非(四邮四电)偏多,这种人呢,喜欢把自己的学校称为“大专”,极力在交流时贬低自己的学历,放大自己学历的缺点(如牛客经典贴,双非秋招oc美团,点开发现是985硕士🤣🤣🤣),说的自己学校好像比双非认可度还低,好像这样才能突出自己多么牛逼,克服了多少困难,技术有多强,但你要是说想双非考研去他们学校,他们又要狠狠打压你,告诉考他们学校多难了🤣🤣🤣。从92到大厂明明是证明自己一直优秀的一条路,你不走,你非要故意恶心自己也恶心别人,何必呢?2.第二种人以像我一样的双非同学偏多,大多学历比较低,可能又带有中大厂实习。他们会在你交流的时候,十分刻意的强调自己是弱双非或者学院本,再不经意透露自己在某某大厂实习。等着群聊里响起“原来是xx(大厂名字)✌🏻啊,给你跪了😭”,他们便心满意足了。不用反驳,因为我之前也是这种人,现在也有这种倾向😆😆😆。3.第三种人更是神人,跟这种人交流时,你会觉得对方已经被美国植入芯片控制了,张嘴闭嘴只有膜膜膜,羡慕羡慕羡慕。上到拿到大厂offer,下到喝一杯奶茶,他们都说羡慕。不知道他们的生活过得有多么悲惨,连喝杯饮料都到了羡慕的地步🤣🤣🤣。天天就是在群里面互相吹捧,互相羡慕,不知道交流起来有什么意思。4.第四种人则是第一种人的对立面,我有时候觉得是第四种人太多才会导致第一种人的出现。这种人天生带着对92的恨。仿佛学计算机没有拿到offer全是92导致的。他们是小说里被陷害的白莲花女主,92则是夺走他们人生的恶毒女配。在他们的眼中,他们的技术要比92好一百倍,但是所有企业都识别不了他们这匹千里马。实际自己从来没想过,在ai与辅导课程普及的当日,所谓的计算机,早已经没有了任何的技术壁垒,否则也不会有那么人转码了😂。这是那天回家路上发抖音的,讨论不少,有赞同有不赞同的,其实有时候也在想自己言论是否偏激。今天遇到朋友问我好久没更新牛客了,就搬了上去。其实很简单,加了交流群之后,发现交流的质量参差不齐,有些实在言之无物,想了想自己也会有这样的问题。自己也在建交流群,希望能避免这样的现象吧
wu970:交流群不就是一群人互相装逼和加装谦虚吗
如何排解工作中的焦虑
点赞 评论 收藏
分享
评论
53
230
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务