Skip to content

数据测试分析:测试分析结论的正确性

更新: 7/18/2025 字数: 0 字 时长: 0 分钟

数据测试是一种解决问题的有效手段。俗话说:“是骡子是马,拉出来遛遛”。数据测试就是“遛马”的过程:通过实际效果,判断分析结论的正确性。数据测试常常应用于以下3个场景中。

  • 对新产品、新功能、新渠道的测试。
  • 对旧产品、功能、渠道做改进升级的测试
  • 发现业务方的问题后,确认问题点,寻找解决手段。

之所以称为数据测试而不是业务测试,是因为数据测试并非简单地“让业务方先做几次我们等着看数据”这么简单。数据测试有很多专业性的要求,具体包括以下几个要点。

一、测试要点

1.明确测试目标

测试目标分为“带假设和不带假设”两种。在对问题完全没有认知的情况下,可以进行“不带假设”的测试,作为最原始的数据积累,这种情况一般用于测试新产品、新功能、新渠道。在大部分情况下,人们对问题是有预定假设的,比如“因为促销力度不够,所以业绩不佳,因此要加大促销力度”。此时再做测试,就是“带假设”的测试。

如果是“带假设”的测试,则一定要提前把待验证假设列清楚,并且在条件允许的情况下尽可能排除其他因素。比如“因为促销力度不够,所以业绩不佳,因此要加大促销力度”这个假设,包含了两层含义。

  • 待验证的是增加促销力度与业绩之间的关系。
  • 促销形式、产品和业绩没有关系,仅仅是促销力度的问题。

有了这个假设,在设计测试方案的时候,就得注意只增加促销力度,避免再更换产品,或者修改促销形式。

2.确认测试投入

测试是有业务代价的。

  • 如果是实验室性质的小范围测试,就要承担准确度低、上线后可能不见效的损失。
  • 如果是直接投入业务的大范围测试,就要承担可能影响业绩、上线后业绩下降的损失。

总之,只要是测试就有风险,因此需要提前做规划。

花多少钱?

  • 用什么形式?
  • 要做多少效果?
  • 测试几轮见效果?
  • 测试几轮的损失能不能承担?

这些都得事先有一个清晰的界定才能避免纠结。

3.确认测试设计

要确认测试设计,可以包括以下几个方式。

  • 测试一种页面布局是否能提升点击率,可以同时做两个页面,看点击率的差异。
  • 测试一个产品是否受欢迎,得考虑目标人群、购买渠道,选好参与对比的新款/旧款.
  • 测试一个产品的促销活动效果,得考虑活动投放渠道、投放时间、目标人群,活动形式奖励力度、奖励兑现方式等重要因素。

测试的业务流程越长,影响其最终结果的因素就越多,需要设计的测试就越多,在事后分析的时候,需要区分的各种因素就越多。所以对于待测试的业务问题,提前准备多个版本进行对比,方便找到真正的关键影响因素。但在实际操作中,是不可能为一个活动设计几十个版本进行测试的—太耗费精力,同时又有太大的业务风险。

因此在测试前,提前做好规划,找到待测试的关键假设非常重要。不然,盲目测试不但增加成本,也会陷入各种纠缠不清的因素中无法自拔。这种设计的复杂性,也从侧面说明了测试绝不是简单地让业务部门随便做做再观察数据结果的行为。如果在业务部门行动的时候没有清晰的规划,测回来的数据本身就是乱七八糟的,无法分析。

4.确认执行顺序

既然有若干个版本要进行测试,因此需要规划测试步骤,逐一进行。一个有效的测试顺序是按先粗后细、先简后繁的步骤进行的。

  • 如果对业务完全不了解,没有假设,就需要先进行无假设的盲测,收集基础数据。
  • 如果有了假设,但对细节没有信心,就采用实验室性质的小范围测试,找到关键假设。

当假设范围缩小到屈指可数的几个假设时,可以上线进行大范围测试,确定结果。

二、测试执行阶段

某互联网教育公司听说“私域流量”的概念很火,准备通过投放公众号广告的方式来获取投资客户。但是该公司从来未在公众号渠道尝试过,现在计划在线进行测试,那么要怎么做呢?严格地说,测试需要分以下4个阶段执行。

第一阶段:设计阶段

设计阶段要解决的是战略问题。

  • 到底要测试多久?
  • 为测试可以投放多少资源?
  • 测试出什么结果才满意?

在本阶段中,我们要进行新投放渠道测试,则首先得搞清楚渠道的定位。渠道定位一般分为以下几种。

  • 主力渠道:承担50%以上的流量来源,主要投资方向。
  • 助攻渠道:承担20%以上的流量来源,次要投资方向。
  • 边缘渠道:单渠道流量不超过5%,选择性投放。
  • 零散渠道:有它没它关系不大,聊胜于无。

可以根据当期的整体渠道投放目标,然后反推需要的流量。之后根据业务上的策略:是下决心建立新渠道,还是只跟风尝试,把任务分配清楚,最后定义好本次测试新渠道的定位。有了清晰的定位,自然很容易得出“投多少钱,测试多少次”这一结论了。有了财力、人力、时间的界定,后续设计方案就简单了,如图所示。

img.png

第二阶段:准备阶段

准备阶段要解决的是战术问题,具体包括以下几个方面。

  • 到底测试哪些渠道?
  • 到底测试哪些版本?
  • 到底测试哪些产品?

在本阶段中,我们采用的是公众号广告投放的形式。这种形式看起来很简单,就是一篇公众号文章而已,可实际上包含很多要素,如图所示,至少包含以下要素。

img_1.png

  • 文章标题。
  • 创作者。
  • 投放时间。
  • 创作原因。
  • 文字内容。
  • CTA动作(Call to Action,激发用户行动的动作,如图中的“获得一对一指导”)。
  • 转化形式(转化为购买行为的形式,如图中的“点击左下方阅读原文” )。

每一个要素都有可能影响转化结果,因此要提前做好准备。

在本阶段中,由于企业完全没有经验,处于盲测状态,因此第一个版本可能需要较多的设计。比如让有经验的乙方公司提供帮助、参考同行的案例、内部市场/运营/产品人员共同创作等。特别是同行的案例学习与同行的数据采集,对于盲测阶段更重要。虽然不能得到完全准确的数据,但至少可以参考一下。

  • 同行投放了哪些账号?
  • 可观察的文章曝光量是多少?
  • 转化率是多少?
  • 同行用的是什么形式?

经过梳理,企业至少有了一个大概的方向,比“闭着眼睛”做要强。

TIP

站在用户角度来看,影响用户行为的因素是综合性的。比如公众号渠道投放,文章标题、投放时间、创作原因、文字内容、CTA动作、转化形式等都会有影响。因此需要拆分多个版本进行测试,并且早期测试版本差距不能太大,以避免回收数据完全无法对比。摸索一段时间后,可以逐步缩小测试范围。

第三阶段:测试阶段

方案准备好以后,可以进行上线测试了。在上线测试阶段,要注意不同版本的更换顺序迭代要有顺序进行,产品、价格、内容要分开。最好一次换一个,但不要3个版本同时换。次性更换太多,在后期分析的时候非常难以区分出来每个因素的影响。

在互联网推广投放中,建议的优化顺序如下。

  • 如果点击率不行、页面停留时间短、跳出率高,则优先换内容。
  • 如果点击率够,但从点击到转化之间的链路长、用户流失多,则优先缩短链路。
  • 如果转化率不行,则优先看是否还有降价空间,先降价,最后才是换产品。

主要因为产品因素实在太复杂(如图所示) 单纯对产品进行测试,又涉及产品功能外观、卖点等众多因素,太难讲清楚。而产品又对销售转化的全链路有影响,因此很难夹在各种因素中测试清楚。

img_2.png

相比之下,投放素材、落地页、转化流程这些要素影响的是用户转化链路的早期,测试起来相对容易,只要保持产品一致,做不同投放版本/落地页版本,测试用户点击情况,就能看清楚哪一个更能吸引用户,因此适宜优先解决。

价格虽然也会影响用户转化的全流程,但容易测试。因为价格的属性单一,一个产品只有个原始价位,之后可以通过优惠10%、20%、30%等方式,测试用户购买率,从而推测出用户能接受的价格范围。或者以抽奖的形式,给予同一群体用户不同面额的优惠券,从而测出什么价位更容易吸引用户购买。

第四阶段:复盘阶段

本阶段是渠道投放,且目标就是获取新的投资用户,因此考核结果指标相对简单、清晰,主要分析转化来的用户数、用户投资率、用户投资金额等指标即可。只要测试结果能达成部署阶段的目标,就算渠道合格,任务完成。如果不行,则可以根据事先制定的迭代方案进行迭代优化,进一步观察效果。

这里特别要强调: 既然是测试推广渠道,因此应先关注该渠道整体的表现,是否能达成之前的目标。对于渠道覆盖的用户数与转化率,可以构建一个评价矩阵。

  • 人数多 + 转化率高:“金牛”渠道。
  • 人数少 + 转化率高:垂直渠道。
  • 人数多 + 转化率低:大众渠道。
  • 人数少 + 转化率低:“鸡肋”渠道。

如果从整体数据上发现在测试几轮之后,渠道表现都很“鸡肋”,那么后续的决策就是放弃该渠道,不再投入。如果从整体数据上看,该渠道尚有价值(垂直渠道/大众渠道),则下步可以继续观察该渠道的成长性,再看细节优化。

这种“从大到小”的分析方法是很有意义的。很多时候,测试人员会努力优化一个整体表现很差的方案,这样只见树木不见森林的做法,对企业的成本和精力投入都是极大的浪费。因此,建议按图所示的方法,从整体到细节,一步步进行复盘。

img_3.png

整体的测试流程归纳如图所示。经过这样多轮测试,对于公众号渠道的以下几个方面的问题都能得到有效的回答。

img_4.png

  • 宏观层面的问题:在整个渠道布局中,公众号渠道能承担什么角色?
  • 中观层面的问题:公众号的成长性如何? 一个公众号的天花板在哪里? 需要多少个公众号?
  • 微观层面的问题:设计、产品、价格怎么做才能提升流程转化率?

本例中的实验设计得很复杂,主要有以下几个方面的原因。

  • 渠道流程长,要素多。从投放到转化,需要考虑太多环节。
  • 企业使用的是外部渠道(公众号详细数据企业无法获得),因此只能通过业务调整观察结果。
  • 企业追求的结果是最终收入,因此不能放在实验室里完成,必须接受实战检验。

三、互联网数据测试应用:A/B测试方法

实际上,在互联网企业中,不见得有这么复杂的业务要求。很多时候测试很简单,如一个页面上要放一个链接,到底放在页面的左边还是右边?这就是两个方案之间的简单选择。这种测试,一般都具有以下特点。

  • 流程简单,考虑要素少。
  • 使用内部渠道,数据可采集。
  • 追求的结果是点击率,容易观察。

因此,可以直接在测试系统中实现,这就是所谓的互联网A/B测试方法。当然,为了充分利用流量,真实的互联网A/B测试方法会把若干实验叠加进行,因此衍生出很多细节操作方法,比如如何分配流量,如何设计测试顺序等,在此不再赘述,有兴趣的读者可参考相关文章,

TIP

互联网的A/B测试方法,难点主要在技术层面而非业务层面。比如做了两个版本注意:页面,如何把两个版本分发到用户终端?如何为两个页面分配足够数量的用户?如何实现页面埋点采集数据?采集回来的数据如何存储等,因其过程与App开发和数据存储相关,因此技术工作很多。

同前文中强调的“要关注测试的整体结果,不要陷入细节”一样,在商业分析中的数据测试关注的核心是:到底要测试的问题是什么?这么测试完到底有什么商业价值与业务含义,因为现实的商业问题非常复杂,要测试的内容也很多,远远不止分为A、B两个分组。此时就不能指望一一测试了,而是要有复杂归因的分析能力才行。

Released under the MIT License.

本站访客数 人次 本站总访问量