Skip to content

单维度分析:从单维度检验业务假设

更新: 7/18/2025 字数: 0 字 时长: 0 分钟

1.商业分析中“假设检验”的含义

单维度分析的应用场景很常见,比如业务部门抱怨:“门店业绩不好,都怪下雨了。”这就是一个典型的单维度假设检验问题。分析维度只有一个:下雨。要检验的结论是下雨对业绩的影响大小。这种看似简单的分析,是有数据论证、科学决策的基础支持的。

如果不把这些单维度假设检验清楚,则很可能让业务部门陷入无意义的争吵之中。如:

  • “谁说下雨天业绩不好? 我们这下雨了业绩照样好!”
  • “下雨了业绩不好,你要我求雨停吗?”
  • “如果一下雨业绩就不好,今天飘了一滴雨,那么业绩肯定被这一滴雨打败了!”

总之,想分析本质原因就要停止凭经验、感觉、习惯下判断,而是要用数据验证判断。

很多有统计学基础的数据分析师,会把商业分析中假设检验与统计假设检验混淆。统计学上讲的假设检验,是指用来判断样本与样本、样本与总体的差异的,主要用于区分其差异性是由抽样误差引起的还是本质差别造成的。而商业分析中的假设检验范围更广,它指的是检验一个商业动作与商业结果之间的关系。具体的商业动作可能有很多很多种,甚至有些是“管理者水平不高”等,因此,商业分析的假设检验,很难量化的,比如“员工缺乏积极性”需要更关注商业场景,而非统计公式。

2.进行假设检验的基础做法

商业分析师想要做假设检验,首先要做的是把每个思考维度的事实表现、数据考察、影响结果三大内容填写完整,不能仅凭口头一句没头没尾的话就开始分析。比如“下雨会影响业绩这就是口头表达,没有讲清楚到底下雨是怎样影响业绩的。”

如果要补充完整,则可以写成下面的句子。

  • 事实表现: 下雨。
  • 数据描述:当日天气预报软件显示天气为“下雨”。
  • 影响结果: 同等条件下,下雨天业绩低于非下雨天业绩。

这样,”下雨“就是一个清晰的分析维度,“下雨会影响业绩”就是一个清晰的待验证假设下面就可以代入数据进行验证了。如图所示,如果验证结果如情况1所示,下雨天的业绩低于不下雨天的业绩的30%以上,则证明假设成立,下雨天的业绩确实很差;如果验证结果如情况2所示,下雨天和不下雨天的业绩只有5%的差异,则假设不成立;如果验证结果如情况3所示,下雨天的业绩甚至比不下雨天的业绩更高,则假设也不成立。 img_14.png 以上只是一个简单的示例,在实际操作时有很多细节要考虑。

3.分析细节之一:数据描述方式

不同的数据描述方式会影响到输出结果。还是以“下雨”这件事为例,描述下雨的情形时可能有 3 种方式。

  • 用分类型变量描述,比如当日天气预报软件显示为:下雨/不下雨。
  • 用定序型变量描述,比如当日天气预报软件显示为: 小雨/中雨/大雨。
  • 用连续型变量描述,比如当日当地气象局播报的日降雨量为 10mm。

描述方式的不同,直接造成了后续分析方法、得出结论的方式、落地难度都不同。理论上如果能用连续型变量进行描述,就能用很多统计模型进行计算了,计算复杂程度可以高出很多。但实际上,连续型数据不见得能采集到,且连续型数据不见得真的有用。

4.分析细节之二:数据形态

所谓“有影响”,反映在数据上可能有不同的形态。还是以“下雨天”为例,即使下雨天真的影响业绩,也可能有3种不同的形态。横轴代表日降雨量,纵轴代表门店每日业绩,如图所示。

img_15.png

形态1:两者呈正相关/负相关的关系。其可以直接用函数表示,比如类似最简单的下雨天业绩=正常业绩-1000X当日降雨量。这样在理论上,只要输入当日降雨量,就能算出当天业绩可能是多少。这种关系在数据上有明显的趋势,呈现出如图所示的形态1部分。

形态2:两者呈突变型的关系。当影响因素突破某个关键值后,结果发生突然的变化。当日降雨量很小时,没有大的影响;当日降雨量级别达到大暴雨时,就会严重影响业绩。此时是不需要知道具体的降水数值的,只要看定序变量,比如今日是否有暴雨警告即可。这种关系在影响因素达到一定程度后突然出现,呈现出如图所示的形态2部分。

形态3:两者呈特定状态的关系。比如在降雨量特别小的时候,用户依旧会外出购物,其实没什么影响。在降雨量特别大的时候,用户会在配送平台下单或打电话请门店送货上门,所以也没什么影响,反倒是在降雨量在中等水平时,用户既懒得下单,又不想出门,这时的影响最大。这种关系在特定场景下触发,呈现出如图所示的形态3部分。

作为数学、统计学专业毕业的数据分析师,可能倾向于寻找类似形态1的结论,这样看起来更科学一些。但反过来想,即使真的是形态1,结果又怎样?下雨了让店员们拿着量杯在门口测量日降雨量吗?测出来日降雨量又能怎样?这种就是典型的看似科学,实则对业务无用的分析。

在“下雨天”这个场景里,有可能有一个分类/定序变量的结论就够了。比如看到暴雨警告,提前给用户打电话、在用户群发消息提醒用户囤货,联系老用户提供主动送货上门服务提前减少备货等。对业务方而言,能看到了就行动的数据,才是好数据。

因此,在描述问题的时候,对单一维度分析就得考虑周全,找能落地、能采集数据、能指导业务行动的描述。在此标准下,很多常见的说法会显得不堪一击。比如“用户都不满意”“员工干劲不高”.....·根本无法有效衡量,且无法证明是否改善了,说了等于白说。虽然站在公司管理的角度来看可能也会考虑这些因素,但是站在经营的角度来看是无法论证其实际效果的。

5.分析细节之三:数据代表性

到底需要对比多少天的数据才能使分析结论更客观,因为这些数据带来的结论是完全不同的。往往选取越短的时间周期,越容易选取到特殊情况:选取越长的时间周期,越容易把个性抹杀。如图所示,实体店销售有自然周期:周末业绩好,工作日差,周一最差。如果下雨天刚好是周日,非下雨天是周一,则按上述的分析方法很可能得到完全不同的答案:下雨天的业绩比非下雨天的业绩好。

img_16.png

因此,即使是一个简单的假设也得小心求证。从本质上来看,商业问题本身就是很复杂的是多种因素相互交织影响的结果,因此从单个维度来论证很难完全讲清楚。如果寻找的维度是对结果有关键影响的维度,则结果指标可能表现出较为明显的差异性;如果寻找的维度只是次要影响,甚至没有影响,就没有差异性了。

Released under the MIT License.

本站访客数 人次 本站总访问量