数据分析 参数估计与置信区间 管理资料

数据分析 参数估计与置信区间 管理资料 我们总是希望能够从一些样本数据中去探究数据总体的表现特征,在网站数据分析中也是如此,我们试图从最近几天的数据表现来推测目前网站的整体形势是怎么样的,有没有变好或

数据分析 参数估计与置信区间 管理资料 我们总是希望能够从一些样本数据中去探究数据总体的表现特征,在 网站数据分析中也是如此,我们试图从最近几天的数据表现来推测目 前网站的整体形势是怎么样的,有没有变好或者变差的信号,但当前 几天的数据无法完全代表总体,所以这里只能使用“估计”, 一般对总体参数的估计会包括两类:一种是用样本均值去估计总体均 值,对应到网站数据中的数值型指标,比如网站每天的UV,我们可以 用近一周的日均UV去估计目前网站每天唯一访客数量的大体情况;另 外一种是用样本概率去估计总体概率,对应到网站数据中的比率型指 标,比如网站的目标转化率,我们可以用近3天的转化率去预估网站 当天目标转化的水平;同时我们会计算样本的标准差来说明样本均值 或者概率的波动幅度的大小,从而估计总体数据的波动情况。 点估计还包括了使用最小二乘法对线性回归做曲线参数的拟合,以及 最大似然估计的方法计算样本集分布的概率密度函数的参数。 我们可以将样本标准差记作S,如果我们抽样获取的有n个样本,那么 总体的标准差σ就可以用样本标准差估算得到: 从这个公式中我们可以看到大数定理的作用,当样本个数n越大时, 总体指标差σ越小,样本估计值越接近总体的真实值。Excel的图表里 面也提供了添加“误差线”的功能: 根据Z统计量的计算公式: 假如在1-α的置信水平下,则总体均值μ的置信区间为: 这里样本均值和标准差都可以根据抽样的结果计算得到,所以在既定 置信水平的条件下,我们只要查Z值表(Z-Score)得到相应的Z值就

腾讯文库数据分析