阅读(2576) (0)

统计 - 柯尔莫哥洛夫斯米尔诺夫测试

2016-12-28 10:08:18 更新

该测试用于必须在观察样品分布和理论分布之间进行比较的情况。

K-S一个样品测试

该试验用作适合性的试验,并且当样品的尺寸小时是理想的。 它将变量的累积分布函数与指定分布进行比较。 零假设假定观测值和理论分布之间没有差异,并且测试统计量的值“D"计算为:

$ D = Maximum | F_o(X)-F_r(X)| $

其中 -

  • $ {F_o(X)} $ =观察到的n个观测值的随机样本的累积频率分布。

  • 和$ {F_o(X)= \\ frac {k} {n}} $ =(观测值数≤X)/(观测总数)。

  • $ {F_r(X)} $ =理论频率分布。

$ {D} $的临界值从一个样本测试的K-S表值中找到。

接受标准:如果计算值小于临界值,则接受零假设。

拒绝标准:如果计算值大于表值拒绝零假设。

例子

问题陈述:

在一所学院的各种流动的研究中,60名学生,从每个流中抽取相等数量的学生,我们被采访,他们打算加入大学戏剧俱乐部。

B.Sc. B.A. B.Com 嘛。 M.Com
在每个类中 5 9 11 16 19

预计每班12名学生将加入戏剧俱乐部。 使用K-S测试来确定学生班级之间在加入戏剧俱乐部的意向上是否存在差异。

解决方案:

$ {H_o} $:不同流派的学生对于他们加入戏剧俱乐部的意图没有区别。

我们开发观测和理论分布的累积频率。

有意加入的学生人数 $ {F_O(X)} $ $ {F_T(X)} $ $ {| F_O(X)-F_T(X)|} $
观察
(O)
理论
(T)
B.Sc. 5 12 5/60 12/60 7/60
B.A. 9 12 14/60 24/60 10/60
B.COM。 11 12 25/60 36/60 11/60
嘛。 16 12 41/60 48/60 7/60
M.COM。 19 12 60/40 60/60 60/60
n=60        

测试统计$ {| D |} $计算如下:

$D = Maximum {|F_0 (X)-F_T (X)|} \\[7pt] \, = \frac{11}{60} \\[7pt] \, = 0.183$

D在5%显着性水平的表值由下式给出

${D_0.05 = \frac{1.36}{\sqrt{n}}} \\[7pt] \, = \frac{1.36}{\sqrt{60}} \\[7pt] \, = 0.175$

由于计算值大于临界值,因此我们拒绝零假设,并得出结论,不同流派的学生在他们加入俱乐部的意图上存在差异。

K-S两个样品测试

当代替一个时,有两个独立的样本,则K-S两个样本测试可以用于测试两个累积分布之间的一致性。 零假设表明两个分布之间没有差异。 以与K-S单样本测试相同的方式计算D-统计量。

$ {D = Maximum | {F_n} _1(X) - {F_n} _2(X)|} $

其中 -

  • $ {n_1} $ =第一个样本的观察结果。

  • $ {n_2} $ =第二个样本的观察结果。

已经看到,当累积分布显示大的最大偏差时,其指示两个样本分布之间的差异。

D的临界值对于$ {n_1 = n_2} $且≤40的样本,使用两个样本的K-S表。 当$ {n_1} $和/或$ {n_2} $> 40,则应使用两个样品测试的大样品的K-S表。 如果计算的值小于表值,则接受零假设,反之亦然。

因此,当目标人群的特征未知或没有对其进行假设时,使用任何这些非参数测试有助于研究人员测试他的结果的重要性。