阅读(2576) 赞(0)

统计 - 柯尔莫哥洛夫斯米尔诺夫测试

2016-12-28 10:08:18 更新

该测试用于必须在观察样品分布和理论分布之间进行比较的情况。

K-S一个样品测试

该试验用作适合性的试验，并且当样品的尺寸小时是理想的。它将变量的累积分布函数与指定分布进行比较。零假设假定观测值和理论分布之间没有差异，并且测试统计量的值“D"计算为:

$ D = Maximum | F_o（X）-F_r（X）| $

其中 -

$ {D} $的临界值从一个样本测试的K-S表值中找到。

接受标准:如果计算值小于临界值，则接受零假设。

拒绝标准:如果计算值大于表值拒绝零假设。

问题陈述:

在一所学院的各种流动的研究中，60名学生，从每个流中抽取相等数量的学生，我们被采访，他们打算加入大学戏剧俱乐部。

	B.Sc.	B.A.	B.Com	嘛。	M.Com
在每个类中	5	9	11	16	19

预计每班12名学生将加入戏剧俱乐部。使用K-S测试来确定学生班级之间在加入戏剧俱乐部的意向上是否存在差异。

解决方案:

$ {H_o} $:不同流派的学生对于他们加入戏剧俱乐部的意图没有区别。

我们开发观测和理论分布的累积频率。

流	有意加入的学生人数		$ {F_O（X）} $	$ {F_T（X）} $	$ {\| F_O（X）-F_T（X）\|} $
	观察（O）	理论（T）
B.Sc.	5	12	5/60	12/60	7/60
B.A.	9	12	14/60	24/60	10/60
B.COM。	11	12	25/60	36/60	11/60
嘛。	16	12	41/60	48/60	7/60
M.COM。	19	12	60/40	60/60	60/60
总	n=60

测试统计$ {| D |} $计算如下:

$D = Maximum {|F_0 (X)-F_T (X)|} \\[7pt] \, = \frac{11}{60} \\[7pt] \, = 0.183$

D在5％显着性水平的表值由下式给出

${D_0.05 = \frac{1.36}{\sqrt{n}}} \\[7pt] \, = \frac{1.36}{\sqrt{60}} \\[7pt] \, = 0.175$

由于计算值大于临界值，因此我们拒绝零假设，并得出结论，不同流派的学生在他们加入俱乐部的意图上存在差异。

当代替一个时，有两个独立的样本，则K-S两个样本测试可以用于测试两个累积分布之间的一致性。零假设表明两个分布之间没有差异。以与K-S单样本测试相同的方式计算D-统计量。

$ {D = Maximum | {F_n} _1（X） - {F_n} _2（X）|} $

其中 -

已经看到，当累积分布显示大的最大偏差时，其指示两个样本分布之间的差异。

D的临界值对于$ {n_1 = n_2} $且≤40的样本，使用两个样本的K-S表。当$ {n_1} $和/或$ {n_2} $＆gt; 40，则应使用两个样品测试的大样品的K-S表。如果计算的值小于表值，则接受零假设，反之亦然。

因此，当目标人群的特征未知或没有对其进行假设时，使用任何这些非参数测试有助于研究人员测试他的结果的重要性。