阅读(386) (0)

统计 - 正态分布

2016-12-28 10:08:18 更新

正态分布是数据集的排列,其中大多数值集中在范围的中间,而其余值对称地朝向任一极值逐渐减小。 高度是遵循正态分布模式的一个简单例子:大多数人的平均身高

the numbers of people that are taller and shorter than average are fairly equal and a very small (and still roughly equivalent) number of people are either extremely tall or extremely short.Here's an example of a normal distribution curve: Normal Distribution

由于其扩张形状,正态分布的图形表示有时被称为钟形曲线。 精确的形状可以根据群体的分布而变化,但是峰值总是在中间并且曲线总是对称的。 在正态分布

均值 mode and median are all the same.

$ {y = \\ frac {1} {\\ sqrt {2 \\ pi}} e ^ {\\ frac { - (x - \\ mu)^ 2} {2 \\ sigma}}} $

其中 -

  • $ {\\ mu} $ = Mean

  • $ {\\ sigma} $ =标准偏差

  • $ {\\ pi \\ approx 3.14159} $

  • $ {e \\ approx 2.71828} $

例子

问题陈述:

每日旅行时间的调查结果(以分钟计):

26 33 65 28 34 55 25 44 50 36 26 37 43 62 35 38 45 32 28 34

平均值为38.8分钟,标准偏差为11.4分钟。 将值转换为z-分数并准备正态分布图。

解决方案:

我们一直使用的z-score公式:

$ {z = \\ frac {x - \\ mu} {\\ sigma}} $

其中 -

  • $ {z} $ =“z-score"(标准分数)

  • $ {x} $ =要标准化的值

  • $ {\\ mu} $ =平均值

  • $ {\\ sigma} $ =标准差

转换26:

首先减去平均值:26-38.8 = -12.8,

然后除以标准偏差:-12.8 / 11.4 = -1.12

所以26是-1.12标准偏差

以下是前三个转换。

原始值 计算 标准分数(z分数)
26 (26-38.8)/11.4= -1.12
33 (33-38.8)/11.4= -0.51
65 (65-38.8)/11.4= -2.30
... ... ...

在这里他们用图形表示:

Normal Distribution