彩票走势图

Minitab小技巧:中心极限定理的起点——正态分布

翻译|使用教程|编辑:况鱼杰|2020-06-28 11:40:51.540|阅读 1168 次

概述:数据的正态分布遵循钟形对称模式。大多数观察值都接近平均值,并且越来越远离平均值的观察值也越来越少。它表明,有一些方法可以解决原始数据的疯狂问题。许多情况下的数据都遵循正态分布。但是,要衡量的许多事情都不遵循这种模式。据说它们具有非正态分布。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

Minitab Statistical Software是一款无与伦比的可视化统计分析软件,它会审视当前及过往的数据,以找出趋势并预测规律、发现变量之间隐藏的关系、可视化数据交互作用并识别重要因素,从而解答最棘手的问题、应对最严峻的难题。

点击立即下载Minitab


正常数据? 非正常数据? 在分布中寻找模式

数据的正态分布遵循钟形对称模式。大多数观察值都接近平均值,并且越来越远离平均值的观察值也越来越少。它表明,有一些方法可以解决原始数据的疯狂问题。许多情况下的数据都遵循正态分布。但是,要衡量的许多事情都不遵循这种模式。据说它们具有非正态分布。

计数羊铃曲线

但是,对于正态和非正态数据,如果我们从总体中重复获取大小为n的独立随机样本,则当n大时,样本均值的分布将接近正态分布。

多大的样本量就足够了?

这要看情况。总体分布已经越接近于正态分布,证明该定理所需的样本就越少。一般来说,样本大小为30或更大被认为足以使中心极限定理生效。 但是,严重偏斜或具有多种模式的总体可能需要更大的样本量。

示例1:滚动模具显示正态分布

假设您有一个6面模具。滚动任何数字的概率为1/6。滚动任何一个数字的概率与滚动其他五个数字的概率相同。Minitab统计软件中,您可以利用随机数据生成器为您的第一卷模具模拟500种不同的结果。 单击计算>随机数据>整数…,并使其生成500行,其中最小值为1,最大值为6。

骰子图像劳斯价值表

直方图可用于可视化这500个“第一卷”。 在这种情况下,样本大小为1。并且由于滚动每个数字的几率相等,因此分布相对平坦。请看下图中的蓝色条形图与代表正态分布的红色曲线图相比如何? 这不正常。

一卷直方图

现在,让我们获取更多样本,看看这些样本的平均值的直方图发生了什么。这次,将模拟模子滚动两次,并重复此过程500次。现在样本大小为2。我们使用Calc> Row Statistics…计算每对的平均值。见下文。在这里,每一行代表大小为2的样本及其均值。 当样本量足够大时,将遵循正态分布。让我们创建一个获取想法的直方图。它开始看起来更加正常。现在,让我们掷骰子5、10、20和30次。

每组均值的直方图显示,随着样本数量的增加,样本均值的分布越来越接近正态分布。

示例2:指数分布

指数分布模拟事件之间的时间。无论产品是全新的,一年或更旧的(无论是全新的还是一岁的),它都是随时可能发生故障的产品或产品生命周期的一个很好的模型。它开始老化并在预期的应用中磨损。这是估算晶体管失效时间的概率密度曲线的示例。

分布图

显然,这不是正态分布。但是,当您使用样本量5生成指数数据时,计算均值,然后创建均值的直方图会怎样?样本量10、20和30怎么样?

均值样本大小直方图

就像滚动模具一样,随着样本数量的增加,均值的分布更接近正态分布。

如果您感兴趣,可以下载Minitab来试试!当然,你有任何其他想了解的信息,可以点击咨询在线客服>>



标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn

文章转载自:minitab

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP