网站首页
手机版

一个正态总体假设检验 实用统计学方法

更新时间:作者:小小条

正态总体是一种常见的概率分布,通常用来描述自然界中许多随机现象,例如身高、体重、温度等连续性随机变量的分布。一个正态总体可以由其均值(μ)和方差(σ^2)来完全描述。

一个正态总体假设检验  实用统计学方法

正态总体有以下特点:

对称性:正态总体的概率密度函数关于均值对称,即在均值处取得峰值,并且两侧的概率密度对称。二阶矩存在:正态总体的均值和方差都存在,并且可以用来描述其分布的形态和离散程度。中心极限定理:正态总体在大样本情况下,样本均值的分布接近正态分布,这就是著名的中心极限定理。

正态总体在统计学和概率论中应用广泛,包括假设检验、置信区间估计、回归分析等领域。正态总体是一种重要的数学模型,可以帮助我们理解和描述自然界中的随机现象。

假设检验用于对一个关于总体参数的“假设”进行检验,以确定是否有足够的证据支持或反对该假设。假设检验的基本思想是小概率反证法思想,小概率思想是指小概率事件(p<0.01或p<0.05)在一次试验中基本上不会发生。

一、一个正态总体的假设检验步骤

在一个正态总体的假设检验中,通常包括以下几个步骤:

建立假设:首先,需要明确原假设(null hypothesis,通常记为H0)和备择假设(alternative hypothesis,通常记为H1)。原假设通常是一种默认的假设,表示无效果、无关系或无显著差异,而备择假设则是我们想要证明的假设,通常表示有效果、有关系或有显著差异。选择检验统计量:接下来,需要选择一个合适的检验统计量,它是根据样本数据计算得到的统计量,用于作为判断原假设是否成立的依据。在正态总体的假设检验中,常常使用 t 统计量或者 z 统计量作为检验统计量,具体选择哪个统计量取决于样本数据的性质和假设检验的问题。确定显著性水平:显著性水平(significance level),通常用 α 表示,是用来设定假设检验的临界值。它表示在原假设成立的情况下,观察到的检验统计量取得与之相反或更极端的值的概率。常见的显著性水平有 0.05、0.01 等,表示我们希望在 5% 或 1% 的显著性水平下进行假设检验。计算检验统计量的值:根据样本数据计算得到选择的检验统计量的值。计算 p 值:根据假设检验的问题和选择的检验统计量,计算得到观察到的检验统计量的概率值,即 p 值。p 值表示在原假设成立的情况下,观察到的检验统计量取得与之相反或更极端的值的概率。做出决策(检验):比较计算得到的 p 值与显著性水平的大小。如果 p 值小于显著性水平,通常我们会拒绝原假设,接受备择假设;如果 p 值大于显著性水平,我们通常不能拒绝原假设,即没有足够的证据支持备择假设。

二、一个正态总体的假设检验

设X~(μ, σ^2),关于它的假设检验问题,主要分为下列几种:

已知方差 σ^2,假设检验H0: μ = μ0(双边正态分布检验);未知方差 σ^2,假设检验H0: μ = μ0(双边t分布检验);已知方差 σ^2,假设检验H0: μ ≤ μ0(单边正态分布检验);未知方差 σ^2,假设检验H0: μ ≤ μ0(单边t分布检验);未知期望μ,假设检验 H0: σ^2 = σ0^2(双边卡方分布检验);未知期望μ,假设检验 H0: σ^2 ≤ σ0^2(单边卡方分布检验)。

1、方差已知时期望假设检验(正态检验)

方差已知时,期望(均值或平均数)的假设检验统计量为正态分布统计量,分为双边检验和单边检验两种情况。

双边检验和单边检验的区别是p值得计算方法不同。

例 1 某车间生产钢丝(其主要质量指标为折断力X,单位:公斤),根据过去资料来看,折断力X服从正态分布,期望是570公斤、标准差为8公斤。今换了一批原料,估计折断力X的方差不会有什么变化,现抽取10个样品如下:

578

572

570

568

573

570

570

572

569

584

不知折断力的大小是否和原先有无差别(置信水平α=0.05)?

建立假设H0: μ = 570;H1: μ ≠ 570;即假设换原料后,折断力无差别。统计量:由于标准差为8公斤(即方差为64公斤)、方差已知。选择正态分布统计量。

已知:n = 10、μ0 = 570、σ = 8;

样本平均数, Xmean = AVERAGE(578,572,570,568,573,570,570,572,569,584) = 572.6,

统计量,Z = (572.6-570)/(8/10^0.5) = 1.02774

计算p值:由于原假设“H0: μ=570”为双边检验,

p = 2*(1-NORM.S.DIST(1.02774,TRUE)) ≈ 0.304

注:Excel中的NORM.S.DIST函数用于计算标准正态分布的累积分布函数,计算公式采用EXCEL算式表达式;Xmean为样本平均值

检验:因为p ≈ 0.304 >α = 0.05, 接受原假设H0,拒绝备择假设 H1,即“折断力的大小无显著差异” 。

例 2 某厂生产一种灯具,其寿命X服从正态分布N(1500,400)。现采用新工艺后,在所生产的灯具中抽取4件,测得其平均寿命为1520小时。检验采取新工艺后,灯具的寿命是否有显著提高(置信水平α=0.05)。

建立假设

H0: μ≤1500; H1: μ>1500。即采用新工艺后,灯具寿命没有显著提高或下降了。

计算统计量

已知:n = 4, μ = 1500, Xmean = 1520, σ^2=400,

选择正态分布统计量,统计量为:

计算p值:由于原假设“H0: μ≤1500”为单边检验,

p = 1-NORM.S.DIST(2,TRUE) ≈ 0.023

注:这里单边检验p值公式为1-NORM.S.DIST(2,TRUE)、双边检验p值公式为2×[1-NORM.S.DIST(2.0555,TRUE)]

检验:因为p ≈ 0.023 <α = 0.05, 拒绝原假设H0,接受备择假设 H1,即采用新工艺后,“灯具寿命有显著提高”。

2、方差未知时期望假设检验(t检验)

方差未知时,期望(均值或平均数)的假设检验统计量为t统计量,也分为双边检验和单边检验两种情况。

例 3 用某仪器测量温度,重复5次,所得数据(单位:度)是:

1250

1265

1245

1260

1275

而用别的精确方法测得温度为1277度(可看作温度的真值),试问该仪器(测得的温度)是否有系统偏差?

建立假设

H0: μ = 1277; H1: μ ≠ 1277

计算t统计量

已知:n = 5, μ = 1277,

样本平均数, Xmean = AVERAGE(1250,1265,1245,1260,1270) = 1258

样本标准差, S = STDEV.S(1250,1265,1245,1260,1270) ≈ 10.37

统计量:T = (1258-1277)/(10.37*5^0.5) = -4.098

计算p值:由于原假设“H0: μ = 1277”为双边检验,

p = 2*(1-T.DIST(4.098,4,TRUE)) ≈ 0.015

注:Excel的T.DIST函数用于计算t分布的累积概率。这里统计量为负值时按绝对值代入公式

检验:

因为p ≈ 0.015 < α = 0.05, 拒绝原假设H0,接受备择假设 H1,即“该机器间接测量有系统偏差”。

3、正态总体方差σ^2的假设检验

设随机变量X服从正态分布,下面统计量服从卡方分布。即,

根据假设,比较卡方统计量和p值即可判断出拒绝还是接受原假设。

例 4 (参见例 1)

是否可以相信该车间的钢丝折断力的方差为64(置信水平α=0.05α=0.05)?

建立假设

H0: σ^2 = 64; H1: σ^2 ≠ 64

计算卡方统计量(分布曲线不对称)
已知:n = 10、μ = 570、σ = 8;

样本标准差为,

S^2 = VAR.S(578,572,570,568,573,570,570,572,569,584) ≈ 23.8222

X^2 = (9*23.8222)/64 ≈ 3.35

计算p值:原假设“H0: σ^2 = 64”为双边检验

p = CHISQ.DIST(3.35,9,TRUE) ≈ 0.0512

p1 = α/2 = 0.05/2 = 0.025

p2 = 1-α/2 =1- 0.05/2 = 0.975

检验:

因为,p1=0.025<p=0.0512<p2=0.975,p值介于左右两个分布临界值p值之间(小概率未发生),接受原假设,有95%的把握确信该车间的钢丝折断力方差为64。

例 5 机器包装食盐,已知每袋盐的净重服从正态分布,规定标准为每袋误差不能超过0.2千克。某天开工后为检验机器工作是否正常,从包装好的食盐中随机抽取9袋,测得其净重为:

1.03, 0.968, 0.976, 1.048, 0.982, 0.994, 1.014, 1.02, 1.95

问这天包装机工作是否正常(置信水平α=0.05)?

机器工作正常时,标准差应该小于0.1千克,所以:

建立假设:

H0: σ^2 ≤ 0.04 ; H1: σ^2 > 0.04

计算卡方统计量(分布曲线不对称)
已知:n = 9、σ = 0.2;

样本标准差为,

S^2 = VAR.S(1.03,0.968,0.976,1.048,0.982,0.994,1.014,1.02,1.95) ≈ 0.10014

X^2 = (8*0.10014)/0.04 ≈ 20.03

计算p值:原假设“H0: σ^2 ≤ 0.01”为单边检验

p = CHISQ.DIST(20.103,8,TRUE) ≈ 0.9898

检验:

因为,p=0.9898>1-α=0.95,拒绝受原假设H0,有95%的把握确信这台包装机工作不正常。

注:单边检验时,α<p<1-α接受原假设H0双边检验时,α/2<p<1-α/2接受原假设H0,否则拒绝原假设H0

本文涉及的计算公式和算式表达式通过EXCEL函数实现。NORM.S.DIST、T.DIST、CHISQ.DIST函数分别用于正态分布、t分布、卡方分布p值计算。STDEV.S、VAR.S函数用于计算样本标准差和样本方差。

版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除

为您推荐

GraphPad Prism正态性(和对数正态性)检验

正态性(和对数正态性)检验Prism可以作为列统计分析的一部分来检验正态性。作为非线性回归分析的一部分,它也可以检验来自非线性回归的残差的正态性。如何:正态性检验分析列数据1

2026-01-20 06:35

科研论文中常见的P值和显著性是什么意思?一文搞懂P值及其计算

我们常常在科研论文的数据分析部分或者某些科普文章引用的资料当中见到涉及P值的统计学报表以及相关的显著性判断。非专业读者看到这些关于P值和"显著性"的描述往往是一头雾

2026-01-20 06:35

来了!浙江11地市寒假时间

浙江各地的学生们近期都已陆续进入期末“备战”状态心心念念的寒假何时开始?下学期何时报到开学?一起来看详细情况 杭州 2025年秋季学期于8月31日报到注册,9月1日正式上课,至2

2026-01-20 06:34

冲上热搜!取消中小学期末统考,包括高一高二,多地发出通知

这两天,青岛、成都、北京等部分地区传出取消期末统考的消息,“多地取消高一高二期末统考”的词条也随之冲上热搜。 “初中的期末考试会取消统考吗?”“小学也会取消吗?”社交媒

2026-01-20 06:34

多地取消中小学期末统考,包括高一高二!

这两天,青岛、成都、北京等部分地区传出取消期末统考的消息,“多地取消高一高二期末统考”的词条也随之冲上热搜。“初中的期末考试会取消统考吗?”“小学也会取消吗?”社交媒体

2026-01-20 06:33

高中数学《数列高考9大核心考点梳理》

上一篇文章分享了“圆锥曲线的核心考点”接下来和大家一起学习“数列高考的9大核心考点”。需要学习的朋友可以收藏保存学习。一、Sn与an的关系二、等差数列及性质三、等比

2026-01-20 06:33