更新时间:作者:小小条
正态总体是一种常见的概率分布,通常用来描述自然界中许多随机现象,例如身高、体重、温度等连续性随机变量的分布。一个正态总体可以由其均值(μ)和方差(σ^2)来完全描述。

正态总体有以下特点:
对称性:正态总体的概率密度函数关于均值对称,即在均值处取得峰值,并且两侧的概率密度对称。二阶矩存在:正态总体的均值和方差都存在,并且可以用来描述其分布的形态和离散程度。中心极限定理:正态总体在大样本情况下,样本均值的分布接近正态分布,这就是著名的中心极限定理。正态总体在统计学和概率论中应用广泛,包括假设检验、置信区间估计、回归分析等领域。正态总体是一种重要的数学模型,可以帮助我们理解和描述自然界中的随机现象。
假设检验用于对一个关于总体参数的“假设”进行检验,以确定是否有足够的证据支持或反对该假设。假设检验的基本思想是小概率反证法思想,小概率思想是指小概率事件(p<0.01或p<0.05)在一次试验中基本上不会发生。
一、一个正态总体的假设检验步骤
在一个正态总体的假设检验中,通常包括以下几个步骤:
建立假设:首先,需要明确原假设(null hypothesis,通常记为H0)和备择假设(alternative hypothesis,通常记为H1)。原假设通常是一种默认的假设,表示无效果、无关系或无显著差异,而备择假设则是我们想要证明的假设,通常表示有效果、有关系或有显著差异。选择检验统计量:接下来,需要选择一个合适的检验统计量,它是根据样本数据计算得到的统计量,用于作为判断原假设是否成立的依据。在正态总体的假设检验中,常常使用 t 统计量或者 z 统计量作为检验统计量,具体选择哪个统计量取决于样本数据的性质和假设检验的问题。确定显著性水平:显著性水平(significance level),通常用 α 表示,是用来设定假设检验的临界值。它表示在原假设成立的情况下,观察到的检验统计量取得与之相反或更极端的值的概率。常见的显著性水平有 0.05、0.01 等,表示我们希望在 5% 或 1% 的显著性水平下进行假设检验。计算检验统计量的值:根据样本数据计算得到选择的检验统计量的值。计算 p 值:根据假设检验的问题和选择的检验统计量,计算得到观察到的检验统计量的概率值,即 p 值。p 值表示在原假设成立的情况下,观察到的检验统计量取得与之相反或更极端的值的概率。做出决策(检验):比较计算得到的 p 值与显著性水平的大小。如果 p 值小于显著性水平,通常我们会拒绝原假设,接受备择假设;如果 p 值大于显著性水平,我们通常不能拒绝原假设,即没有足够的证据支持备择假设。二、一个正态总体的假设检验
设X~(μ, σ^2),关于它的假设检验问题,主要分为下列几种:
已知方差 σ^2,假设检验H0: μ = μ0(双边正态分布检验);未知方差 σ^2,假设检验H0: μ = μ0(双边t分布检验);已知方差 σ^2,假设检验H0: μ ≤ μ0(单边正态分布检验);未知方差 σ^2,假设检验H0: μ ≤ μ0(单边t分布检验);未知期望μ,假设检验 H0: σ^2 = σ0^2(双边卡方分布检验);未知期望μ,假设检验 H0: σ^2 ≤ σ0^2(单边卡方分布检验)。1、方差已知时期望假设检验(正态检验)
方差已知时,期望(均值或平均数)的假设检验统计量为正态分布统计量,分为双边检验和单边检验两种情况。
双边检验和单边检验的区别是p值得计算方法不同。
例 1 某车间生产钢丝(其主要质量指标为折断力X,单位:公斤),根据过去资料来看,折断力X服从正态分布,期望是570公斤、标准差为8公斤。今换了一批原料,估计折断力X的方差不会有什么变化,现抽取10个样品如下:
578 | 572 | 570 | 568 | 573 |
570 | 570 | 572 | 569 | 584 |
不知折断力的大小是否和原先有无差别(置信水平α=0.05)?
建立假设H0: μ = 570;H1: μ ≠ 570;即假设换原料后,折断力无差别。统计量:由于标准差为8公斤(即方差为64公斤)、方差已知。选择正态分布统计量。已知:n = 10、μ0 = 570、σ = 8;
样本平均数, Xmean = AVERAGE(578,572,570,568,573,570,570,572,569,584) = 572.6,
统计量,Z = (572.6-570)/(8/10^0.5) = 1.02774
计算p值:由于原假设“H0: μ=570”为双边检验,p = 2*(1-NORM.S.DIST(1.02774,TRUE)) ≈ 0.304
注:Excel中的NORM.S.DIST函数用于计算标准正态分布的累积分布函数,计算公式采用EXCEL算式表达式;Xmean为样本平均值
检验:因为p ≈ 0.304 >α = 0.05, 接受原假设H0,拒绝备择假设 H1,即“折断力的大小无显著差异” 。例 2 某厂生产一种灯具,其寿命X服从正态分布N(1500,400)。现采用新工艺后,在所生产的灯具中抽取4件,测得其平均寿命为1520小时。检验采取新工艺后,灯具的寿命是否有显著提高(置信水平α=0.05)。
建立假设H0: μ≤1500; H1: μ>1500。即采用新工艺后,灯具寿命没有显著提高或下降了。
计算统计量已知:n = 4, μ = 1500, Xmean = 1520, σ^2=400,
选择正态分布统计量,统计量为:
计算p值:由于原假设“H0: μ≤1500”为单边检验,p = 1-NORM.S.DIST(2,TRUE) ≈ 0.023
注:这里单边检验p值公式为1-NORM.S.DIST(2,TRUE)、双边检验p值公式为2×[1-NORM.S.DIST(2.0555,TRUE)]
检验:因为p ≈ 0.023 <α = 0.05, 拒绝原假设H0,接受备择假设 H1,即采用新工艺后,“灯具寿命有显著提高”。2、方差未知时期望假设检验(t检验)
方差未知时,期望(均值或平均数)的假设检验统计量为t统计量,也分为双边检验和单边检验两种情况。
例 3 用某仪器测量温度,重复5次,所得数据(单位:度)是:
1250 | 1265 | 1245 | 1260 | 1275 |
而用别的精确方法测得温度为1277度(可看作温度的真值),试问该仪器(测得的温度)是否有系统偏差?
建立假设H0: μ = 1277; H1: μ ≠ 1277
计算t统计量已知:n = 5, μ = 1277,
样本平均数, Xmean = AVERAGE(1250,1265,1245,1260,1270) = 1258
样本标准差, S = STDEV.S(1250,1265,1245,1260,1270) ≈ 10.37
统计量:T = (1258-1277)/(10.37*5^0.5) = -4.098
计算p值:由于原假设“H0: μ = 1277”为双边检验,p = 2*(1-T.DIST(4.098,4,TRUE)) ≈ 0.015
注:Excel的T.DIST函数用于计算t分布的累积概率。这里统计量为负值时按绝对值代入公式
检验:因为p ≈ 0.015 < α = 0.05, 拒绝原假设H0,接受备择假设 H1,即“该机器间接测量有系统偏差”。
3、正态总体方差σ^2的假设检验
设随机变量X服从正态分布,下面统计量服从卡方分布。即,
根据假设,比较卡方统计量和p值即可判断出拒绝还是接受原假设。
例 4 (参见例 1)
是否可以相信该车间的钢丝折断力的方差为64(置信水平α=0.05α=0.05)?
建立假设H0: σ^2 = 64; H1: σ^2 ≠ 64
计算卡方统计量(分布曲线不对称)样本标准差为,
S^2 = VAR.S(578,572,570,568,573,570,570,572,569,584) ≈ 23.8222
X^2 = (9*23.8222)/64 ≈ 3.35
计算p值:原假设“H0: σ^2 = 64”为双边检验p = CHISQ.DIST(3.35,9,TRUE) ≈ 0.0512
p1 = α/2 = 0.05/2 = 0.025
p2 = 1-α/2 =1- 0.05/2 = 0.975
检验:因为,p1=0.025<p=0.0512<p2=0.975,p值介于左右两个分布临界值p值之间(小概率未发生),接受原假设,有95%的把握确信该车间的钢丝折断力方差为64。
例 5 机器包装食盐,已知每袋盐的净重服从正态分布,规定标准为每袋误差不能超过0.2千克。某天开工后为检验机器工作是否正常,从包装好的食盐中随机抽取9袋,测得其净重为:
1.03, 0.968, 0.976, 1.048, 0.982, 0.994, 1.014, 1.02, 1.95
问这天包装机工作是否正常(置信水平α=0.05)?
机器工作正常时,标准差应该小于0.1千克,所以:
建立假设:H0: σ^2 ≤ 0.04 ; H1: σ^2 > 0.04
计算卡方统计量(分布曲线不对称)样本标准差为,
S^2 = VAR.S(1.03,0.968,0.976,1.048,0.982,0.994,1.014,1.02,1.95) ≈ 0.10014
X^2 = (8*0.10014)/0.04 ≈ 20.03
计算p值:原假设“H0: σ^2 ≤ 0.01”为单边检验p = CHISQ.DIST(20.103,8,TRUE) ≈ 0.9898
检验:因为,p=0.9898>1-α=0.95,拒绝受原假设H0,有95%的把握确信这台包装机工作不正常。
注:单边检验时,α<p<1-α接受原假设H0;双边检验时,α/2<p<1-α/2接受原假设H0,否则拒绝原假设H0
本文涉及的计算公式和算式表达式通过EXCEL函数实现。NORM.S.DIST、T.DIST、CHISQ.DIST函数分别用于正态分布、t分布、卡方分布p值计算。STDEV.S、VAR.S函数用于计算样本标准差和样本方差。
版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除