更新时间:作者:小小条
今天我要给大家详细讲解统计学中最常见的概率分布 —— 正态分布。先从基础概念入手,再教大家如何用它计算概率,最后通过实战案例巩固知识点。如果觉得内容有用,别忘了点赞关注,支持我们创作更多干货内容!
正态分布的图形呈对称的钟形,因此也常被称为 “钟形曲线”。这条曲线以分布的均值为中心,向两侧延伸,且离均值越远,概率密度越低。从理论上讲,正态分布会向正负两个方向无限延伸,但实际上,其显著的概率值仅集中在均值 ±3 个标准差的范围内。

这就引出了正态分布的重要经验法则(68-95-99.7 法则):
约 68% 的数据落在均值 ±1 个标准差范围内;约 95% 的数据落在均值 ±2 个标准差范围内;约 99.7% 的数据落在均值 ±3 个标准差范围内。正态分布之所以应用广泛,是因为它能描述很多现实世界中的现象 —— 比如人们的身高、体重、智商等,都近似遵循正态分布。
不同场景下的正态分布,其均值、标准差和单位各不相同(比如身高用英寸,体重用磅),直接计算概率会非常麻烦。为了解决这个问题,我们需要对数据进行 “标准化” 处理,将任意正态分布转换为 “标准正态分布”。
标准正态分布的特点是:均值 = 0,标准差 = 1,且无单位限制。无论原始数据的量级和单位如何,标准化后都能转化为以 0 为中心、大致在 - 3 到 3 之间延伸的分布。
z 分数的计算公式为:z = (x - μ) / σ其中:
x:原始数据点;μ(缪):原始分布的均值;σ(西格玛):原始分布的标准差。z 分数的含义是:某个数据点偏离均值的标准差个数。比如 z=0.5,说明该数据点比均值高 0.5 个标准差。
举个例子:假设某班学生的身高服从正态分布,均值 μ=66 英寸,标准差 σ=2 英寸。如果你的身高是 67 英寸,对应的 z 分数为 (67-66)/2=0.5,意味着你的身高比班级平均水平高 0.5 个标准差。
与其他概率分布不同,正态分布没有简洁的概率计算公式,需要借助 z 分数表(也叫标准正态分布表)来查询概率。
z 分数表的左侧列对应 z 分数的整数部分和小数点后一位,顶部行对应 z 分数的小数点后二位,表格内部的数值是该 z 分数对应的 “左侧面积”—— 即数据落在该 z 分数左侧的概率(也就是 P (Z < z))。
注意:z 分数有正负之分,需使用对应的正负 z 分数表:
负 z 分数表:用于查询小于均值的数据点(z<0)的概率;正 z 分数表:用于查询大于均值的数据点(z>0)的概率。示例:若 z 分数 = 0.63,需在正 z 分数表中找到 “0.6” 行和 “0.03” 列,交叉处的数值 0.7357 即为概率,代表有 73.57% 的数据落在该 z 分数左侧。
假设你常去的披萨店声称 “大披萨直径至少 16 英寸,否则免费”。根据你的经验,该店披萨直径服从正态分布,均值 μ=16.3 英寸,标准差 σ=0.2 英寸。我们来解决三个实际问题:
免费披萨的条件是直径 <16 英寸,即求 P (X < 16)。
计算 z 分数:z = (16 - 16.3)/0.2 = -1.5;查负 z 分数表:找到 “-1.5” 行和 “0.00” 列,对应概率 0.0668;结论:获得免费披萨的概率为 6.68%。即求 P (X> 16.5)。
计算 z 分数:z = (16.5 - 16.3)/0.2 = 1.0;查正 z 分数表:“1.0” 行和 “0.00” 列对应概率 0.8413(即 P (Z < 1.0)=0.8413);由于正态分布总面积为 1,右侧面积 = 1 - 左侧面积:1 - 0.8413 = 0.1587;结论:买到超大披萨的概率为 15.87%。即求 P (15.95 < X < 16.63)。
计算两个数据点的 z 分数:15.95 英寸:z1 = (15.95 - 16.3)/0.2 = -1.75;16.63 英寸:z2 = (16.63 - 16.3)/0.2 = 1.65;查 z 分数表:P (Z < -1.75) = 0.0401(负 z 分数表);P (Z < 1.65) = 0.9505(正 z 分数表);中间面积 = 右侧 z 分数的左侧面积 - 左侧 z 分数的左侧面积:0.9505 - 0.0401 = 0.9104;结论:买到该尺寸范围披萨的概率为 91.04%。正态分布是统计学中最基础也最实用的概率分布,核心在于通过 z 分数将任意正态分布标准化,再借助 z 分数表计算概率。记住 68-95-99.7 法则和 z 分数的计算逻辑,就能轻松解决各类实际问题。
版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除