更新时间:作者:小小条
请浏览 原创 郑宇昊 在 机场工程人家 2025年04月20日 13:12 发表于 北京的文章:「链接」
大家好,我是郑宇昊,我是中国航空规划设计研究总院一名普通机场设计工程师。过去几篇关于排水的文章,引发了不少读者的反馈,最多的一句是:“看不懂。”

这不是他们的问题,也不是知识门槛的问题,而是认知结构与思维方式的错位。为了揭示降雨这一随机变量的特殊性,我直接采用了 Gumbel 分布,用以直观展示密度函数的形状和“右尾”的特征,却没有详细交代为何选它,结果不少人在这一步“卡壳”,反复追问:“为什么是它?”
说实话,选哪个分布,其实并不重要。
我只是想借一个合适的模型,来演示公式的正反逻辑闭合性,以及极值拟合中尾部特性的呈现方式。
那天,我只是略微思考了一下——从 Normal、Lognormal、Gamma、Beta、Uniform、Gumbel、Generalized Extreme Value、Weibull、Laplace、Student’s t、Chi-Square、Exponential、Poisson……这些分布类型中,随手一取,用来举例、铺路。
文中我也提醒过:“千万别当真。”但偏偏,还是有人信了。
反过来看,如果你始终纠结“为什么用这个分布”,而不是去想“它为什么适合讲清这个问题”,那也许你卡住的不是某个答案,而是你的思维结构还没准备好接住这个问题本身。
真正值得你关注和追问的,可能是这些关键词背后的整体认知地图:
统计量与分布:期望值、方差、标准差;概率与风险:右尾、分位数、密度函数、最大似然估计;数据的形态:偏度、峰度、归一化、样本空间……它们才是组成你未来判断力的底层积木,而不是“这个分布为什么是 Gumbel”。
所以当时我没有直接回答。不是回避,而是想让你在困惑里多停一会儿,这个坎你得自己迈过去。
今天,我觉得你已经准备好了。我们就从最基础、也是最容易被误解的那个分布讲起——正态分布。
有人劝我:“你这样把核心方法都教出去,不就等于断了自己的‘独门绝技’?你开源了,还怎么显得自己厉害?”但你如果真正读过我的行文,就会知道,我从不靠藏拙维持优势。
逻辑闭合、简单复杂、反身性、第一性原理——我写得越多,暴露得越多,反而越证明:我理解得足够深,才敢让你看得够透。
所以,不但不怕教,我甚至乐于用最简单、最通俗、最人话的方式教会你,而且我还不会指责你这么那么外行,一看就没经过某个专业的系统教育、定义也不会、概念也不明白了,太外行了,完全错了。因为说到底,我写这些,是想救人——救那些被错误理论困住、被公式吓退、被规范框住的工程师们,救那些让我泪流满面,一直自责我来晚了的人。
不是炫技,而是渡人。
好了,铺垫到这里,咱们今天回归常识——讲讲“正态分布”。
正态分布(Normal Distribution),也叫高斯分布(Gaussian Distribution),是统计学中最常见的概率分布之一。它的特点是数据围绕一个均值对称分布,呈钟形曲线,两边逐渐趋向零但不会真正触及零。
在机场工程领域,飞机轮迹分布、道面承载能力、气象数据、航班延误时间等,都可以用正态分布来描述。
你可以把正态分布想象成一个标准的“飞机降落轨迹”:大多数飞机会落在跑道的中间,但总有一些会稍微偏左或偏右(但不会偏太远)。如果你统计所有降落点的横向偏移,画出数据的分布曲线,它就会呈现出一个钟形曲线,中间高、两边低,这就是正态分布!
正态分布的故事开始于18世纪,当时数学家棣莫弗在研究二项分布时,发现当样本量足够大且事件发生概率为50%时,二项分布可以很好地被一个新的分布函数近似,这就是我们现在所知的正态分布。到了19世纪,拉普拉斯扩展了这一发现,使得即使事件发生概率不是50%,正态分布依然能很好地近似二项分布。这一结论后来被称为“棣莫佛-拉普拉斯定理”。
在误差分析中,正态分布被拉普拉斯首次应用。接着,勒让德于1805年引入了一个名为“最小二乘法”的重要分析方法,用于处理数据中的误差,而高斯声称他早在1794年就已经在使用这个方法,并通过假设误差服从正态分布给出了详细的证明。
将正态分布称为“钟形曲线”的*惯源于1872年Jouffret首次使用这个术语来描述二元正态分布的形状。尽管如此,正态分布这个名称是由查尔斯·皮尔士、法兰西斯·高尔顿和威尔赫姆·莱克希斯在1875年各自独立提出的。这个命名其实并不太准确,因为它暗示了许多现象都是正态分布的,而实际上并非如此。
有趣的是,正态分布被称为“高斯”分布,却不是以其首次发现者命名的,这恰恰印证了史蒂格勒的名字由来法则:科学发现很少以最初发现者命名。
宇昊解释:尽管正态分布在众多科学研究和应用中被视为一种基本的、稳定的统计分布,甚至被科学家和研究者们近乎迷信般地依赖,它的广泛应用似乎赋予了它是一种动态的、符合概率的,甚至有些神秘的解释世间万物的运行规律。然而,更重要的是我们要认识到,正态分布只是众多分布中的一种特殊情况,它代表着最基础的分布之一,而且是存在均值和偏度为0且最满足“大数定理”的“特例”。在理解和应用正态分布时,我们需要记住,它虽然重要,但并非万能,真实世界中的数据分布千变万化,并不总是符合正态分布的理想模型。掌握数学和物理等基本公理,弄清楚事物本质规律后,才能灵活应用各种工具,无招胜有招,根据实际情况合理使用甚至创造思维工具来解决问题,偏重于某种方法、工具、理论而轻视其他则是经验主义和叙事谬误,那是很危险的。
正态分布的概率密度函数(PDF)由以下公式描述:
其中:
x是随机变量(如飞机降落点的横向偏移)μ(mu):均值(数据中心)σ(sigma):标准差(数据的离散程度)σ^2是方差(Variance),表示数据的波动程度e 是自然对数的底(约 2.718)这个公式看起来复杂,但其实很简单。指数项
表示数据点 x 离均值 μ 越远,概率越低;分母
是一个标准化因子,确保概率密度曲线的总面积为1。换句话说,这个公式描述了数据如何围绕均值对称分布,并逐渐衰减。
上图为不同均值、方差情况下的分布情况
虽然正态分布在机场工程中应用广泛,但它并非万能。正态分布是对称的,适合描述均值附近的数据(例如,轮迹偏移),但无法捕捉极端事件(例如,百年一遇暴雨)。例如,2012年北京“7·21”暴雨(460mm)超出了正态分布的预测范围,导致首都机场积水、航班延误。这也是我开发Z-H公式的初衷——用Gumbel分布动态评估降雨的尾部风险。此外,极端天气(如台风、暴雪)的影响往往呈现重尾分布(例如,Weibull分布),若盲目用正态分布设计跑道,可能低估风险,影响安全。
正态分布是对称的,适合描述均值附近的数据(例如,飞机轮迹偏移),但它无法很好地捕捉极端事件(例如,百年一遇暴雨)。而Gumbel分布是极值分布,专门用于年最大值数据(例如,降雨强度),能更好地描述尾部风险(黑天鹅事件)。这也是我在之前的文章中选择Gumbel分布的原因——机场排水设计需要关注极端降雨,而不仅仅是平均情况。
例如,机场降雨量的分布往往不符合正态分布,而是呈现右偏(极端降雨更常见),这时候用正态分布预测百年一遇暴雨可能会严重低估风险。以下是近年来的几个典型案例:
2012年北京“7·21”暴雨:2012年7月21日,北京遭遇60年来最强降雨,24小时内降雨量达460mm(房山区),全市平均170mm,创1951年以来最高纪录。这场暴雨超出正态分布的预测范围,导致首都机场积水、航班大面积延误,79人死亡,160万人受灾,直接经济损失约100亿元。1951年有完整气象记录以来最高!2016年武汉“7·2”洪水:2016年7月2日,武汉受持续强降雨影响,24小时降雨量超过200mm,部分地区(如汉口)达到250mm,引发严重城市内涝。武汉地处长江和汉江交汇处,武昌、汉阳积水更严重,排水系统不堪重负,街道被淹,交通瘫痪,约50万人受灾,直接经济损失超过20亿元。2021年郑州“7·20”特大暴雨:2021年7月20日,郑州遭遇千年一遇(按郑州站历史序列推算)的极端降雨,24小时降雨量达644.6mm(接近年均降雨量640.9mm),其中1小时最大降雨量201.9mm,创中国大陆小时降雨量历史极值。全市72小时累计降雨量787.9mm,导致近400人死亡,1500万人受灾,经济损失约1200亿元(约190亿美元)。郑州地铁被淹、街道成河,暴露出正态分布可能无法预测极端降雨的缺陷。2023年北京“7·29至8·1”洪水:2023年7月29日至8月1日,受台风“杜苏芮”残余环流影响,北京遭遇140年来最强降雨,昌平区王家园水库站记录到744.8mm降雨量(3.5天),北京市日降雨量首次突破600mm,远超1891年609mm的历史纪录。全市33人死亡,18人失踪,5.9万间房屋倒塌,15万间受损,经济损失巨大。首都机场再次因积水导致航班延误,城市交通和基础设施受到严重冲击。这些极端降雨事件均超出了正态分布的预测范围,暴露出传统方法在面对黑天鹅事件时的不足。正态分布假设数据对称分布,难以捕捉降雨的右偏和尾部风险(极端事件),而这些事件恰恰是机场排水设计中最需要关注的。这也是我开发Z-H公式的原因——用Gumbel分布动态评估降雨的尾部风险,预测小概率、高影响的极端事件,为机场排水设计提供更科学的依据。
我讲得这么天花乱坠,其实你也知道,用来验证的数据,是我“编”的。但我坚信——在公司给予的指导、支持与资源帮助下,这座看似空中的楼阁,终将落地生根,走向实践,推广到生产生活的各个领域,真正造福人类!
正态分布在机场工程中无处不在——从飞机降落点的分布、道面受力、摩擦系数变化,到跑道寿命预测,都藏着它的身影。FAA 的 FAARFIELD 软件,正是借助正态分布计算飞机轮迹,以保证跑道寿命评估的科学性与合理性。机场工程师们用它来优化结构厚度和养护策略,确保跑道既安全又经济。
如果你是机场工程师,正态分布是你最可靠的朋友,它帮你评估载荷、调整道面厚度、设计安全裕度;
如果你是飞行员,你的每一次轻微偏移,工程师早已用正态分布为你算进安全范围;
如果你只是路人,哪怕只是对机场感兴趣,下次登机时,不妨悄悄看看轮胎留下的痕迹——那些浅浅的轨迹,其实是正态分布在现实中留下的签名。
机场工程,听起来玄乎,但它不是魔法,是科学,是数字与经验的长期对话;正态分布,也不是某个专家才懂的符号,它本该属于每一个愿意理解它的人。
所以我讲,不是为了炫,而是为了传;我写,不是为了保密,而是为了开源、解惑、救人于迷雾。
因为知识最大的意义,不是让你佩服我,而是让你不再害怕它。
“I think it’s important to reason from first principles rather than by analogy.”
—— Elon Musk
“我认为,从第一性原理出发去思考,而不是依赖类比,是最重要的思维方式。”
—— 埃隆·马斯克
正态分布不是我想让你记住的公式,而是我希望你学会如何从原点出发、直面复杂。
不是因为我讲得好,而是因为你值得听懂。
作者:郑宇昊
一个矢志航空报国的老工程师。本文仅代表个人立场,如有雷同,不胜荣幸。
版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除