更新时间:作者:小小条
19 世纪英国科学家高尔顿(达尔文的表弟)痴迷遗传研究,他收集了 1078 对父子的身高数据,想验证 “高个子父亲会生出高个子儿子” 的假设。但数据显示:高个子父亲的儿子,平均身高比父亲矮;矮个子父亲的儿子,平均身高比父亲高 —— 这种 “极端值向均值靠拢” 的现象,被高尔顿称为 “回归”。

一开始,高尔顿无法解释这个现象,直到他将概率统计方法引入分析:他绘制了父子身高的散点图,发现两者存在 “线性相关”,并计算出相关系数(衡量相关性强弱的指标);同时,他用正态分布拟合数据,发现父子身高的联合分布服从二元正态分布,“回归现象” 正是正态分布和相关性共同作用的结果。
基于这个发现,高尔顿提出了 “回归分析” 和 “相关分析” 的方法,1908 年,他的学生皮尔逊进一步完善了相关系数的计算的公式,奠定了现代数理统计的基础。
高尔顿的研究让统计从 “关注单个事件的概率” 转向 “分析群体数据的规律”,关键突破有:
1. 相关性与回归分析的建立:首次量化了两个变量之间的关联程度(相关系数),并建立了变量间的预测模型(回归方程);
2. 统计方法的系统化:将数据收集、整理、分析、推断的过程规范化,形成了 “数理统计” 的独立学科;
3. 从 “描述” 到 “推断” 的升级:不仅描述数据的表面现象(如父子身高的均值),更揭示数据背后的内在关联(如遗传与身高的关系),并能进行预测。
高尔顿和皮尔逊的工作,让统计方法成为所有科学研究的必备工具:
• 推动了生物统计学、计量经济学、社会学等交叉学科的诞生;
• 让 “数据驱动” 成为科学研究的核心范式,取代了传统的 “经验判断”;
• 后续费希尔提出的 “假设检验”“实验设计”,进一步完善了数理统计体系,使其成为现代科学的基石。
回顾概率统计的发展历程,我们会发现一个清晰的脉络:它始于解决 “赌桌分金” 的实用需求,通过解决天文观测、遗传研究、测量误差等实际问题,逐步从 “经验技巧” 进化为 “数学理论”,再到 “科学工具”。
每个里程碑案例都代表着一次思想的突破:从 “等可能事件” 到 “连续概率”,从 “正向计算” 到 “逆概率推断”,从 “个体随机” 到 “群体规律”,从 “经验积累” 到 “公理化体系”。这些突破不仅让概率统计成为一门严谨的学科,更让它渗透到我们生活的方方面面 —— 从天气预报到医疗诊断,从 AI 推荐到政策制定,成为人类理解不确定性、探索世界规律的核心工具。
概率统计的发展史,本质上是人类 “理性面对不确定性” 的进化史:它教会我们不迷信偶然,不畏惧未知,用数学方法拆解复杂问题,用数据说话,用规律指导决策。这正是这门学问最珍贵的价值。
参考文献:
• 张天蓉。从掷骰子到人工智能:趣谈概率 [M]. 北京:清华大学出版社,2024.(支撑:古典概型、贝叶斯定理、AI 中的概率应用)
• [美] 伦纳德・蒙洛迪诺。醉汉的脚步:随机性如何主宰我们的生活 [M]. 郭斯羽,译。北京:中信出版集团,2020.(支撑:大数定律、随机现象的规律)
• [美] 朱迪亚・珀尔,达纳・麦肯齐。为什么:关于因果关系的新科学 [M]. 江生,于华,译。北京:中信出版集团,2019.(支撑:贝叶斯定理、因果推断)
• [英] 伊恩・斯图尔特。改变世界的 17 个方程 [M]. 苗栋,译。北京:人民邮电出版社,2019.(支撑:正态分布、贝叶斯定理的科学影响)
• 刘嘉。概率论通识讲义 [M]. 北京:新星出版社,2021.(支撑:概率核心概念的通俗解读与历史背景
版权声明:本文转载于今日头条,版权归作者所有,如果侵权,请联系本站编辑删除