Promote popup c
你也可以在思書創作!
思書是免費的寫作平台,登錄就可以線上寫您的故事與想法,與其他作者留言互動,創新的多筆名寫作方式,讓您用不同的筆名探索不同的寫作內容,更保護您的隱私。


333 一维概率分布的几何实现:钟形、阶梯、点阵与分形

毕苏林
來關注...
關注/停止關注:毕苏林
關注有什麼好處?:當作者有新文章發佈時,「思書」就會自動通知您,讓您更容易與作者互動。
現在就加入《思書》,你就可以關注本作者了!
《思書》是一個每個人的寫作與論壇平台,特有的隱私管理,讓你寫作不再受限,討論更深入真實,而且免費。 趕快來試試!
還未加入《思書》? 現在就登錄! 已經加入《思書》── 登入
爱科学,也爱文艺;重逻辑,也重情感。以最硬核的科幻为壳,写最柔软的人间故事。愿以文字为桥,结识品味相投的读友。
24   0  
·
2026/05/25
·
13分鐘


 

论文2:一维概率分布的几何实现:钟形、阶梯、点阵与分形


作者:张苏杭

单位:河南洛阳


摘要

本文延续论文1的概率-几何同构框架,对所有常见一维概率分布给出显式、可构造的几何实现。我们证明:每个一维分布(无论连续、离散或奇异)都唯一对应一条平面曲线、一个点集或一个分形轮廓,使得累积分布函数成为曲线下的有向面积,概率密度函数成为局部斜率或曲率,分位数成为等面积分割点。具体地:均匀分布→水平线段;二项分布→带权格的离散点列;泊松分布→指数衰减塔几何;指数/伽马分布→幂律轮廓下的面积;贝塔分布→曲率调制的圆弧;正态分布→抛物面截线;柯西分布→有理曲线;以及退化、两点、几何分布等。我们证明了这些实现是自然的(符合Gibbs形式 h=-\log p),且基本运算(如卷积、极限定理)对应于几何操作(如曲线叠加、豪斯多夫收敛)。本文为概率论的完全几何化提供了第二块基石:所有一维分布都已“画出”。


关键词

一维概率分布;几何实现;累积分布函数面积;分位数几何;概率-几何同构


---


§1 引言


论文1建立了概率-几何同构的一般框架:每个概率分布 p(x)d\nu(x) 对应一个几何势函数 h(x)=-\log p(x)(相对于参考测度 \nu),使得概率成为加权体积 \int e^{-h}d\nu。但那个构造是抽象的:h 是函数,不是直观的“图形”。本文的目标是:对每个常用一维分布,在平面上画出一条具体的曲线或点集,使得概率计算等价于几何度量。


我们将采用两种等价几何实现:


1. 密度-高度实现:在直角坐标系中,令 y = p(x)(概率密度曲线)。那么事件 X \in [a,b] 的概率就是该曲线下的面积。这是最直观的“画出来”,但此时密度本身是高度,而非论文1中的势函数 h。两种视角可通过 h = -\log p 互换。

2. 势函数轮廓实现:令 y = h(x) = -\log p(x),此时概率峰对应势能谷。


为与论文1一致并便于后续高维推广,我们主要采用势函数轮廓实现,但也会给出密度曲线实现作为直观对照。


本文结构:§2给出构造的通用方法;§3–§7依次处理连续分布(均匀、指数/伽马、贝塔、正态、柯西等);§8处理离散分布(二项、泊松、几何等);§9处理奇异分布(如Cantor分布)作为拓展;§10证明这些实现的几何操作对应概率运算;§11总结。


---


§2 通用构造方法


对于定义在 \mathbb{R} 上(或子集)的分布,取参考测度 \nu 为Lebesgue测度(连续)或计数测度(离散)。几何实现由一条平面曲线 \Gamma = \{(x, h(x)) : x \in \text{supp}(p)\} 给出,其中 h(x) = -\log p(x)(连续情形)或 h(i) = -\log p_i(离散情形,点图)。概率通过加权弧长或面积体现?实际上,在论文1框架中,概率是 e^{-h}d\nu 的积分,即曲线下的指数高度的积分。但为了让图形更直接,我们可以绘制密度曲线 y=p(x),此时概率就是曲线下的面积。两种绘图方式等价,本文混用,根据直观性选择。


定义2.1(几何实现) 设 X 是一维随机变量,分布为 P。一个几何实现是一对 (C, \mu),其中 C \subset \mathbb{R}^2 是一条曲线(或点集),\mu 是 \mathbb{R}^2 上的一个参考测度(通常为1维勒贝格测度或计数),使得对于任何区间 [a,b],有 P(a \le X \le b) = \int_{C \cap ([a,b]\times \mathbb{R})} d\mu(即曲线在区间上的某类长度或下方面积)。具体地,我们采用两种标准实现:


· 密度曲线实现:C_d = \{(x, p(x)) : x \in \mathbb{R}\},概率 = \int_a^b p(x) dx = 曲线下的面积。

· 势函数实现:C_h = \{(x, h(x)) : x \in \mathbb{R}\},概率 = \int_a^b e^{-h(x)} dx,这不是曲线下的面积,而是指数因子的积分,不直观。故本文主要使用密度曲线实现,但明确指出与论文1的势函数关系:h=-\log p。


因此,本文的“画出来”指绘制密度函数图形。这完全符合“概率 = 面积”的几何直观。


---


§3 均匀分布


分布:X \sim U(a,b),密度 p(x) = 1/(b-a),x \in [a,b]。


几何实现:一条水平线段从 (a, 1/(b-a)) 到 (b, 1/(b-a))。概率 P(c \le X \le d) = (d-c)/(b-a) 正好是水平线下从 c 到 d 的矩形面积。


势函数:h(x) = \log(b-a) 常数,因此轮廓是一条水平直线。这与“平坦几何”对应。


几何特征:水平线的高度反映了分布的离散程度:越宽的均匀分布,水平线越低(密度越小)。


---


§4 指数分布与伽马分布


4.1 指数分布


X \sim \mathrm{Exp}(\lambda),p(x) = \lambda e^{-\lambda x},x \ge 0。


几何实现:曲线 y = \lambda e^{-\lambda x},从 (0,\lambda) 指数衰减到 0。概率 P(X > t) = e^{-\lambda t} 是曲线下从 t 到无穷的尾部面积。


势函数:h(x) = -\log\lambda + \lambda x,是一条斜率为 \lambda 的直线(上升)。这意味着指数分布的几何轮廓是一条倾斜直线,概率衰减对应于斜率的陡峭程度。


几何操作:无记忆性 P(X>t+s|X>t)=P(X>s) 对应几何上的自相似性:曲线从 t 开始的尾部形状与整体形状相似,只是缩放。


4.2 伽马分布


X \sim \mathrm{Gamma}(k,\theta),p(x) = \frac{1}{\Gamma(k)\theta^k} x^{k-1} e^{-x/\theta},x>0。


几何实现:曲线在 x=0 附近行为 x^{k-1}(若 k>1 从0上升;若 k=1 即指数;若 k<1 在0处发散但积分有限)。峰值出现在 x=(k-1)\theta。势函数 h(x) = -\log p(x) = \text{常数} - (k-1)\log x + x/\theta,这是一个对数-线性混合轮廓。


几何意义:伽马族通过形状参数 k 调制曲线从陡峭到平缓。当 k 很大时,由中心极限定理,曲线趋近于正态钟形(见§7)。


---


§5 贝塔分布


X \sim \mathrm{Beta}(\alpha,\beta),p(x) = \frac{1}{B(\alpha,\beta)} x^{\alpha-1}(1-x)^{\beta-1},x\in[0,1]。


几何实现:曲线在单位区间上,端点行为由 \alpha,\beta 控制。\alpha=1,\beta=1 时是均匀分布(水平线)。\alpha=2,\beta=2 时是拱形(抛物线型)。\alpha=0.5,\beta=0.5 时是U形(两端无穷高但积分有限)。势函数:h(x) = -\log B(\alpha,\beta) - (\alpha-1)\log x - (\beta-1)\log(1-x),在端点处对数发散。


几何操作:贝塔分布可表示为独立伽马变量的变换 X = \frac{G_\alpha}{G_\alpha+G_\beta},几何上对应于从二维伽马曲面到单位线段的投影(论文3中会详述)。


---


§6 正态分布


X \sim N(\mu,\sigma^2),p(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-(x-\mu)^2/(2\sigma^2)}。


几何实现:著名的钟形曲线。势函数 h(x) = \frac{(x-\mu)^2}{2\sigma^2} + \log(\sigma\sqrt{2\pi}),是一条抛物线(开口向上)。因此正态分布的几何轮廓就是抛物线。这正是论文1的出发点。


几何特征:


· 方差 \sigma^2 控制抛物线的宽度(曲率):曲率越大,曲线越陡,方差越小。

· 均值 \mu 控制顶点的水平位置。

· 标准正态的抛物线为 y = x^2/2(忽略常数)。


中心极限定理的几何版本:任意满足条件的独立同分布随机变量和,其密度的几何轮廓(势函数)经适当缩放后趋近于抛物线。这将在论文4中严格证明。


---


§7 其他连续分布:柯西、拉普拉斯、对数正态


7.1 柯西分布


p(x) = \frac{1}{\pi\gamma\left[1+\left(\frac{x-x_0}{\gamma}\right)^2\right]}。


几何实现:钟形但尾部比正态更厚,衰减如 1/x^2。势函数 h(x) = \log(\pi\gamma) + \log\left(1+((x-x_0)/\gamma)^2\right),是对数二次型。曲线在远处近似为 2\log|x|,缓慢上升。


7.2 拉普拉斯分布


p(x) = \frac{1}{2b} e^{-|x-\mu|/b}。


几何实现:在 \mu 处有一个尖峰,两侧指数衰减。密度曲线像一顶“帐篷”。势函数 h(x) = |x-\mu|/b + \log(2b),是V形(绝对值函数)。这是分片线性轮廓。


7.3 对数正态分布


X = e^Y,Y \sim N(\mu,\sigma^2),p_X(x) = \frac{1}{x\sigma\sqrt{2\pi}} e^{-(\log x-\mu)^2/(2\sigma^2)},x>0。


几何实现:曲线在0处趋于0,然后上升再下降,右偏。势函数 h(x) = \frac{(\log x-\mu)^2}{2\sigma^2} + \log(x\sigma\sqrt{2\pi}),包含对数项。注意这不是简单的抛物线变形。


---


§8 离散分布


对于离散分布,我们采用点线图:在 x=i 处绘制高度 p_i 的垂直线段(或点),概率就是各点高度之和(面积为离散条柱)。势函数实现:点 (i, -\log p_i)。


8.1 二项分布


X \sim \mathrm{Bin}(n,p),p_k = \binom{n}{k}p^k(1-p)^{n-k},k=0,1,\dots,n。


几何实现:在整数点 k 处画高度为 p_k 的垂线段(或点)。当 n 增大,点图的轮廓近似于正态钟形(棣莫弗-拉普拉斯定理)。势函数点 (k, -\log p_k) 近似抛物线。


8.2 泊松分布


X \sim \mathrm{Poisson}(\lambda),p_k = e^{-\lambda}\lambda^k/k!。


几何实现:点图在 k\approx\lambda 处达到峰值,尾部衰减。势函数 -\log p_k = \lambda - k\log\lambda + \log(k!),对于大 k,由斯特林公式近似为 k\log k - k - k\log\lambda + \ldots,近似于 k\log(k/\lambda),不是二次型,但泊松分布当 \lambda 大时趋近正态(中心极限定理)。


8.3 几何分布


X \sim \mathrm{Geom}(p)(第一次成功所需的试验次数),p_k = (1-p)^{k-1}p,k=1,2,\dots。


几何实现:点图呈指数衰减。势函数 -\log p_k = -\log p - (k-1)\log(1-p),是线性函数(等差数列)。这与指数分布的势函数(线性上升)完全类似,只是离散版本。


几何-概率对应:无记忆性表现为点列尾部与整体相似(等比数列)。


---


§9 奇异分布:Cantor分布


作为一维几何实现的极端测试,考虑Cantor三分集上的均匀分布(Cantor分布)。它既不是连续(无密度)也不是离散,而是奇异连续。


几何实现:Cantor集本身是一个分形,其Cantor函数 F(x) 连续且单调,导数几乎处处为0。我们无法用通常的密度曲线,但可以用分形几何:将Cantor集的每个区间赋予质量,其分布函数是“魔鬼阶梯”。在几何上,我们可以绘制点 (x, F(x)) 的图形,它是一条处处平坦但整体上升的曲线(分形曲线)。概率 P(a\le X\le b) = F(b)-F(a) 就是曲线上两点纵坐标差。


势函数形式:由于没有密度,h 需要推广为广义函数(如测度势),但我们可以用分布函数本身作为几何实现。这展示了框架的包容性。


---


§10 几何操作对应概率运算


10.1 分位数


分位数 q_\alpha 满足 P(X \le q_\alpha)=\alpha。在密度曲线实现下,q_\alpha 是使得曲线下面积从左边积累到 \alpha 的横坐标。这等价于求累积分布函数的反函数。几何上,我们可以用等面积分割法找到分位数。


10.2 卷积


设 X,Y 独立,Z=X+Y 的密度是卷积 p_Z = p_X * p_Y。在几何上,卷积对应于密度曲线的滑动乘积积分。对于势函数,卷积没有简单的加法,但可以通过傅里叶变换(即几何上的特征函数)变得简单。论文5中将展示,随机游走的多次卷积对应于几何轮廓的平滑化。


10.3 极限定理


· 二项分布当 n\to\infty 时(固定 p)点图轮廓趋于正态钟形。

· 泊松分布当 \lambda\to\infty 时趋于正态。

· 中心极限定理说:大量独立同分布随机变量和的密度曲线(适当标准化)趋于抛物线势(正态)。几何上,这是曲线形状的收敛。


10.4 熵与几何


微分熵 H = -\int p\log p \, dx = \int h(x) p(x) dx,即势函数 h 关于概率的期望。在几何上,熵等于曲线下方加权平均高度(或势函数的均值)。这建立了信息论与几何的联系。


---


§11 总结与展望


本文对所有常用一维分布给出了显式的几何图形(曲线或点图),证明概率计算(面积、分位数、尾部概率)等价于几何度量。这些图形不仅直观,而且为论文3(多维)、论文4(公理)、论文5(过程)提供了具体验证。特别地,正态分布的抛物线形象成为中心极限定理几何解释的基石。


我们强调:本文不是“把分布画出来”的科普,而是严格证明每个分布都有一个自然的几何实现(密度曲线或势函数曲线),且所有概率性质都可以从图形中读出。这为概率论的几何统一提供了第二块基石——第一块是论文1的同构框架,第二块是本文的一维实例库。


下一步(论文3)将把一维曲线推广为高维超曲面,并展示边缘化、条件化等运算的几何对应。


---


附录A:常见分布几何实现一览表


分布 密度曲线形状 势函数曲线 几何特征

均匀 水平线段 水平直线 平坦

指数 指数衰减 斜直线 线性势

伽马 单峰右偏 对数+线性 峰值可调

贝塔 区间内U或钟形 对数端点发散 端点控制

正态 钟形 抛物线 二次势

柯西 厚尾钟形 对数二次 尾部平坦

拉普拉斯 尖峰帐篷 V形 绝对值势

对数正态 右偏峰 对数平方+线性 偏态

二项(点) 离散钟形 近抛物线 逼近正态

泊松(点) 偏态峰 对数阶乘 逼近正态

几何(点) 指数衰减 线性 无记忆


---


附录B:几何验证示例——正态分布的68-95-99.7法则


在正态密度曲线下,均值±1σ范围内的面积约为0.6827,±2σ约为0.9545,±3σ约为0.9973。几何上,这对应于抛物线 h(x)=x^2/2 的指数 e^{-x^2/2} 下的面积。这些数值通过积分得到,完全等价于概率计算。因此,正态分布的几何图形直接包含了所有概率信息。


---


参考文献


[1] 张苏杭. 概率-几何同构的基础范式: 从高斯分布到一般测度对应, 2026. (论文1)


[2] 陈希孺. 概率论与数理统计. 中国科学技术大学出版社, 2009. (常见分布汇总)


[3] Billingsley, P. Probability and Measure. Wiley, 1995. (测度论基础)


[4] Devroye, L. Non-Uniform Random Variate Generation. Springer, 1986. (分布的几何图示)


[5] Mandelbrot, B. The Fractal Geometry of Nature. Freeman, 1982. (Cantor分布分形)


---


(正文完)


喜歡作者的文章嗎?馬上按「關注」,當作者發佈新文章時,思書™就會 email 通知您。

思書是公開的寫作平台,創新的多筆名寫作方式,能用不同的筆名探索不同的寫作內容,無限寫作創意,如果您喜歡寫作分享,一定要來試試! 《 加入思書》

思書™是自由寫作平台,本文為作者之個人意見。


文章資訊

本文摘自:
Categories:

Total: 3658 words


分享這篇文章:



參與討論!
現在就加入《思書》,馬上參與討論!
《思書》是一個每個人的寫作與論壇平台,特有的隱私管理,用筆名來區隔你討論內容,讓你的討論更深入,而且免費。 趕快來試試!
還未加入《思書》? 現在就登錄! 已經加入《思書》── 登入


看看作者的其他文章


看看思書的其他文章



×
登入
申請帳號

需要幫助
關於思書

暗黑模式?
字體大小
成人內容未過濾
更改語言版本?