常见的8个概率分布公式和可视化
概率和统计知识是数据科学和机器学习的核心;我们需要统计和概率知识来有效地收集、审查、分析数据 。
现实世界中有几个现象实例被认为是统计性质的(即天气数据、销售数据、财务数据等) 。 这意味着在某些情况下 , 我们已经能够开发出方法来帮助我们通过可以描述数据特征的数学函数来模拟自然 。
“概率分布是一个数学函数 , 它给出了实验中不同可能结果的发生概率 。 ”
了解数据的分布有助于更好地模拟我们周围的世界 。 它可以帮助我们确定各种结果的可能性 , 或估计事件的可变性 。 所有这些都使得了解不同的概率分布在数据科学和机器学习中非常有价值 。
文章图片
在本文中 , 我们将介绍一些常见的分布并通过Python代码进行可视化以直观地显示它们 。
最直接的分布是均匀分布 。 均匀分布是一种概率分布 , 其中所有结果的可能性均等 。 例如 , 如果我们掷一个公平的骰子 , 落在任何数字上的概率是1/6 。 这是一个离散的均匀分布 。
文章图片
但是并不是所有的均匀分布都是离散的——它们也可以是连续的 。 它们可以在指定范围内取任何实际值 。 a和b之间连续均匀分布的概率密度函数(PDF)如下:
文章图片
让我们看看如何在Python中对它们进行编码:
importnumpyasnpimportmatplotlib.pyplotaspltfromscipyimportstats#forcontinuousa=0b=50size=5000X_continuous=np.linspace(a,b,size)continuous_uniform=stats.uniform(loc=a,scale=b)continuous_uniform_pdf=continuous_uniform.pdf(X_continuous)#fordiscreteX_discrete=np.arange(1,7)discrete_uniform=stats.randint(1,7)discrete_uniform_pmf=discrete_uniform.pmf(X_discrete)#plotbothtablesfig,ax=plt.subplots(nrows=1,ncols=2,figsize=(15,5))#discreteplotax[0].bar(X_discrete,discrete_uniform_pmf)ax[0].set_xlabel("X")ax[0].set_ylabel("Probability")ax[0].set_title("DiscreteUniformDistribution")#continuousplotax[1].plot(X_continuous,continuous_uniform_pdf)ax[1].set_xlabel("X")ax[1].set_ylabel("Probability")ax[1].set_title("ContinuousUniformDistribution")plt.show()
文章图片
高斯分布可能是最常听到也熟悉的分布 。 它有几个名字:有人称它为钟形曲线 , 因为它的概率图看起来像一个钟形 , 有人称它为高斯分布 , 因为首先描述它的德国数学家卡尔·高斯命名 , 还有一些人称它为正态分布 , 因为早期的统计学家注意到它一遍又一遍地再次发生 。
正态分布的概率密度函数如下:
文章图片
σ是标准偏差 , μ是分布的平均值 。 要注意的是 , 在正态分布中 , 均值、众数和中位数都是相等的 。
当我们绘制正态分布的随机变量时 , 曲线围绕均值对称——一半的值在中心的左侧 , 一半在中心的右侧 。 并且 , 曲线下的总面积为1 。
mu=0variance=1sigma=np.sqrt(variance)x=np.linspace(mu-3*sigma,mu+3*sigma,100)plt.subplots(figsize=(8,5))plt.plot(x,stats.norm.pdf(x,mu,sigma))plt.title("NormalDistribution")plt.show()
文章图片
对于正态分布来说 。 经验规则告诉我们数据的百分比落在平均值的一定数量的标准偏差内 。 这些百分比是:
68%的数据落在平均值的一个标准差内 。
95%的数据落在平均值的两个标准差内 。
99.7%的数据落在平均值的三个标准差范围内 。
- 苹果|首个“香港制造”碳化硅模块的计划
- 华为|当平板拥有了Windows系统,最轻便的笔记本华为MateBook E就此诞生
- 自贡|自贡移动与中国移动不得不说的故事
- 软件|珍藏已久的4款压箱底实用软件,好用到你无可挑剔
- 3g|强大到没有对手的Aggregate函数,碾压Sum等19个函数,你真的会吗
- apu|AMD的锐龙7000系APU核显比RTX 3060强,等等党胜利
- iOS|iOS15.5Beta2重度使用2天,不吹不黑,13用户说几点不一样的体验
- 这37款APP被通报!有你用的吗?
- Intel12代酷睿升级了长方形的LGA1700接口|12代酷睿弯了!中国玩家发明矫正神器 只需39元
- 苹果|不管苹果怎么说,你的iOS程序可能仍在暗中跟踪你