1.首先,概率统计中的“矩”是什么?

比方说,我们感兴趣的是随机变量X。 矩是X的期望值,例如E(X),E(X²),E(X³)等。 第一矩是E(X), 第二矩是E(X²), 第三矩是E(X³), … 第n个矩是E(X ^ n)。
当然,我们非常熟悉前两个矩,均值μ= E(X)和方差E(X²)−μ²。它们是X的重要特征。 平均值是 平均值,方差是分布的分布程度。但是,必须有其他的特征来定义分布。例如,第三矩是分布的不对称性。第四关是尾巴有多沉、多厚。
image.png

这些矩告诉您有关分布的信息。

2.什么是矩产生函数(MGF)?

顾名思义,MGF实际上是生成矩的函数 E(X),E(X²),E(X³),…,E(X ^ n)。也就是”矩“的母亲,够通俗吧。
image.png

矩母函数的定义: 如果看一下MGF的定义,您可能会说……
“我对了解E(e ^ tx)并不感兴趣。我要E(X ^ n)”
取n次MGF的导数并令t = 0。然后,您将得到E(X ^ n)。
image.png

这就是您从MGF那里获取矩(moments)的方式。

3.给我看证明。为什么第n个矩是MGF的第n个导数?

我们将使用泰勒级数证明这一点。

image.png

然后取期望值。

image.png

现在,对t取一个导数。

image.png

如果对③取另一种导数(因此取两次),则将得到E(X²)。 如果您采用另一个(三阶)导数,则将得到E(X³),依此类推…… 当我第一次看到矩生成函数时,我无法理解t在函数中的作用,因为t似乎是我不感兴趣的任意变量。但是,如您所见,t是辅助变量。我们引入t是为了能够使用演算(导数)并使(我们不感兴趣的)项为零。 等等…
但是我们可以直接了当,使用期望值的定义来计算弯。为什么我们还需要MGF?

image.png

预期值的定义 4.为什么我们需要MGF? 为了方便,哈哈 当然是我们希望MGF可以轻松计算矩。 但是,为什么MGF比定义期望值更容易? 在我的数学教科书中,他们总是问我“请找出计算二项式(n,p),泊松(λ),指数(λ),正态(0,1)等的函数的矩。” 但是,他们从未真正向我展示过为什么MGF会如此有用以至于它们激发喜悦。
我认为以下示例会给您带来喜悦,最简单的示例显示MGF更容易:指数分布的MGF。 我们将从PDF开始。
image.png
指数分布的PDF

image.png
导出指数的MGF。

image.png

对于存在的MGF,应该存在期望值E(e ^ tx)。 这就是为什么“ t-λ<0”是要满足的重要条件的原因,因为,不满足积分将不会收敛。(这称为散度检验,这是在尝试确定积分是收敛还是发散时首先要检查的内容。) 一旦有了MGF:λ/(λ-t),计算矩就变成了求导数的问题,这比积分更容易直接计算期望值。
使用MGF,可以通过求导数而不是积分来查找矩!
注意事项:

  1. 对于任何有效的MGF,M(0)= 1,每当您计算MGF时,插入t = 0并查看是否得到1。
  2. 矩提供了一种指定分布的方法。例如,您可以在前两个矩(均值和方差)完全指定正态分布。当您知道分布的多个不同矩时,您将了解有关该分布的更多信息。如果有一个您没有认识的人,并且您知道他们的身高,体重,肤色,喜爱的爱好等,您仍然不一定完全了解他们,但是正在获得关于他们的越来越多的信息。
  3. MGF的优点在于,一旦有了MGF(一旦存在期望值),您就可以得到第n个矩。MGF将随机变量的所有矩编码为一个函数,以后可以再次从中提取它们。
  4. 概率分布由其MGF唯一确定。如果两个随机变量具有相同的MGF,则它们必须具有相同的分布。
  5. 对于那些对术语“矩”感到好奇的人(像我一样):为什么一个矩称为矩?
  6. 分布的重要特征之一是它的尾巴有多沉重,尤其是对于金融风险管理而言。如果您还记得2009年的金融危机,那实际上就是无法解决罕见事件发生的可能性。风险管理人员低估了基金交易头寸中的许多金融证券的峰度(峰度在希腊语中是指“凸起”)。有时,假设的风险曲线平滑的随机分布可能会在其中隐藏凸起。而且我们可以检测到使用MGF的人员!