第2章 数量

学科介绍
数量分析即定量分析,是一种基础的金融分析工具;它运用各种数学模型来分析预测一个金融商品在未来会达到的价位水平。数量分析同时也能帮助我们评估出与投资者承担风险相对应的收益回报,它通过数学模型直接呈现出风险和收益的正相关关系。投资者运用数量分析所追求的目标在于保值投资资产,而非使其获得最大化的收益。现如今,数量分析已被许多跨国集团和国际基金广泛使用。
数量工具可以测算投资组合之间的关联性,计算投资项目盈亏发生概率,从而为分析师和投资者制定合理的投资规划提供技术支撑。数量分析也是CFA一二级考试中所占比重较大的考试科目之一。
何老师说
数量在CFA一级考试中占比10%,上下午共计24道题目左右,内容整体比较简单,是基础学科之一。但由于其涉及许多数学方面的知识,所以考生自己看书理解会相对比较困难,和固定收益以及权益类收益学科不同,这门学科的特点是难学不难考。
数量总共分为三大部分。第一部分是货币的时间价值,相关题目在考试中所占比例不大,但其内容却是后续章节的基础;第二部分是概率论和统计学,其内容比较简单,但内涵数量考试的核心考点;第三部分是推断性统计,其内容较难,是数量考试的重点内容。

1 货币的时间价值

本节说明
本节围绕着货币时间价值这一知识点为考生介绍了各类数量入门的基础概念。本节的学习重点在于计算,尤其是对单笔、多笔年金的现值和终值的计算。此外,出于实战的考虑,考生应当能够熟练运用计算器计算货币时间价值的相关考题。考虑到CFA一级考试题量很大,因此对考生使用计算器的熟练程度也有着很高的要求。
知识点自查清单
·利率的解释★
·有效年利率(EAR)★★
·货币时间价值的计算
何老师说
如何理解货币时间价值?简而言之,货币时间价值传达了这样一个理念:今天的1元钱不等于明天的1元钱。为什么会有货币时间价值?因为货币的时间价值反映了利息(利率)的概念,今天的1元钱存入银行,银行会给你一天的利息,这样,今天的1元钱的价值就大于明天的1元钱的价值。

1.1 利率的解释

1.1.1 利率解释的3个层次
利率(interest rate)表示一定时期内所得利息与本金的比率。我们通常用百分比形式表示利率,按年计算的利率则称为年利率。
利率是衡量货币时间价值的工具,不同投资产品的风险是不同的。这就导致了不同投资产品利率水平的差异。通常,市场上一个投资项目被资金的供求关系所左右决定的利率水平被称为均衡利率水平。
利率还可以被看作是折现率的表现形式或者人们当前消费的机会成本。如何理解折现率的概念呢?我们假设一个投资者可以以15%的利率借入资金投资一个项目,那么在计算该投资项目所能带来的未来现金流的现值时,该投资者采用的折现率水平也应当是15%;如果该投资者通过特殊渠道可以以8%的利率水平借入资金投资原项目,那么此时在计算该项目的净现值时,我们就应当使用8%的折现率水平。现在我们假设上述的投资者不去投资项目,而是用借来的钱购买年化收益率为12%的银行理财产品,那么对于投资项目而言,该投资者的机会成本就是购买理财产品所获取的12%的年化收益率。
下面我们再具体介绍一下要求回报率、机会成本和折现率的概念。
1.要求回报率★
要求回报率,简称要求回报(required return),是投资者在考虑了投资资产的风险后,在一段时间内对投资资产要求的最低限度的预期回报率,它也是人们进行一项投资所必须赚取的报酬。要求回报也代表了投资的机会成本,即资本投资于其他所有风险水平类似的资产可以获得的最高预期回报率。比如A借给B 100元钱,要求B一年后归还110元钱,这多出的10元就是B给A的要求回报。
·要求回报率受到资金供求关系的影响:当资金供给大于需求时,要求回报率下降;当资金供给小于需求时,要求回报率上升。
2.机会成本★★
机会成本是指投资者在面临多选一的投资项目抉择时,被舍弃的选项中具有最高价值的选项的成本。它也指厂商把相同的生产要素投入其他行业可以获得的最高收益。
我们假设你今天学习了一上午的CFA课程,如果你没有学习CFA,你可以选择看电影或者约会。由于时间是有限的,所以你学习CFA就不能做其他事情。假定学习CFA能给你带来100单位的效用,看电影所能获得的效用是80,约会所能获得的效用是50。所以上午的时间如果不用于学习CFA,那么我们最好应该选择去看电影(80单位的效用),即学习CFA的机会成本等于80。
3.折现率★
折现率(discount rate)是指将未来预期收益折算成现值时所用的折现比率。分期付款购入的固定资产的折现率实质上就是提供贷款企业的所要求的必要报酬率。
终值与现值的转换公式可以表示为:FV=PV(1+r),其中FV代表终值,PV代表现值,r代表要求回报率。如果我们已知终值,要求现值,则改写上述公式:PV=FV/(1+r)t,其中的r’指折现率。
1.1.2 收益率的分解
收益率的分解(decompose required rate of return)是指把利率拆分成实际的无风险利率、预期的通货膨胀,以及补偿投资者不同种类风险的风险溢价等几个部分,这样的分解有利于我们更加深入地理解利率水平的构成。
1.无风险利率
无风险利率(risk-free rate)是指投资者在没有任何不确定因素的条件下能够获得的收益率。在现实中,我们一般把银行存款和短期国债当作是无风险的投资资产。投资者在市场上所能观察到的无风险利率都是名义无风险利率,它与实际无风险利率存在一定的差别。
实际无风险利率是假定在没有预期通货膨胀的情况下的理论利率,或者它已经调整了通货膨胀因素的影响;但在现实中,因为预期的通货膨胀率不为零,因此产生了名义无风险利率的概念。所有的名义无风险利率都包含了通货膨胀溢价。这两种无风险利率的近似、精确关系表达如表2-1所示。
表2-1 名义无风险利率与实际无风险利率的关系

2.风险补偿★
风险溢价(risk premium):相较于无风险收益的产品,人们对高风险的投资产品有着更多的顾虑和担心,因此风险投资产品会提供更高的要求回报率,要求回报率中大于无风险收益的部分即为风险溢价。不同风险类型的性质、大小决定了风险溢价的大小。这些风险类型主要包括以下内容。
·违约风险(default risk):反映了借款人没有按期全额支付本金以及利息的风险。除了上述已经发生的风险,违约风险还可以包括投资产品的发行人因为信用评级下调所带来的潜在违约风险。
·流动性风险(liquidity risk):反映了资产在变卖时,变卖资产收入小于当期投资公允价值的风险。应注意所有商品只要价格足够低都可以在市场上进行变现,但是我们这里关注的是商品能否足额变现,即商品变卖的价格能否等于其公允价值。
·期限风险(maturity risk):投资期限越长,发生不确定性事件的概率就越大,这印证了中国的一句古话“夜长梦多”。因此,期限较长的投资产品比其他条件相同的期限较短的该类投资产品包含了更大的期限风险,所以期限较长的投资产品会有一个更高的风险溢价作为风险补偿给投资者。
相比较流动性强、期限短、无违约风险的投资产品,以上提到的各种风险因素都会以风险溢价的形式添加到风险资产的名义无风险利率中,从而得到以下公式:
一般证券的要求回报利率=名义无风险利率+违约风险溢价+流动性风险溢价+期限风险溢价
required interest rate on a security=nominal risk-free rate+default risk premium+liquidity risk premium+maturity risk premium
何老师说
投资的要求回报率取决于什么呢?举例:你把一笔资金投资给了房地产开发商。那么,房地产开发商至少需要返还给你一个无风险利率的回报。此外,开发商开发房地产存在亏损的风险,我们为此也承担了一定的连带风险。所以,房地产开发商需要再额外提供给我们一定的风险补偿。

1.2 有效年利率★★

有效年利率(effective annual return,EAR)是一种计算投资产品年度复合收益的方法,即在本期收益基础上将利息记入本金再投资的年度收益率。它是考虑了复利因素的收益概念。
市场上最常见的利率报价形式是以年度利率(投资期为1年)的形式报价。例如,报价利率为10%,并声明每半年度复利一次。如果我们想要得到半年期的利率以及季度利率水平就必须自行计算。接下来我们将介绍有效年利率(EAR)的概念,它表示在投资期,投资者在经过复利投资后真正的投资收益。
EAR的计算公式如下。

式中 r——1期投资期间收益率;
m——1年之中投资期(计息期)的期数。
如果是以半年为一个投资期(计息期),那么m=2;如果以一个季度为一个投资期,则m=4。
如果投资者按连续复利的形式进行投资,即利息每时每刻都记入本金参与下一期的投资,那么m趋向于+∞,EAR的计算公式可改写为EAR=er-1
计息的频率越高(投资期越短),EAR越大。
在给定利率水平的前提下,连续复利形式求得的EAR最大。
何老师说
假定名义利率是10%,投资期期限为1年,那么按年计息、按月计息以及按季度计息的投资产品的有效年利率是各不相同的。事实上,只有按年计息的投资产品,其名义利率才等于其有效年利率。假定名义年利率恒定不变,计息的频率越高,投资者获得的有效年利率也就越大。
举例说明:A在0时刻往银行存入1元,银行1年期的收益率为10%,假设银行按年付息,那么1年后A可以拿到(1+10%)元(见图2-1)。可如果银行决定半年付息一次,半年的利率即为5%,那么按复利进行计算,半年后A拿到的1×(1+5%)元将作为本金继续产生利息,于是1年后A共收到本息(1+5%)+(1+5%)×5%,其1年内实际产生的收益率为[(1+5%)2-1](见图2-2)。

图2-1 A的投资按年付息的收益计算

图2-2 A的投资按半年付息一次的收益计算
【例题】
1.基金经理Jim正在分析其管理的养老金的业绩,他正着手计算该基金的有效年利率(EAR)。假设条件如下所示:
1)名义利率为9%。
2)该养老金基金投资按每月计算一次复利。
解答:
因为按照每月计算复利,并且1年内有12个投资周期(月),所以m=12。
单期利率(periodic rate)=9/12=0.75%
EAR=(1+periodic rate)m-1=(1+0.75%)12-1=1.0938-1=9.38%
2.沿用上例,基金经理Jim对该养老金做出了不同的计息频率假设,计算有效年利率(EAR)。
根据不同的复利频率,计算按照每半年、每季度、每月、每天计复利的有效年利率(假设名义利率是15%)。
答案:解答方法和步骤如表2-2所示。
表2-2 解答方法与步骤

通过上述计算我们不难看出,假定名义利率不变,随着计息频率越来越频繁,得到的有效年利率就越大。当计息的期限无限短,即利息每时每刻都记入本金参与下一期的投资时,m就趋向于+∞,这样,EAR就变成了连续复利的利率形式下的EAR。借助数学推导以及指数函数,我们得到该类EAR的公示表达:EAR=er-1。在此例中,具体如下。

1.3 货币时间价值的计算

1.3.1 基本概念
货币是具备时间价值的,同样数目的资金现在的价值和1年后的价值是不一样的,它现在的价值与1年以前的价值也是不一样的。我们要弄明白货币的时间价值,就先要弄清楚以下几个基本概念。
现值是指从当前时刻出发,未来某个时间点上一笔现金流所对应的当前时刻的价值。如上节所述,我们计算货币现值的过程就是对其折现的过程,其中使用到的利率就是折现率,也称要求回报率。
终值是指现在一定量的资金在未来某一时点上的具体价值,终值又称为复合价值。
现值、终值及连续复利的区别如表2-3所示。
表2-3 现值、终值及连续复利的区别

【例题】
1.计算下面单笔现金流的现值,假设条件如下:
某保险公司推出了一项担保投资合约,该合约承诺在未来第10年给予投资该合约的投资者一笔6000元的捐赠。假设未来10年的平均投资收益率为10%,那么现在投资者应当为此合约支付的合理价格是多少?
解答:

由此不难看出考虑到在10%的收益率水平下,当前2313元的金额等于10年后6000元的金额(见图2-3)。

图2-3 单笔现金流的现值计算(一)
方法二:在考试中,我们通常使用计算器上的现金流功能键求解现金流的计算问题。计算器在求解多笔现金流时所体现出的快速优势非常明显。这种解题的操作方法如下,在计算器中录入以下数据:
I/Y=10;N=10;PMT=0;FV=-6000;CPT→PV=2313.26
式中 N——计息期数;
I/Y——投资期(1期)内的利率水平;
PV——现值,FV代表终值;
PMT——计息期间每一期的现金流流入或者流出的数值。
注意:在录入数据的过程中,PV与FV在计算器中呈现的正负关系是相反的,这是因为我们假定现值和终值这两个数据一个被看作流入的现金流,另一个被看作流出的现金流。所以上例中在计算器录入数据时,我们把FV设定为-6000。这样的设置能使计算器得到的PV是一个正数;如果输入的FV是正数,那么我们对于计算结果PV=-2313.26前面的负号则可以忽视,取其绝对值即可。
2.计算下面单笔现金流的终值,假设条件如下:
1)某投资基金在当前投资了6000元的大盘指数。
2)假设未来10年大盘指数的回报率为10%,那么该基金在未来第10年的终值是多少?
解答:(见图2-4)

图2-4 单笔现金流的现值计算(二)
方法一:FV=6000×(1+0.1)10=15562.45(元)
考虑到10%的回报率水平,当前的6000元与10年后的15562.45元的价值是相当的。
方法二:在计算器中录入以下数据:
I/Y=10;N=10;PMT=0;PV=-6000;CPT→FV=15562.45
1.3.2 年金★★
年金(annuity):一组有限的持续的现金流序列。年金的形式具体分为以下三类。
1.普通年金
普通年金(ordinary annuity)又称后付年金,这是最为常见的年金表现形式。普通年金的现金流都发生在每个计息期间结束时的时间点上。接下来我们通过例题的形式,讲解一下普通年金现值和终值的求解方法。注意到例题里的普通年金有如下特点:不同时间点上发生的现金流数额是相等的。
何老师说
在计算年金的时候,需要使用到的是计算器中第三行的按键,我们只要知道其中任意四个键对应的数值,就可以求得剩下一个按键对应的数值,其中:
N=期数;
I/Y=每一期的利率;
PV=现值;
FV=终值;
PMT=每一期的期间现金流。
【例题】
1.计算普通年金的终值,假设条件如下:
1)投资者小王计划购买一款金融产品,该金融产品承诺在未来10年每年的年底支付给该投资者200元。
2)假设年化的要求回报率为8%,计算该金融产品所提供现金流的终值。
解答:(见图2-5)

图2-5 普通年金的终值计算
因为支付发生在每年年末,所以该年金为普通年金,利用计算器输入:
I/Y=8;N=10;PMT=-200;PV=0;CPT→FV=2897.31
通过计算我们不难发现,如果不考虑货币的时间价值,这个为期10年的年金支付现金流的总和为10×200=2000(元);但该年金现金流的实际终值为2879.31元。为什么这两个数值会不一样呢?其原因在于利息的计算。其中差额部分879.31元反映的就是累计利息在8%年利率下的投资结果。
2.计算普通年金的现值
投资者小王计划购买一款金融产品,该金融产品承诺在未来10年每年的年底支付给该投资者300元。假设年化的要求回报率为9%,计算该金融产品的现值。
解答:(见图2-6)

图2-6 普通年金的现值计算
因为每笔年金支付发生在每年年末,所以该年金为普通年金,利用计算器输入以下数据:
I/Y=9;N=10;PMT=-300;FV=0;CPT→PV=1925.30
计算结果展示了在当前的收益率水平下,投资者小王为了能在接下来10年中每年年底都获得300元回报,现在所需要投资的金额。
3.计算起始时间在N期之后的普通年金
假设养老金基金的管理者Jim希望他所管理的养老金账户能够在未来第四年年末开始,每年年底支付20000元,连续支付25年。当前市场上未来25年的平均回报率为5%,计算这一养老金账户现在应该预备多少金额的投资准备。
解答:(见图2-7)

图2-7 起始时间在N期之后的普通年金计算
首先,计算该年金在第三年年初时间点的价值PV3,利用计算器输入:
I/Y=5;N=25;PMT=-20000;FV=0;CPT→PV3=281878.89
接着,计算PV3当下的现值,利用计算器输入:
I/Y=5;N=3;PMT=0;FV=-281878.89;CPT→PV0=243497.58
此题中的数据都被当作普通年金对待。因为第一笔年金发生在第四年年末的时刻,因此我们计算出来的现值PV3就是在第四年年初,即第三年年末t=3时间点上的普通年金现金流的现值。之后再计算当前t=0时点上现金流的现值PV0时,需要再次对PV3进行3年期限的折现。
4.老柳是一个临近退休的工人(明年退休),他想购买债券以补贴其退休后前几年的生活,该类债券的假设条件如下:
1)每只债券的面值为1000元,并在第四年年末将按债券面值偿付。
2)投资期间,每只债券能在每年年末支付50元的利息用于该工人的生活补贴。
3)假定合适的折现率是6%,确定该工人购买该债券的合理价格。
解答:(见图2-8)

图2-8 债券合理价格的确定
例如,计算器输入:
PMT=-50;N=4;I/Y=6;FV=-1000;CPT→PV=965.35
计算这类例题,我们需要注意两点:首先,考试时要看懂题目,把不熟悉的债券形式转换为我们已知的年金形式;其次,由于PMT和FV的这两笔现金流都是债券发行人支付给投资者的(现金流流出),所以两者的运算符号应该相同。鉴于此,那么PV符号同PMT就应当相反。
2.先付年金
先付年金(annuity due)是指第一笔现金流发生在当前时刻,随后每笔现金流也都发生在计息期期初的年金。
我们可更改计算器中关于默认年金的支付方式的设置。按下计算器中的“2nd”按键后按下“PMT”按键,再按下“2nd”与“ENTER”功能键就实现了“先付年金”与“后付年金”的转化功能。当屏幕上显示“BGN”时,意为此时计算器默认年金支付方式为先付年金方式;当屏幕上显示“END”时,意为此时计算器默认年金支付方式为后付年金方式。按下“2nd”按键后再按“ENTER”按键便能在这两个模式间任意切换。
【例题】
1.关于先付年金的终值计算
投资者老王购买了一个金融产品,该产品将从现在开始在接下来每年年初支付200美元给投资者,总计支付5年。假定该投资品能够以5%的年利率进行投资,计算这项金融产品的终值。
解答:(见图2-9)

图2-9 先付年金的终值计算
方法一:将计算器调整到“BGN”(先付年金)的模式后输入:
I/Y=5;N=5;PMT=-200;CPT→FV=1160.38
方法二:依然利用计算器默认的“END”模式进行运算:
首先我们可以求得假使此年金是后付年金模式下的终值FVAE。
I/Y=5;N=5;PMT=-200;PV=0;CPT→FVAE=1105.12
因为先付年金每一笔现金流比同时间段的后付年金每笔现金流提早一期发放,所以在计算最终终值时,我们只须把后付年金模式下得到的终值乘以(1+折现率)即能得到先付年金的终值。在本例中:
FVAB=FVAE×(1+I/Y)=1105.12×1.05=1160.38(美元)
2.关于先付年金的现值计算
老王在一次出差途中不慎因公受伤,现在他所在单位为其提供补偿,有两个方案供其选择,一种方案是一次支付给他1000000元补偿金,另一种方案是从今天开始起每年年初支付300000的补助金,共计补助4年。假设当前市场的折现率为6%,试问老王应该选择哪种方案(见图2-10)。

图2-10 先付年金的现值计算
解答:
首先计算出另一种方案现金流的现值。
方法一:将计算器调整到“BGN”模式,输入相关数据:
I/Y=6;N=4;PMT=-300000;FV=0;CPT→PVAB=1101.903.58
方法二:利用计算器默认的“END”模式进行运算,利用计算器输入:
I/Y=6;N=4;PMT=-300000;FV=0;CPT→PVAE=1039531.68
调整后得到
PVAB=PVAE×(1+1/Y)=1039531.68×1.06=1101903.58(元)
比较两者的计算结果。由于另一种补助方案的现值1101903.58元高于一次性补助的1000000元,所以老王会选择第二种方案。
3.永续年金
永续年金(perpetuity)是指无限期支付的年金,即一组永不完结的等额现金流序列。其现值的计算方法为

【例题】
1.计算优先股的现值
假设M公司的优先股每年支付6元的股利,该优先股当前的回报率是10%,问投资者愿意以多少元每股的价格购买M公司的优先股。
解答:
由公式:

可得:

这说明该投资者愿意以60元/股的价格购买M公司的优先股。
2.计算不规则现金流的终值
假设投资回报率为5%,第1年现金流出3000元,第2年现金流入5000元,第3年现金流入600元,第4年现金流出1000元。计算这4年的不规则现金流在第4年年底的终值(见图2-11)。

图2-11 不规则现金流的终值计算
这类题目的计算方法就是先计算每一笔现金流的终值,再将他们加总起来即可(注意要保留现金流的正负号)。
计算FV1:
PV=-3000;I/Y=5;N=3;PMT=0;CPT→FY1=3472.88
计算FV2:
PV=5000;I/Y=5;N=2;PMT=0;CPT→FV2=-5512.50
计算FV3:
PV=600;I/Y=5;N=1;PMT=0;CPT→FV3=-630.00
计算FV4:
PV=-1000;I/Y=5;N=0;PMT=0;CPT→FV4=1000
加总各期现金流之和=-1669.62(元)
何老师说
先付年金有两种算法:
1)按后付年金的方法进行计算出PVA0,再将其乘以(1+r)得到先付年金的现值PVAD。
2)运用计算器的“BGN”模式:

2 统计概念和市场收益率

本节说明
从本节开始,我们开始陆续学习有关概率与统计学的知识。本节主要介绍了众多对数据性质度量的指标,这些指标分别衡量了数据的集中趋势、集中度等。这些指标、概念对于我们后续理解收益与风险的特征有着莫大的帮助。本节学习的重点在于理解这些概念指标,并区分它们的联系与区别。
知识点自查清单
·统计基本概念
·计量尺度的类型★
·频率分布
·对集中趋势的度量
·分位数
·对离散程度的度量
·切贝雪夫不等式★
·变异系数和夏普比率★★★
·偏度和峰度★★

2.1 基本概念

我们首先介绍一下“统计”(statistics)的概念。从字面上讲,“统计”或者“统计量”既可以用于指代数据(例如,某债券过去十年的平均收益率是10%。10%就是一个统计量),也可用于指代我们分析数据所使用的方法。统计方法分为两类,即描述性统计和推断性统计。描述性统计(descriptive statistics)主要用于描述和概括大数据集的重要统计特征,而推断性统计(inferential statistics)则主要研究如何根据小数据集(样本)的统计特征去推断大数据集的特征。
何老师说
假设我们想要知道中国人的平均身高,那么该如何进行操作呢?
如果按照最完备的做法,我们应该进行一次人口普查,将所有中国人的身高都测量一遍,再取其平均值。但是这种方法既耗时耗力,又容易出错,并不是很好的选择。这时,我们就可以运用推断性统计学,从全体中国人(总体)中抽取一个具有代表性的样本,通过考查样本的特征来推断总体的特征。比如,我们发现样本的平均身高是170厘米,就可以据此推断全中国人的平均身高是170厘米。推断性统计在金融领域中的应用非常广泛。例如,我们想要研究市场收益率与国内生产总值(GDP)增长率之间存在的客观规律,就需要使用自市场诞生之日起至消亡之日止的所有相关数据(总体)。但不幸的是,我们真正能够取得的只有历史数据(样本)。这意味着我们必须运用推断性统计学的理论,通过考查样本的统计特征来推断出总体的特征。
另外一组需要我们区分的概念是总体参数和样本统计量。参数(parameter)被用于描述总体的特征,如总体均值μ、总体方差σ2等,一般用希腊字母表示;而样本统计量(sample statistic)则被用于描述样本的特征,如样本均值x、样本方差s2等,一般用英文字母表示。二者不可混用,希望大家能够注意。
2.1.1 计量尺度的类型★
当我们拿到一组数据后,可以尝试从不同的维度对其展开分析。其中,一种划分数据类型的方法就是计量尺度(measurement scale)或称衡量维度。统计学中常见的计量尺度有以下四类。
1.名义尺度
名义尺度(nominal scale)是最弱的一种计量尺度。它对数据按照性质进行划分。划分后的数据仅能看出其性质,但无法排序。
例如,我们将股票划分为大盘成长股和小盘价值股,并分别给予1和2的编码。这种划分的方法就是名义尺度。我们可以根据编码进行计数,统计出哪种股票类型出现的次数更多(找到众数)。但编码之间没有大小关系,因此无法对其进行排序。
2.顺序尺度
顺序尺度(ordinal scale)是指数据可以按照某些特征进行排序。例如,市场上总共有500只对冲基金。我们可以将其按照业绩的好坏进行排序,从中挑选出表现好的50只对冲基金,并分别给予1~50的编码。这就是一种顺序尺度。
在以上的例子中,我们可以直观得出排名第一的基金业绩一定优于排名第三的基金业绩的结论,但是无法保证排名第一与第三之间的差距等于排名第六与第七之间的差距,即顺序尺度上各点之间的间距是不等的。
3.间隔尺度
与顺序尺度不同,间隔尺度(interval scale)不仅可以排序,而且尺度上各点之间的间距都是相等的。这一特点让我们可以对数据进行加减运算。举例而言,温度是典型的间隔尺度数据,10℃~15℃的温差与25℃~30℃的温差是一样的。
间隔尺度的另一大特点是零点不绝对。比如0℃不代表没有温度,也不能说20℃是10℃的两倍。因此对于间隔尺度而言,比值(除法)是没有任何意义的。
4.比率尺度
比率尺度(ratio scale)是最强的一种计量尺度。其不仅有相等的间距(单位),还具有绝对的零点。因此,数据间可以进行乘除运算。例如,对于收益率数据,不仅3%和5%之间的差距与10%和12%之间的差距相等,而且可以说10%是5%的2倍。
金融领域中的绝大部分指标,如价格、收益率之类都是比率尺度的例子。
何老师说
CFA一级考试一般会从两个角度对计量尺度的类型这一考点进行考核。
·从定义的角度:题干给出情景,请考生判断属于哪种尺度。
·从性质的角度:如哪些尺度可以排序、哪些可以进行加减运算,哪些可以进行乘除运算等。
从理论上讲,可以排序的数据就可以考查其中位数;能够进行加减运算的数据还能考查其平均数。根据上述4种类型的尺度能否取得众数、中位数和平均数以及计量的强弱程度,我们做如下汇总,如表2-4所示。
表2-4 计量尺度的类型汇总

2.1.2 频率分布及其图形展示
在了解了数据的计量尺度后,接下来的一种常见的特征分析就是频率分布分析。
频率(absolute frequency),又称频数或绝对频率,是指总体(population)中各个观测值落在不同区间(interval)的次数。我们用绝对频数除以总频数,就可以得到相对频率(relative frequency)。
表2-5可以帮助我们清晰地理解绝对频率和相对频率的概念。在待考查的310个交易日中,收益率落在-10%~-5%这个区间内的次数是3次,相对频率为3/310=0.97%。
表2-5 绝对频率和相对频率的举例比较

我们将绝对频率或相对频率进行逐级累计,便可以得到累计绝对频率(cumulative absolute frequency)或累计相对频率(cumulative relative frequency)。在最后一级区间上,累计绝对频率等于总频率,累计相对频率则等于100%。
【例题】
K金融公司不同投资产品的收益率如以下5组数据所示。
第1组:-6.8%,6.4%,11.6%,0%,9.9%,-1.3%,7%,-9.1%
第2组:5%,1.1%,-11.8%,-2.5%,7.5%,12.9%,-1.6%,19.1%
第3组:6.6%,-4.7%,13.3%,-18.9%,1.7%,-11.2%,2%,-7.4%
第4组:9.1%,2.6%,13.5%,-10.5%,-0.8%,5.8%,3.6%,-8.9%
第5组:10.1%,-0.1%,4.9%,-14.9%,7.7%,18.7%,5.8%,-3.9%
解答:
首先:划分区间。观察该公司普通股收益率的全距是38%(从-18.9%到19.1%)。我们当然可以设定1%为一个间隔,由此得到39个区间,但这样会导致区间数过多。
比较理想的方法是以5%的距离为一个间隔,将所有数据划分到8个不相重叠的区间。最低的收益率落在-20%≤R<-15%的区间,最高的收益率落在15%≤R<20%的区间。
接着,我们对统计所有观测值并对落在每个区间内的观测值进行计数。统计及计数结果如表2-6所示。
表2-6 收益率数据统计及区间计数结果区间

通过对观测值进行统计和区间计数,可以得到一组反映了该公司普通股年收益率模式的频率分布。由表2-6可知,拥有最多观测值的区间为5%≤R<10%,共有10个观测值落在该区间内。这一拥有最高观测值发生频率的区间通常也被称为众数区间(modal interval)。
作为绝对频率分布的图形化展示,图2-12反映了自1926年1月起至2012年12月止,标准普尔500指数月收益率的绝对频率分布。

图2-12 1926年1月~2012年12月标准普尔500指数月收益率绝对频率直方图
以各区间的中点为横坐标、以绝对频率为纵坐标绘制坐标点,连接各点还可得到绝对频率分布的折线图。图2-13展示了1926年1月~2012年12月,标准普尔500指数月收益率的绝对频率折线分布。

图2-13 1926年1月~2012年12月标准普尔500指数月收益率绝对频率折线图

2.2 对集中趋势的度量

在之前讨论计量尺度的类型时,我们谈到了众数、中位数和平均数等概念。事实上,这3种指标都是对数据集中趋势的度量(measures of central tendency),它们可以帮助我们知道一组数据集合的中心位置,或者大致规模。
对集中趋势的所有度量指标中使用最广泛的是平均值(mean),常见的有算术平均数、加权平均数、几何平均数和调和平均数等。
2.2.1 算术平均数
将总体或样本内的所有观测值加总,再除以观测值的个数,可以分别得到总体均值(population mean,以希腊字母μ代表)和样本均值(sample mean,以英文字母X代表)。样本均值可以用于推断总体均值。
算术平均数(arithmetic mean)的计算公式如下:

式中 N——总体数量;
n——样本数量。
【例题】
某股票指数由10只成分股构成,这10只成分股在过去1年的持有期收益率如表2-7所示。请用算数平均的方法计算该指数的收益率。
表2-7 10只成分股在过去1年的持有期收益率

解答:

算术平均值有一个最显著的特点:在同一数据集合中,所有观测值到其算术平均值的距离之和为零,这一概念用公式表达如下:

此外算数平均值还有一个明显的缺陷就是它容易受到极端值的影响,正是由于这一缺陷,我们后续又引入了其他的集中度趋势度量指标。
【例题】
分析师Bob观测到大盘6个不同行业的市盈率表现如下:1、6、8、11、-6、13,计算这6个板块市盈率的平均值以及离差之和。
解答:

2.2.2 加权平均数
加权平均数(weighted mean)的计算方法认为,同一数据集合中的不同观测值对于均值的影响程度是不同的。这种影响程度就是“权重”。加权平均数可以由如下公式计算得到:

如果将所有权重都设置为同样的数值,加权平均数就是算术平均数。因此可以说,算术平均数是加权平均数的特例。
加权平均数在金融领域中的一大运用就是计算投资组合的综合收益率。当投资组合中包含两种及以上投资品种时,必须使用加权平均的方法来考查组合的收益率。
【例题】
分析师Bob管理的一个投资组合中包含了中石油股票、中海油股票和中石化股票,它们的投资占比以及收益率分别如表2-8所示。
表2-8 某投资组合中的投资占比及收益率

以投资占比为权重计算这个组合的加权平均收益。
解答:

2.2.3 几何平均数
对于一项投资期较长的投资,人们会先把投资期划分为若干个子投资期,并计算出每一期的投资收益率后再计算整个投资期的复合增长率。其计算公式可以表达为:

上述表达式是一个开方式,所以只有当根号内的计算结果取值为非负数时才能使上述公式成立,否则就不能进行开方运算。当我们在计算复合增长率时,由于在实务中投资品可能存在负的收益率,不能直接将其相乘再开方。所以处理方法就是将每一期的收益率数据加1后再相乘,然后再用开方后的结果减1得到最终的复合增长率。上述公式变为:

【例题】
分析师Bob观察到小盘成长股在过去4年中的年收益率分别为7.2%,18.3%,9.5%以及2.1%。请计算该股票在过去4年的年复合收益率。
解答:
依据公式:

2.2.4 调和平均数
所有平均值的计算方法中,较为少见的形式是调和平均数。一个使用调和平均数(harmonic mean)求平均数的例子是计算多只股票在一段时间内的平均购买成本。例如,某投资组合中有3只股票,每只股票都购买了相同的金额。这个投资组合的平均购买成本就是3只股票成交价格的调和平均数。调和平均数的计算公式为:

【例题】
投资者小王在过去1年的每个季度的伊始购买价值2000元的股票,购买成本分别为5元、7元、8元和9元。那么这些股票的平均每股成本是多少呢?
解答:
首先,我们可以用传统的方法进行计算。

现在我们再用新学的公式计算每股的成本。

可以观察到两者计算的结果完全一致。
何老师说
·关于算术平均数、几何平均数和调和平均数三者之间的大小关系,从数学上可以证明:
调和平均数≤几何平均数≤算术平均数
大家可以任意设置3个数代入公式进行验证,也可以根据三者英文单词首字母的字母表顺序(H·实务中计算收益率时,算术平均数和几何平均数都是常用的方法。那么,二者的使用究竟有什么不同呢?一般而言,如果已知过去几年的收益率要求这段时间的平均收益率,使用几何平均数的方法较好;如果已知过去几年的收益率想预测未来的收益率,那么使用算术平均数的方法更为合适。
2.2.5 中位数和众数
一组数据集合中常常会存在一些极大值或极小值。这些异常值对于均值的计算有很大影响。例如,现在有一组数据,14、15、20、26和100,其均值是35。但是由于100这个极大值(异常值)的存在,那么均值35并不能很好地说明这组数据的真实规模。在这种情况下,使用中位数来描述集中趋势就可以很好地避免异常值的影响。
如果将一组数据进行排序(无论从小到大还是从大到小),中位数(median)就是这组数据的中心点。我们会发现,一半的观测值位于中位数的左边,而另一半则在其右边。分位点的位置可以按照以下公式计算:
Ly=0.5×(n+1)
仍以上面那组数据为例,14、15、20、26和100数列的分位点为0.5×6=3。它的中位数是20。直观可知,当存在异常值时,中位数是比均值能更好地度量集中趋势的指标。而异常值的存在往往代表着错误的事实。
此外,还有一个趋势度量指标,那就是众数的概念。众数(mode)是指一组数据中出现次数最多的观测值。一组数据中可能没有众数,也可能有多个众数。我们在后面章节中介绍偏度(skewness)的性质时,还会涉及均值、中位数和众数的概念。
【例题】
K股票过去8年的市盈率如下所示:[7,2,6,18,6,3,18,6],则该市盈率数据集合的众数是?
解答:
上述数据集合中出现最频繁的值是6,它便是该市盈率数据集合的众数。
2.2.6 分位数★
如果我们拿到一组数据,将所有观测值由小到大排列并分成四等份,处于第一个分割点位置的数值就是四分位数(quartile,25%的观测值比之小且不包含该点)。同理,我们还可以得到四分之三分位数(the third quartiles,75%的观测值比之小且不包含该点)、五分位数(quintile)、十分位数(decile)和百分位数(percentile)。这些指标合称为分位数(quantile)。
分位点的位置可以按照以下公式计算:

式中 n——观测值数量;
y——分位数;
Ly——分位点位置。
例如,我们有以下一组按照从小到大的顺序排列的观测值:
11 20 23 30 33 39 45
由此可知n=7,如果要找到四分之一分位点,Ly=(7+1)×25%=2
第2个观测值的四分之一分位点为20。
何老师说
·有的参考书上对于分位点位置的计算与我们介绍的方法略有不同。此处的公式与CFA教材保持一致。
·例如,我们有以下一组按照从小到大的顺序排列的K股票收益率观测值:
7% 11% 20% 23% 30% 33% 39% 45%
则n=8,如果要找到四分之一分位点,Ly=(8+1)×25%=2.25
第2.25个观测值的四分之一分位点为:11+(20%-11%)×(2.25-2)=13.25%
即有25%的观测值位于13.25%的左侧(比13.25%小)。
·关于该知识点的考核,除了分位点位置的计算外,还有从定性的角度加以考察的可能。例如,比较四分位数与中位数的大小、五分之二分位数(the second quintiles)与四分之三分位数的大小等。

2.3 对离散程度的度量

离散程度被定义为各观测值距其中心位置的偏离程度。我们在考虑投资一个项目的时候,最关心的两个指标便是投资的收益率与风险,其中投资项目的风险就可以用离散程度进行表示和衡量。
2.3.1 全距
全距(range)也称为极差,是指一组数据集合中两个极端值之差,即:
R=最大值-最小值
全距可以反映数据的离散程度。全距越大,表示数据集中的观测值越分散。它的优点是易于计算,缺点是仅仅利用了两个极端值,无法对数据的分布情况提供更多的信息。
【例题】
分析师Bob观察到K公司股票在过去10年的最大年化收益率为30%,最小年化收益率为-25%。求该股票过去10年收益率的全距。
解答:
全距=30%-(-25%)=55%
2.3.2 平均绝对偏差
平均绝对偏差(mean absolute deviation,MAD)是各观测数与其算术平均数之间绝对距离之和的平均值,即:

在讨论算术平均值的性质时,我们解释过,同一数据集合中,所有观测值到其算术平均数之间的距离有正有负,这些正离差和负离差之和正好为零。相较于一般离差,平均绝对离差由于取了绝对值,不会出现正负相抵的情况,因此可以用于反映数据的离散程度。平均绝对离差的值越小,说明数据越稳定,离散程度也越小。
【例题】
投资基金经理Jim过去6年投资业绩的年化收益率分别为16%、22%、14%、32%、25%和11%。求解Jim收益率的全距以及MAD分别是多少?
解答:

2.3.3 方差和标准差★
如果将上述MAD公式中的绝对值符号换成平方,我们便可以得到方差(variance)的表达式:

需要注意的是,在计算样本方差时,分母使用的是n-1,而非n。这是因为统计学家发现,使用n作为分母计算出的样本方差进行推断,将显著低估总体方差,从而导致此时的样本方差是总体方差的有偏估计。而使用n-1作为分母计算出的样本方差则可以对总体方差做出更准确的推断。
标准差(standard deviation)是方差开方的结果。在传统的金融学中,我们常常利用方差(标准差)来衡量不确定性,即风险。方差(标准差)越小,风险越小;反之,则风险越大。
【例题】
分析师Bob观察到6个不同类型板块的股票指数在过去1年的投资业绩的年化收益率分别为16%、22%、14%、32%、25%和11%。求解以这6个板块股票指数收益率为总体的方差以及标准差分别是多少?
解答:

需要注意的是,标准差的值(7.14%)大于平均绝对离差的值(6.33%)。这一关系具有普适性,并且可以从数学上得到证明。考生可以将其当作结论加以记忆。
【例题】
投资基金经理Jim过去6年投资业绩的年化收益率分别为16%、22%、14%、32%、25%和11%。若以Jim一生的投资生涯为总体,那么这过去6年的业绩只是一个样本。求解这一样本的方差以及标准差分别是多少?
解答:

2.3.4 半方差和目标半方差
我们知道,一组数据集合的离差之和等于零。因此,投资者在使用方差度量投资风险时,均值两边的数据(即正离差和负离差)都会对方差产生影响。但这一性质不符合投资者的主观感受。因为在投资者眼中,只有收益率低于均值或目标值的不确定性才是需要关注的风险。为此,人们提出了专门衡量下行风险(downside risk)的半方差(semi-variance)和目标半方差(target semi-variance)。其表达式如下:

直观可知,当收益率曲线对称分布时,半方差是方差的一半;当收益率曲线不对称分布时,则需按照定义进行计算。

2.4 切比雪夫不等式★

切比雪夫不等式认为,对于任意一组观测值,假设k为大于1的任意常数,则单个观测值落在均值周围k个标准差之内的概率不小于(1-1/k2)。
图2-14直观地显示了切比雪夫不等式的含义。黑色阴影部分面积即为个体落在均值周围k个标准差之内的概率。通过切比雪夫不等式我们可以知道,大部分的观测值都分布在均值周围;极端值的发生的概率较小。

图2-14 切比雪夫不等式的含义示意图
切比雪夫不等式的重要性在于它适用于任意形状的分布,无论其是否对称。因此,考生需要掌握它的计算,包括k值的计算、取值区间的计算以及概率计算等。
【例题】
分析师Bob正在分析研究历年大盘指数收益率,其观测值落在收益率均值周围±3倍标准差之内的最小概率是多少?
解答:
根据切比雪夫不等式,我们可以得到:
1-1/k2=1-1/32=1-1/9=0.8889或88.89%

2.5 变异系数和夏普比率★★★

2.5.1 变异系数
变异系数(coefficient of variation,CV)是用于衡量观测值相对变异程度的一个指标。当我们把两组或多组数据集合的变异程度进行比较时,如果度量单位与规模都相同,可以直接利用标准差(绝对值)来比较。如果单位和(或)规模不同,则必须采用相对值来比较。标准差与平均数的比值称为变异系数,即:

变异系数可以消除因为单位和(或)规模不同对两个或多个数据集合变异程度比较造成的影响。例如,X、Y两支施工队分别帮助甲、乙城市修路,路段的目标长度和实际长度如表2-9所示。
表2-9 变异系数举例数据表 (单位:米)

如果仅比较两支施工队筑路的标准差,其结果完全相同,即偏离目标要求的绝对程度是一致的。但如果考虑到路段长度的目标值(即规模),则会发现Y施工队偏离目标要求的相对程度更大。
从另外一个角度解读该指标:变异系数还等于波动幅度(variability,σ)除以均值(μ)。这表示变异系数还可以用于衡量获得1单位预期收益所承担的风险。
【例题】
分析师Bob观察到A、B两个市场收益率的均值和标准差如表2-10所示。
表2-10 A、B两个市场收益率的均值和标准差

计算这两只投资品的变异系数。
解答:

以上计算结果意味着,投资A市场获得1单位收益的所承担的风险比投资B市场要小(1.625<1.67),所以投资者应当投资于A市场。
何老师说
考试一般会从两个角度对变异系数这一考点进行考查。
·定性的角度:变异系数的优点是可以剔除单位(free of unit)和(或)规模(free of scale)的影响。
·定量的角度:考核大家对上述公式的掌握程度。
2.5.2 夏普比率
何老师说
夏普比率在今年的数量考纲中已被删除,但后续与之相关的内容,如和罗伊第一安全比率的比较却并未删除。此外,夏普比率还是组合中的重点,所以这部分依然还保留着。
夏普比率(Sharpe ratio)用于衡量单位风险要求的超额回报,即:

式中 RP——组合的预期收益率;
Rf——无风险利率;
σp——组合收益的标准差。
夏普比率是一个同时考虑了收益和风险的综合性指标,被广泛应用于投资绩效评价。一个投资组合的夏普比率越高,表示在承受相同风险的前提下,该投资组合能给投资者带来更高的超额回报(excess return);或者在相同的预期报酬下,该投资组合承担的风险更低。因此夏普比率越大越好。
值得注意的是,夏普比率的有效性建立在标准差可以准确衡量风险的基础上。一旦使用标准差的恰当性受到挑战,则夏普比率本身也会出现偏差。而如果两个投资组合的夏普比率都为负,则“越大越好”的法则将不再适用。
【例题】
投资经理Jim投资了A、B两只股票,它们年化收益率的均值和标准差如表2-11所示,无风险利率水平为1%。
表2-11 两只股票的年化收益率的均值和标准差

计算这两只投资品的夏普比率。
解答:

以上计算结果意味着,Jim投资A股票,每承担1单位风险所获得的超额收益为53.85%。其投资B股票,每承担1单位风险所获得的超额收益为40%。鉴于此Jim会增加对A股票进行投资。

2.6 偏度和峰度

2.6.1 偏度
偏度(skewness)是用来衡量统计数据分布偏斜方向和偏斜程度的指标。它反映了统计数据非对称分布的程度,直观看来就是密度函数曲线尾部的相对长度(见图2-15)。
如图2-15a所示,对称分布的偏度为零,两侧尾部长度相同,其数据分布的算术平均数=中位数=众数。
图2-15b中为右偏分布、正偏态,或称右偏态。此时,位于均值右边的数据比位于左边的少,直观表现为右边的尾部比左边的尾部更长,因此众数<中位数<算术平均数。正偏态分布的最大特点是有频繁的微小损失和少数的极端收益。实务中,收入、房价等数据一般都呈现右偏态。直观而言,由于拥有较大的算术平均值,投资者更偏好右偏态的收益率分布曲线。

图2-15 偏度示意图
与此相对,图2-15c所示为左偏分布、负偏态,或称左偏态。此时,位于均值左边的数据比位于右边的少,直观表现为左边的尾部比右边的尾部更长,因此算术平均数<中位数<众数。负偏态分布的最大特点是有频繁的微小收益和少数的极端损失。实务中,收益率等数据一般都呈现左偏态。
样本偏度(sample skewness)可以按照以下公式进行计算:

如果SK的绝对值大于0.5,我们可以认为该分布显著有偏。
何老师说
·CFA考试不要求对偏度进行计算,但需要知道该公式涉及三阶矩(third moment/third power,即三次方)的计算。
·对这一考点的考查方法:从描述的特点判断某概率分布是左偏还是右偏;或者给定一个有偏分布,描述其概率分布的特点。
2.6.2 峰度
峰度(kurtosis)是用来衡量统计数据分布在其平均值处峰值高低的指标。直观来看,峰度反映了峰部的尖度。样本峰度(sample kurtosis)可以按照以下公式进行计算:

正态分布的峰度(mesokurtosis)为3。若以正态分布为参照,我们将超峰度(excess kurtosis)定义为:
超峰度=样本峰度-3
那么峰度可以描述分布形态的陡缓程度。我们将不同的情况汇总如下,如表2-12所示。
表2-12 峰度的情况汇总

以尖峰(leptokurtic)的概率分布曲线(见图2-16)为例。图2-16显示了其与正态分布曲线的差别。与有相同方差的正态分布相比,尖峰同时也伴随着“肥尾”(fat tail)。反之,低峰(platykurtic)则伴随“瘦尾”(thin tail)。

图2-16 尖峰的概率分布曲线
何老师说
·CFA考试不要求对峰度进行计算,但需要知道该公式涉及四阶矩(fourth moment/fourth power,即四次方)的计算。
·对这一考点的考查方法:
·从描述的特点判断某概率分布是尖峰还是低峰;
·从已知的峰度选择该概率分布有哪些特点,或者结合偏度的知识进行综合考核。
此外,大家还需要记住尖峰(leptokurtic)和低峰(platykurtic)这两个单词。尖峰(L)向上顶,低峰(P)向下穿透。

3 概率及相关概念

本节说明
本节话题将围绕“概率”展开论述;本节所介绍的相关概念、计算法则将帮助我们建立起对概率的系统性认识。在计算概率的过程中,我们还将综合运用期望、标准差、协方差、资产间的相关系数及组合收益等统计指标。最后,我们介绍了另一个话题——排列组合。这些内容都有可能出现在CFA一级考试的试卷上。
知识点自查清单
·概率、期望、方差
·概率的表达形式以及计算法则★
·组合的期望及方差★★
·贝叶斯公式★
·排列组合


3.1 概率、期望、方差

3.1.1 基本概念和性质
1.基本概念
在讲述具体内容之前,我们先引入一些关于概率的最基本术语,如表2-13所示。
表2-13 关于概率的最基本术语

接下来,我们具体举一个例子来说明这些术语、概念之间的联系。比如现在有10张标号1~10的卡片。如果我们随机抽取一张,并将抽取的卡片数字定义为X,那么,X就是一个随机变量,它的取值范围就是1~10。如果在一次抽卡片过程中抽到的卡片数字为7,那么数字7便是这次抽卡片实验的结果。而抽取卡片数字7便是一个事件。在同一次抽卡片验中,抽得数字7的事件与抽得数字9的事件被称为互斥事件,因为两者不可能同时发生。抽到卡片得到一个奇数的事件与抽得一个偶数的事件被称为一组互斥且完备事件,因为这两个事件既不可能同时发生,但又包含了所有可能发生的结果。
2.什么是概率
如今传统的概率学派认为概率是一个客观存在的数字,它可以被看成是频率的极限。例如,我们无法通过抛一次硬币从而判断出其正面朝上的可能性的大小。因为,仅通过一次事件是无法得出任何规律的。但是你连续不断地抛了特别多的次数,比如10000次,那么,你会发现这样一个规律:硬币正面朝上的次数大约为5000次,硬币反面朝上的概率大约也为5000次。由此,统计学家得出结论:一枚硬币被抛出后正面朝上的概率为0.5。所以,概率就是我们实实在在地去做实验得到的一个频率的极限。事件E发生的概率记为P(E)。
3.概率的两个性质
·概率的取值范围为0~1,即:
0≤P(E)≤1
我们可以将概率的取值转换为百分比的概念,若其取值为1,则表示该事件百分之百会发生(必然事件);若其取值为0,则表示该事件不存在发生的可能性(不可能性事件)。
·如果有N个事件,它们之间的关系为互斥且完备事件,那么这N个事件发生的概率之和就等于1,即:

式中 En——总共有N种事件。
公式的成立必须同时满足以下两个条件:
·E1,E2,…,En为互斥事件(mutually exclusive event)。
·E1,E2,…,En为完备事件(exhaustive event)。
3.1.2 经验概率、主观概率和先验概率
我们对概率进行了一定的分类,如图2-17所示。

图2-17 概率的分类
经验概率(empirical probability):把由历史数据所获得的相对发生频数作为事件发生概率的估计值。例如,历史数据表明,道琼斯工业平均指数在每三天的周期内有两天是上涨的。因此,我认为道琼斯工业平均指数明天上涨的概率为2/3。
先验概率(priori probability):通过对问题的逻辑判断推导求得的概率。例如,昨天30只道琼斯工业指数的股票中有24只是上涨的。因此,我任意抽取其中一只,它昨天上涨的概率是80%(24/30)。
主观概率(subjective probability):基于主观的判断而得到的概率。例如,我主观认为某股票明天将会上涨90%。
何老师说
经验概率和先验概率虽然都是基于过去的经验,但前者是对将来的预测,而后者则是对过去的推理。
对于任何由主观意见的加入而得出的推断都属于主观概率,考生须注意试题中任何带有主观色彩的词语。

3.2 概率的表达形式以及计算法则

3.2.1 优比/赔率
E事件发生的优比(odds for an event):P(E)/(1-P(E))。
E事件不发生的优比(odds against an event):(1-P(E))/P(E)。
假设骰子正面朝上的数字值为1的概率是1/6,那么不发生此事件的概率则为5/6。发生此事件的优比是,不发生此事件的优比是。
3.2.2 乘法法则和加法法则
无条件概率(unconditional probability/marginal probability):P(A),又称边际概率,是指不考虑其他事件发生的影响,事件A单独发生的概率。
条件概率(conditional probability):P(A/B),即事件B发生的条件下,事件A发生的概率。
例如,我们在不考虑今天股票价格走势的情况下去研究明天该只股票价格走势的可能性,那么我们应该使用无条件概率来预测。如果我们在今天股票价格已经上涨的情况下,研究明天股票价格下跌的可能性,那么我们就应该使用条件概率。
联合概率(joint probability):P(AB),即事件A和事件B同时发生的概率。
乘法法则(multiplication rule)用来计算两个事件的联合概率。我们可以通过以下方法计算事件A与事件B的联合概率。
计算在事件B发生的情况下事件A发生的概率(条件概率),再将其乘以事件B会发生的概率(无条件概率),得到这两个事件同时发生的概率(联合概率)。
也可以通过计算在事件A发生的情况下事件B发生的概率(条件概率),再将其乘以事件A会发生的概率(无条件概率),得到这两个事件同时发生的概率(联合概率)。
乘法法则公式如下:
P(AB)=P(A/B)×P(B)=P(B/A)×P(A)
上述公式变形后还可以写成。
如果事件A和事件B为互斥事件,那么P(AB)=P(A/B)=P(B/A)=0。
【例题】
分析师Bob经过对小盘股市场的多年研究,对该市场的未来预期(未来1年以及未来两年)的走势做出了如下假设预判。
他认为P1(指数第二年上涨/指数第一年上涨)=0.6,P2(指数第一年上涨)=0.2,求解指数连续两年上涨的非条件概率P3(指数第一年上涨,指数第二年上涨)。
解答:
P3(指数第一年上涨,指数第二年上涨)=P2(指数第一年上涨)×P1(指数第二年上涨/指数第一年上涨)=0.2×0.6=0.12
加法法则(addition rule):用于计算事件A或事件B至少有一个发生的概率。如果事件A与事件B不是互斥事件,我们可以加总事件A与事件B各自的非条件概率,并且减去A和B的联合概率(防止重复两次计算),得到事件A或事件B至少有一个发生的概率。即:
P(A或者B)=P(A)+P(B)-P(AB)
如果事件A与事件B为互斥事件,那么P(AB)=0,则有P(A或者B)=P(A)+P(B)。
何老师说
在学习乘法法则和加法法则时,我们不能只停留在对公式的记忆上,需要理解乘法法则与加法法则在现实生活中代表的经济含义是什么,这样才能针对题干中所描述的信息正确选用合适的法则。
在计算概率问题时,我建议:第一步,分析题干信息的同时,将题干中的文字信息用公式中的字母先表示出来;第二步,在解题时我们可以先从问题出发寻找所需条件,如果此法受挫,我们也可以从已知条件出发向问题方向推演。
独立事件:★★
·独立(independence):事件A的发生对于事件B的发生没有任何影响。前文所列举的股票价格的例子,今天的股价会影响明日的股价,因此,今天股价的涨幅和明天股价的涨幅这两个事件就不是独立的。
如果事件A与事件B独立,那么:在事件B发生的条件下事件A发生的概率,等于事件A发生的无条件概率,即P(A|B)=P(A)或者P(B|A)=P(B)。
根据此前乘法法则和加法法则,我们又可以得到:
P(AB)=P(A)×P(B)
P(A或者B)=P(A)+P(B)-P(AB)
注意区分独立和互斥是不同的。★
如果事件A和事件B独立,那么,事件A与事件B一定不是互斥事件。
互斥事件是指如果事件A发生了,事件B肯定不会发生,那么事件A的发生便可以影响到事件B的发生;两者并不独立。
3.2.3 全概率公式和条件概率下的期望
1.全概率公式
我们在分析一个事件发生可能性的时候,会在给定的情境下对事件发生的概率进行评估。当影响事件的所有情景是互斥并且可以被穷举时,我们就可以用全概率公式(total probability rule)来分析事件发生的可能性。全概率公式可以被用来计算一个事件的无条件概率。
在考虑了所有的影响事件A发生的情境下,事件A的无条件概率等于在各种条件下事件A的条件概率之和,即:

式中 S1,S2,…,Sn——互斥且完备事件组。
2.期望
期望(expected value)可以理解为是一个平均数。我们平时运用最多的是算术平均数,将公式展开后可得,大家可以发现:它默认了每一种情况xn发生的概率都为。但在实际情况中,每个事件发生的概率并不一定相等。如果我们给予每个事件发生的概率不同的权重,那么求得的平均数便是一个加权平均数。我们穷举所有的情况并找到每一种情况所发生的概率,这便是在条件概率下求解期望的思路,所以求期望的本质就是求加权平均数,即:

我们可以用同样的思路,运用条件概率公式得到方差的表达形式如下:

式中 σ——标准差;
Pi——每个事件发生对应的概率。
那么大家思考一下,为什么我们要计算期望呢?为什么我们把一个加权平均数定义成期望呢?这是因为在金融市场上,投资者需要用到历史数据来预测未来。例如,投资者通过历史数据发现,大盘的收益率大概有3种情况:10%、13%、15%,这3种情况便是穷举了收益率的所有可能的结果。这3种情况分别对应发生的概率为:0.7、0.1、0.2。那么,投资者便可以通过求期望来预测明年大盘的收益率。期望,是历史数据的加权平均数,可以用于对将来数据的预测。

3.3 组合的期望及方差

在上一小节中,我们讲述了单个随机变量的统计指标:均值(期望)及波动幅度(方差)。接下来,我们将会研究的是两个随机变量之间的关系。为此我们引入了两个新的统计指标:协方差和相关系数。
3.3.1 协方差★★
在金融市场上,我们往往需要衡量两个变量之间的变化关系。比如,两个资产的资产收益率之间的变化关系。为此我们先了解一下协方差的概念。
协方差(covariance)定义:协方差衡量的是一个随机变量随着另一个随机变量的变化而变化的关系。
协方差的取值范围从负无穷至正无穷。
我们先假设有两只股票A和B。当股票A上涨或者下跌时,股票B也随之上涨或下跌,那么它们之间是一个同向变动的关系。反之,当股票A上涨或下跌时,股票B随之下跌或上涨,那么它们之间就是一个反向变动的关系。为了能衡量出这两只股票涨跌之间的关系,即求出两者的协方差,我们想到了一个方法:如果股票A大于其均值时,股票B也大于它的均值,那么两者之间的变动就具有同向性。用公式表达为[A-E(A)][B-E(B)]>0。反之,若[A-E(A)][B-E(B)]<0时,则代表两者之间变动呈反向性。
我们知道,两只股票收益率的波动是持续不断的,每一次股票收益率的波动,远离它的均值距离也是不等的。所以,我们就要求在每一种情况下求得[A-E(A)][B-E(B)]的值,并且对所有的数值求平均,即期望。我们把最终求得的这一期望称为协方差,即:
Cov(X,Y)=E[(X-E(X))(Y-E(Y))]
变量X与其自身协方差的公式表达为E[(X-E(X))(X-E(X))],即变量X到自己平均值的平均距离,它就等于变量X的方差:
Cov(X,X)=E[(X-E(X))(X-E(X))]=σ2(X)
3.3.2 相关系数★★
我们观察到,理论上协方差的数值可以是从负无穷到正无穷的任何数值,因此比较难以判断协方差的相对大小。两个变量的关系如果用协方差衡量得到的结果也不利于直接比较。所以,我们又引入了下面一个度量指标——相关系数(correlation coefficient),它可以被看作是协方差的标准化。
我们将协方差除以两个变量的标准差,即相关系数:

相关系数衡量的是两个随机变量之间的线性关系。
何老师说
这里我们需要注意的是,相关系数只能衡量两个随机变量之间的线性关系,无法衡量出其他的非线性关系。举例,假设Y=X2,我们可以看出:X和Y之间有十分强的平方关系,但没有线性关系,而相关系数只能衡量线性关系的强弱。
我们注意到,相关系数的取值范围为(-1,1),因为它是协方差的标准化,所以没有单位。
理解相关系数和独立性两者的区别:即使两个变量的相关系数为零,我们也无法推断出这两个事件相互独立,因为相关系数只是衡量了两者之间的线性关系。但是两个事件独立却可以得出两个随机变量间的相关系数为零,因为两者独立表示了两个随机变量之间没有任何关系,包括线性关系。
·增强的正相关系数代表了增强的正线性关系。若相关系数增至+1,则代表两个随机变量之间具有完全的正向线性关系,那么,Y与X之间便可以构建线性方程Y=aX+b。但需要注意的是,斜率a未必一定等于1。因为相关系数衡量的是线性关系的强弱,而斜率a代表的是X对于Y的影响程度。
·增强的负相关系数代表了增强的负线性关系。若相关系数降至-1,则代表两个随机变量之间具有完全的负线性关系。
散点图(scatter plot)是用来描述平面上两个维度中两组数据关系的图,可以用来直观地观察两组变量之间的关系。如相关系数为+1,则散点图为一条斜率为正、向上倾斜的直线,所有的点都落在这条直线上。
相关性分析的局限性主要体现在以下三个方面。
相关系数只能衡量两个变量之间的线性关系,当两个变量呈现很强的非线性关系时,相关系数便无法对此做出解释。
当数据中有异常值存在的时候,会导致数据估计的结果存在偏差,无法准确判别数据之间是否真正存在线性关系。
伪相关(spurious correlation)是指两个变量之间并不存在相关关系,但是变量的部分样本数据之间却表现出一定的相关关系。常见的三类伪相关情形如下:
·两组样本数据之间的相关性完全是由于偶然性导致的。
·两组数据之间的相关性是由于第三个变量的存在而导致的。
·两组数据之间的相关性是由于它们均与另一组数据相关而导致的。
3.3.3 组合的期望及方差★
组合(portfolio)是由多种资产构建而成的。假设组合里有两种资产A和B,那么这个组合的收益(return)可以通过加权平均求得:
RP=WA·RA+WB·RB
其中资产A和B的收益率为RA和RB,因为它们都是不确定的数值,所以RP可以被看作为一个随机变量。求随机变量的期望就是求平均,那么RP的期望就是求RA与RB的加权平均,即:
组合的期望E(RP)=WA·E(RA)+WB·E(RB)
通过RP=WARA+WBRB,我们可以得到组合的方差Var(RP)=Var(WARA+WBRB)。将Var(WARA+WBRB)以近似完全平方公式的形式将其展开得到:

因为相关系数,σ代表标准差,所以将Cov(RA,RB)=ρσAσB代入上式中,我们便可得到组合的方差:
组合的方差,此公式如果除去相关系数ρ,那么它便是一个完全平方和的公式,这里之所以包含ρ是因为资产A与B之间具有一定的相关性。
当组合涉及3个资产时,组合的方差的公式为:

根据组合方差的公式,当ρ=1时,组合的方差最大。相反,当ρ=-1时,组合的方差最小。
通过进一步分析我们可以得出,当ρ增大时,组合方差不断增大,代表组合的风险越大;当ρ减小时,组合方差不断减小,代表组合的风险越小,这也意味着投资的分散化收益越大。
何老师说
考试时题目会直接让我们求组合方差的最大值或者最小值,题目的潜台词就是让我们计算,当ρ=1时组合方差的最大值;当ρ=-1时组合方差的最小值。
【例题】
分析师Bob管理的资产组合投资了3000元的价值型股票指数A和7000元的成长型股票指数B,两个指数的收益率的联合概率如下:
·指数A收益为10%,同时指数B收益为40%的概率为0.2。
·指数A收益为30%,同时指数B收益为20%的概率为0.5。
·指数A收益为0%,同时指数B收益为50%的概率为0.3。求该资产组合的期望、方差和协方差分别为多少?
解答:
方法步骤如表2-14所示。
表2-14 某资产组合的期望、方差和协方差的计算步骤

3.4 贝叶斯公式★

我们在做投资决策时往往基于最初的观点和经验,但当有市场信息发生更新时,之前的观点就需要被修正。贝叶斯公式(Bayes rule)是根据市场突发状况,调整先前观念的一种理性方法。
我们知道P(A|B)×P(B)=P(B|A)×P(A),将其两边同时除以P(B),即得到了贝叶斯公式:

根据全概率公式P(A)=P(A|S1)P(S1)+P(A|S2)P(S2)+…+P(A|Sn)P(Sn),我们可以得到贝叶斯公式的另一种表达形式:

何老师说
我们在学习贝叶斯定理时会有两个难点:其一,考生无法辨析出哪些题目是在考查这个知识点;其二,考生常常死记公式,而没有理解这个公式的具体含义。
在考查贝叶斯定理的题目中,题干只会描述两个事件,并且这两个事件通常互为对方条件概率中的条件。
【例题】
分析师Bob所在的公司用新发明的一种模型测试低评级债券是否在未来发生违约,但是实践表明该模型并非总是有效,通过该模型测试的债券也可能发生违约,没有通过测试的债券也可能不发生违约。
假设用P表示债券通过测试,用D表示债券违约,用Dc表示债券不会发生违约。现获取如下概率数据:
P(D)=0.2;P(Dc)=0.8
P(P/D)=0.7;P(P/Dc)=0.3
计算债券在通过测试情况下的违约概率。
解答:
根据全概率公式,可得:
P(P)=P(P/D)×P(D)+P(P/Dc)×P(Dc)=0.7×0.2+0.3×0.8=0.38
根据乘法法则可得:
P(DP)=P(D/P)×P(P)=P(P/D)×P(D)
基于上述表达式,此案例的贝叶斯公式可被写为:

这意味着,债券在通过测试情况下的违约概率为0.3684。

3.5 排列组合

乘法规则(multiplication rule):如果完成一件事情需要K个步骤,并且完成每个步骤可以有Ni种方法,那么完成这一件事情,我们一共有N1×N2×…×Nk种方法。
阶乘(factorial):
n!=n×(n-1)×(n-2)×…×1
贴标签问题(labeling):贴标签问题是指存在N个物体,每个物体需要被贴上1种标签,总共有l类标签。被贴上第一类标签的物体的数量表示为N1,被贴上第l类标签物体的数量表示为Nl。一共有N个物体,则N=N1+N2+…+Nl。那么,贴标签的方法一共有种。
当存在N个种类的标签时,即l=N,那么,一共存在n!种贴标签的方法。因为第一个物体可以选择N个标签进行粘贴,当第一个物体被粘贴后,第二个物体可以选择剩下的N-1个标签进行粘贴,以此类推,最终共有N×(N-1)×(N-2)×(N-3)×(N-4)×(N-5)×…×1种方法。即N种不同的标签贴在N个物体的方法种数就是n!。
【例题】
基金经理Bob投资了6类指数。他需要在明日开盘前制订出当日的投资策略,具体操作是将6类指数中的3类指数标记为“开盘买入”,2类指数标记为“开盘卖出”,剩下的1类指数标记为“等待观察”。那么,一共有多少种方法来标记这6类指数?
解答:
首先分析师要为这6类指数贴上标签,总共有276种方法,即6!。然而,对于3类“开盘买入”的指数是无须考虑它们排列的先后顺序的。这3类指数一共有3!种排列结果。同理,2类“开盘卖出”的指数间也无须考虑先后顺序。那么一共有3!×2!×1!种排序结果是无须考虑排列顺序的。所以我们用6!除以3!×2!×1!以此避免重复的结果。所以对这6类指数标记的方法一共有种。
一种特殊的情景是:标签只存在两个分类,即l=2。那么,所有物体只能被分为两个小组N1和N2。我们令N1=r,N2=n-r。在实际运用中,这通常代表着有r个物体会被选中,另外n-r个物体没有被选中。当标签种类l=2时,我们将解决此类贴标签问题的公式定义为组合(combination)。注意到,在计算组合时,每一个分类下物体的排序是不需要被考虑的。其公式如下:

当我们需要考虑被选中的物体间排列顺序时,就会用到排列(permutation)公式:

何老师说
组合和排列的区别在于:对每一类选出的物体有没有进行再排序的要求,如果没有再排序的要求我们使用组合公式;如果有再排序的要求我们就使用排列公式。

4 概率分布

本节说明
本节介绍了有关概率分布的知识;概率分布可以分为离散分布和连续分布。请注意,本节出现的所有分布中,二项分布是离散分布类型里的考查重点,而正态分布是连续分布中的考查重点。关于正态分布的知识点较多,如何标准化一个正态分布以及如何构建正态分布的区间都是考试的常考点。此外,考生还需要知道超亏风险的定义以及与之相关的罗伊第一安全比率的计算和具体运用法则。最后,大家还要理解蒙特卡罗模拟、历史模拟法各自的特点。这部分内容较为抽象,从备考角度出发,大家应当重点掌握相关结论。
知识点自查清单
·离散分布:均匀分布
·离散分布:二项分布★★
·连续分布:均匀分布★
·连续分布:正态分布★★★
·连续分布:第一安全准则★
·连续分布:对数分布★★
·蒙特卡罗模拟

4.1 概率分布的介绍

概率分布(probability distribution):一个随机变量所有可能产生的不同结果对应着不同的概率。概率分布就是用以描述这些结果的对应概率情况的。需要注意的是,一个随机变量所有结果的发生概率之和为1,这可以理解为这些情况必有一个会发生。
离散随机变量(discrete random variable):该类随机变量的取值结果是可以被穷举的,并且每一个结果的发生概率也都是可以计算的。例如,下周温度超过20℃的天数?这一结果是可以被列举出来的,可能是1、2、3、…、7天。
连续变量(continuous variable):相较于离散随机变量,连续变量取值的结果是无限的,因此不可以被穷举。例如,明天的平均温度可能是多少℃?这个问题对应的结果就无法被一一列举,温度可能是20.1℃、20.01℃、20.001℃……
连续变量的取值结果是无穷无尽的,假设其有n种取值结果(n趋于无穷大),每个取值结果对应发生的概率趋近于0。即X事件会发生,但其发生概率P(X)=0。对于这样的随机变量,讨论其取某一特定值的概率便没有意义,我们感兴趣的是它在某一有限或无限区间上取值的概率。
概率密度函数(probability density function)可以帮助我们解决连续变量的概率计算问题。我们需要掌握概率密度函数的性质,即概率密度函数与横轴之间的面积代表了概率的大小。概率密度函数的计算涉及高等数学的微积分方法,此方法并不在考试要求范围之内。
我们可以用概率函数(probability function)计算离散随机变量发生的概率p(x)=P(X=x)代表了一个随机变量等于一个特定值的概率。因为离散随机变量的结果是可以被列举的,所以每一个结果所对应的概率是可以被计算得到的。
概率函数有两个重要的基本性质:
·0

·,表示事件所有可能发生的结果对应的概率之和为1。
累积概率函数(cumulative probability function)这一函数的公式表达为:
F(x)=P(X≤x)
这一公式描述了随机变量的取值小于等于某一特定数值所对应的概率,例如,X={3、4、5、6、7},,对于这个分布,累计概率函数F(X=6)。F(X=6)意味着随机变量取值不超过6的概率,即X的具体取值为X=3,X=4,X=5和X=6。
F(X=6)=F(6)=3/25+4/25+5/25+6/25=0.72

4.2 离散分布

离散均匀分布(discrete uniform distribution)是最简单的一类离散分布,原因在于在这类分布中,离散的随机变量取任何数值的发生概率都是相同的。例如,投掷一枚骰子,正面朝上的数值X={1、2、3、4、5、6},每种情况发生的概率都等于。
4.2.1 二项分布★★
伯努利试验(bernoulli experiment):在同样的条件下,重复地、相互独立地对一个随机变量进行试验。其特点是该试验只存在两种结果,即事件成功发生(X=1),或者事件失败(X=0)。这里被研究的变量称为伯努利随机变量(bernoulli random variable)。
二项分布(binomial distribution):重复n次的伯努利试验后得到的概率分布,它是一个衡量事件发生次数的概率分布。其计算公式如下:

式中 p——一次事件成功发生的概率;
(1-p)——一次事件没有成功发生的概率;
x——事件成功发生的次数;
n——实验的总次数。
对于二项分布,它的方差以及均值是怎样的呢?
假设我们总共进行了n次实验,每次实验的成功率都为p,那么在这n次实验里我们预期会得到np次事件的成功发生,即二项分布的期望E(X)=np。
二项分布的方差公式为:
Var=np(1-p)
上述结论总结如表2-15所示。
表2-15 二项分布总结

何老师说
关于二项分布,我们需要掌握三个方面的内容:首先,大家应该知道题中情景所描述的随机变量是否适用于二项分布;其次,大家要会利用二项分布计算概率;最后,我们要掌握二项分布的期望和方差的计算公式。
4.2.2 二叉树
二叉树(binomial tree)模型多被应用于股价的预测。我们只需要定义两个结果和这两个结果对应发生的概率就可以运用二叉树模型分析预测股价未来的走势。例如,现行股价为S(t=0时刻),在下一阶段,股价只存在上涨或下跌两种结果。我们假设上涨的概率为p,那么下跌的概率则为(1-p)。此外我们赋予上涨的系数u为1.01,下跌系数d为1/1.01。那么,股价下一阶段(t=1时刻)将有p概率上涨到1.01S,(1-p)概率下跌至S/1.01。在第二阶段(t=2时刻),股价有p2的概率会上升到上涨到1.012S,有2p(1-p)的概率维持在S,有(1-p)2的概率跌至S/1.012。上述内容总结如图2-18所示。

图2-18 二叉树模型总结
【例题】
研究固定收益类产品的分析师Ben正在研究他所管理的资产组合中的8只债券,他想要估算出资产组合内债券违约的个数。现已获取了如下数据:
·组合中每只债券违约的概率为0.3,不发生违约的概率为0.7。
·任意两只债券之间的违约概率都是相互独立的。
解答:
定义债券违约概率为P(U)=0.3,利用二项分布理论,可得:
E(X/n=8,p=0.3)=8×0.3=2.4
需要注意的是:
即使二项分布是一个离散分布,但是在一个样本内,债券违约的个数也不可能以一个小数的形式(X=2.4)呈现。所以我们近似地认为违约债券的个数为2只。

4.3 连续分布

4.3.1 连续均匀分布★
连续均匀分布(continuous uniform distribution)是最简单的连续分布。它的图形表现为一条直线,并且分布变量的取值范围存在上限(a)与下限(b)。
连续均匀分布的性质如下:
a≤x1P(Xb)=0,随机变量的取值超过这个限定范围发生的概率为零。
连续分布的概率公式如下:

【例题】
分析师Bob假设成长型公司股票的市盈率X服从下限为4,上限为20的均匀分布。计算X为6~12的概率。
解答:

4.3.2 正态分布
正态分布(normal distribution),也称“常态分布”,又名高斯分布。它是一个十分重要的分布,很多与金融相关的随机变量都服从正态分布,所以掌握好这个分布的性质对于我们学习接下来的其他课程有着非常重要的帮助作用。
·正态分布图形(见图2-19)。
·正态分布的一些重要性质。

图2-19 正态分布图形
·一个正态分布可以由两个参数所决定:均值(μ)和方差(σ2)。所以服从正态分布的随机变量可以表示为X~N(μ,σ2)。其中均值决定了正态分布图形中心点的位置,而方差则决定了弧形拐点的位置。由于中心点和拐点的位置都被确定了,正态分布图形的形状也就被固定了下来。
·正态分布的偏度(skewness)=0,表示正态分布是一个关于纵轴左右对称的分布。此外正态分布的峰度(kurtosis)=3。
·两个正态分布的线性组合也服从正态分布。即假定随机变量X、Y均服从正态分布,那么随机变量(aX+bY)也服从正态分布。
·从图2-19中我们不难看出,服从正态分布的随机变量X的取值范围从负无穷到正无穷,并且正态分布的概率密度函数曲线的两端无限趋近于横轴。
4.3.3 置信区间
一个置信区间(confidence interval)是一个区间范围的概念。它代表了我们所要估计的参数将以一个给定的概率被包含在这个区间之中。以下4个常用的置信区间,需要我们掌握(见图2-20):
68%的置信区间表示我们有68%的信心认为样本的取值介于均值正负1倍标准差之间,即[μ-σ,μ+σ]。
90%的置信区间表示我们有90%的信心认为样本的取值介于均值正负1.65倍标准差之间,即[μ-1.65σ,μ+1.65σ]。
95%的置信区间表示我们有95%的信心认为样本的取值介于均值正负1.96倍标准差之间,即[μ-1.96σ,μ+1.96σ]。
99%的置信区间表示我们有99%的信心认为样本的取值介于均值正负2.58倍标准差之间,即[μ-2.58σ,μ+2.58σ]。

图2-20 置信区间示意图
此外,根据切比雪夫不等式,在任意一个数据集中,位于其平均数k个标准差范围内的数据比例(概率)至少为,其中k为大于1的任意数,即。我们可以将切比雪夫不等式与正态分布的置信度做一下比较:假设k=1.96,正态分布对应的置信度为95%,它表示有95%的数据落在了距离均值1.96倍标准差的区间中。而由切比雪夫不等式,我们可以得到P(u-1.96σ,u+1.96σ)≥0.75。它表示:至少有75%的数据会落在均值附近1.96倍标准差的范围内。因为切比雪夫不等式适用于任何分布,而正态分布是一种特殊分布;相对于一般的分布,会有更多的取值结果集中在正态分布中心点的附近;所以举例中,正态分布的95%的置信度要高于切比雪夫不等式所求结果75%。
4.3.4 标准正态分布★★
标准正态分布(standard normal distribution)是一种特殊的正态分布,即Z分布。服从这一分布的随机变量均值为0,方差为1,其表达式为X~N(0,1)。
标准化:对于服从一般正态分布的随机变量,X~N(μ,σ2),我们可以对其进行标准化,具体做法是在减去变量的均值后,再除以变量标准差,从而得到了一个服从标准正态分布的随机变量。
对于非标准的正态分布的随机变量X~N(μ,σ2),我们可以运用密度函数,通过微积分的方法求得其概率。但在实际操作过程中,微积分的方法太过复杂。统计学家为了简化计算过程,针对标准正态分布,构建了Z分布表格(见表2-16),我们通过查询此表格便可以得到与随机变量取值相对应的概率。那么我们只需要将非标准的正态分布转换为标准的正态分布,就可以用查表代替积分的方法求得概率。
表2-16 Z分布表

Z分布表格中的数据代表随机变量z的累积概率,即F(z=0.33)=P(Z≤0.33)=0.6293。
Z分布表格只提供了随机变量取得正值时的对应概率,但是依据标准正态分布的关于纵轴对称的特性,我们得到F(-z)=1-F(z)。
此外,因为P(Z>z)=F(-z),并且F(-z)=1-F(z),所以P(Z>z)=1-F(z)。
【例题】
分析师Bob正在研究一份组合基金的业绩表现,假设该基金的过往历史收益服从正态分布,该基金每份历史收益的均值为5元,标准差为4元,每份基金今年收益为7元。现要求每份收益超过8元的概率为多少?
解答:(见图2-21)

图2-21 标准正态分布例题图
我们要求P(X>8),即分布图上坐标轴X=8右侧的面积;X=8所对应的Z值为:

通过Z分布表格我们可以知道,P(Z≤0.75)=0.7734。于是P(EPS>8)的概率可以表示为:1-P(Z≤0.75),即(EPS>8)=1-0.7734=0.2266。
4.3.5 第一安全准则
超亏风险(shortfall risk):投资的收益率小于最低要求回报率的风险,即投资者面临RP在投资过程中,我们都担心超亏风险的出现。为了最小化这个风险,并且能有效度量P(RP罗伊第一安全比率(Roy’s safety-first criterion):假设组合收益率服从正态分布,投资者想要最小化P(RP第一安全比率衡量了组合资产收益率低于其最低要求回报率的程度,组合收益的第一安全比率越大,意味着:组合资产收益率低于最小要求回报率的发生概率就越小,那么投资者投资该组合的安全性也就越高。
注意,第一安全比率和夏普比率,即[E(RP)-RF]/σP的表达式非常相似。两者唯一的不同在于第一安全比率的超额收益是基于最小要求回报率的,而夏普比率是基于无风险利率。当最小要求回报率等于无风险利率时,两者的比率数值也就相同。所以我们可以把夏普比率看作是最低要求回报率为无风险利率时候的第一安全比率。
【例题】
某公益基金现值50万元,未来一年该公益基金需要支付6万元支持当地公益事业。在支持这笔费用前,该公益基金可以投资于以下4个资产组合,以获取增值。
组合1:收益期望为10万元,收益标准差为10万元;
组合2:收益期望为13万元,收益标准差为15万元;
组合3:收益期望为15万元,收益标准差为18万元;
组合4:收益期望为17万元,收益标准差为25万元。
根据罗伊第一安全法则,作为公益基金的管理者应该选择哪个组合才最有可能既实现基金的增值又能满足明年的支出需求?
解答:
接着,我们计算各个组合的第一安全比率SFR。
组合1的第一安全比率SFR1=(10-6)/10=0.4
组合2的第一安全比率SFR2=(13-6)/15=0.4667
组合3的第一安全比率SFR3=(15-6)/18=0.50
组合4的第一安全比率SFR4=(17-6)/25=0.44
由于组合3拥有最高的第一安全比率,所以公益基金的管理者应该投资组合3。
4.3.6 对数正态分布★★
对数正态分布(lognormal distribution):如果随机变量lnX服从正态分布,那么随机变量X就服从对数正态分布。对于对数正态分布,我们需要掌握以下几点:
·对数正态分布中X的取值要大于零。根据自然对数ln的定义,lnX中的X取值为正数。
·对数分布是一个右偏分布,它不是一个对称分布。

图2-22 对数函数的分布图
在金融市场中,资产的价格都是大于零的,因此,我们一般用对数分布来拟合资产价格的分布,用正态分布来拟合资产收益率。对数函数的分布图如图2-22所示。
4.3.7 连续复利收益
假定St为股票在t时刻的价格,那么股票从t-1时刻到t时刻的收益率可以表示成:

此前我们学到过,离散形式的有效年化收益率,并且当m趋于无穷大时,我们得到连续形式的有效年化收益率。通过联立这两个公式,我们可以求得股票在t-1到t持有期内的连续复利收益的表达式:

在这个等式中,股票收益Rc服从正态分布,那么股票价格St就服从对数正态分布。

4.4 蒙特卡罗模拟

蒙特卡罗模拟(monte carlo simulation)是一种统计方法,这个方法可以帮助我们获取大量的数据。在金融领域,缺少数据是金融工作者常常会遇到的难题。金融数据量的大小取决于时间累积的长度。例如,我国的股票市场建立的时间较晚,累积的数据就特别少。分析师在研究金融问题的时候,如果手边没有足够的数据支持,就会对预计结果造成很大的偏差。而蒙特卡罗模拟方法恰恰可以帮助我们扩充数据量。假设今天的股票价格为S0,需要模拟100天之后的股票价格S100。我们令ST=ST-1+ε,其中ε为随机任意值。例如,ε1=0.2,S1=S0+0.2;ε2=-0.3,S2=S1-0.3;……以此类推,我们便可以模拟出股票每一天的价格,并最终得到S100。在对随机数进行设置时,需要假设其服从一定的分布。一般认为,股票的收益率是服从正态分布的,所以随机数也服从一个正态分布。当我们对上述过程模拟10000次时,便可以得到10000条数据路径及其模拟结果(模拟结果本身也会形成一个分布),这些模拟结果大大扩充了原先的数据量。这一通过假设分布模拟数据的过程被称为蒙特卡罗模拟。
蒙特卡罗模拟与历史模拟法的比较
·蒙特卡罗模拟先假设一个随机变量服从的分布,再使用这个随机变量进行模拟,从而产生的一个分布结果,进而研究复杂的事件。
·蒙特卡罗模拟的缺点:第一,蒙特卡罗模拟很复杂并且需要事先对随机变量假设一个参数分布,如果我们假设的分布存在错误,那么最终的模拟结果便是不可靠的。第二,蒙特卡罗模拟只是一个统计学方法,它没有对数据进行任何分析,也无法解释数据背后的经济含义。
·历史模拟法(historical simulation):利用历史数据对未来进行估计。过去的数据并不能完全代表未来,历史模拟法无法回答历史上从未出现过的问题。

5 抽样与估计

本节说明
本节的话题将由一些基本概念和中心极限定理开始;该定理是我们得以开展抽样估计的理论基础。抽样的目的是为了估计,所以对于给定的样本估计值与置信水平,大家要会选择与之对应的正确分布,并计算总体均值的置信区间;当然抽样与估计只是统计学中的方法与手段,操作过程中难免会发生各类与实际情况偏离的现象,在学习本节后,考生要能够识别并理解各类抽样偏误。
知识点自查清单
·简单随机抽样与分层随机抽样
·时间序列数据与横截面数据
·中心极限定理★★
·标准误★★
·估计量的理想性质★★
·点估计与区间估计★
·学生t-分布★
·置信区间★★
·数据估计的5种偏差

5.1 推断性统计

统计方法分为两类:描述性统计与推断性统计(inferential statistic)。之前的章节主要涉及描述性统计的内容,我们从本节开始进入推断性统计的学习。
所谓推断性统计,简单来说就是用样本去推断总体,即通过考察样本特征,从而推断出总体特征的统计方法。
何老师说
实际应用中,推断性统计较描述性统计更为常用,它主要适用于以下两种情况:
·一是当总体数量过大的时候。比如在我们想要统计中国人的平均身高时,如果对每一个中国人逐个进行问卷调查过于耗时、耗力,进行抽样后推断会效率更高。
·二是当检验行为本身具有毁灭性质的时候。比如我们想要检验一盒火柴是否可燃,显然无法直接对整盒火柴(总体)进行逐一检验,只能使用抽样检验的方法。
推断性统计分为以下三个步骤。
·抽样(sampling):从总体中抽取一部分的个体,组成样本。
·估计(estimation):根据样本的特征去估计总体的特征。
·假设检验(hypothesis test):通过“先猜后证”的方法,检验上一步估计的结果在一定的置信水平下是否有效。
何老师说
这一节主要涉及上述过程的前两个步骤(抽样和估计)的内容,下一节则重点阐述了假设检验的方法。这两节通常被认为是整个数量统计中最难的部分,但这些知识点之间一环扣着一环,紧密关联,在学习时若能建立起整体逻辑与框架感,将有助于我们加深对知识点的理解。

5.2 抽样

5.2.1 简单随机抽样与分层随机抽样
随机抽样有两种方法:简单随机抽样(simple random sampling)和分层随机抽样(stratified random sampling)。
何老师说
怎样的抽样才是随机抽样?
在随机抽样中,总体中每一个个体被抽中的概率都是相等的。
假设要统计全上海市的人均收入。如果调查员站在陆家嘴国金中心楼下做调查问卷,虽然他没有刻意选择调查对象,但是由于他所在的调查地点是金融从业人员聚集地,这就自然会导致从事金融行业的人有更大的概率被抽中。由此每一个行业被抽中的概率并不相等,这就不是随机抽样。
简单随机抽样与分层抽样的异同总结如表2-17所示。
表2-17 简单随机抽样与分层随机抽样的异同总结

5.2.2 抽样误差
通过样本来推断总体的过程中,往往发生估计不够准确的情况,从而产生抽样误差。
抽样误差是指样本统计量与总体参数之间的差异。我们以均值为例:

均值的抽样误差=样本均值-总体均值=X-μ
在用样本推断总体的过程中,总是伴随着一定程度的抽样误差。若要完全避免抽样误差,只能放弃抽样的方法,而直接对总体进行考查。
1.样本统计量★
样本统计量(sampling statistic)是描述样本特征的数值,常见的样本统计量有样本均值、样本方差等。样本统计量本身也是一个随机变量,因此,它也服从某个概率分布。
何老师说
如何理解“样本统计量是一个随机变量”?
总体均值(μ)不是随机变量:总体均值只是一个客观存在的确定的数,无论我们是否进行统计,它都不会因此而改变,而我们统计的目标就是要使得推断结果无限接近这个客观存在的数。
样本均值(X)是随机变量:假设抽样调查100个中国人的平均身高。在进行每一次抽样之前,抽到的100个中国人究竟是哪100个是不确定的,每抽样一次就有一个全新的100人的样本,由此可以计算出一个平均身高(样本均值),但每一个样本算出的样本均值都不一定相等(比如第一次抽到的100人平均身高为169厘米,第二次为171厘米,第三次为168厘米,……)。所以说样本均值是一个取值不确定的数,即随机变量。
2.抽样分布
假设我们从市场上的500只小盘成长股(总体)中随机抽取50只小盘成长股的样本,那么我们是不是就可以计算这50只股票的平均收益作为对总体500只的平均收益的估计。
如果仅仅做一次抽样,那么抽样所得的结果难免存在误差。于是,我们引入“统计量的抽样分布”这一概念。它是指从同一个总体中随机抽取的、样本容量相同的所有可能样本的样本统计量的概率分布。
如果我们很多次地重复从500只小盘成长股中抽取50只小盘成长股的这个过程,就会产生很多个不同的样本,从而得出对总体的平均收益很多个不同的均值收益估计量(因为每重复一次,就会得到一个样本的平均收益,而每一个样本的平均收益,都是对总体的平均收益的估计)。这些对总体均值的估计量,也服从某个概率分布。这个概率分布就称为样本均值的抽样分布(sampling distribution)。
5.2.3 时间序列数据与横截面数据
时间序列数据(time-series data)与横截面数据(cross-sectional data)的差异,我们通过表2-18解释。
表2-18 时间序列数据与横截面数据的差异

5.2.4 中心极限定理★★
中心极限定理(central limit theory):假设一个总体的均值为μ,方差为σ2,现在从这个总体中抽取一个大小为n的简单随机样本。那么只要这个样本容量n足够大,我们就可以认为样本均值X的抽样分布将逐渐趋近于一个均值为μ,方差为的正态分布。这里,样本均值的分布的均值为μ,等于总体的均值;样本均值分布的方差为,等于总体方差除以样本容量大小。这一结论的公式表达为:

请注意,中心极限定理的前提假设:样本容量要足够大。那么究竟多大的样本容量算足够大呢?统计学上规定,当样本容量n≥30的时候,我们便将其视为“足够大”的样本。
中心极限定理非常重要。因为无论在假设检验中,还是在构建置信区间时,正态分布都是相对容易使用的。无论总体的分布如何,只要样本足够大,我们都可以通过近似服从正态分布的样本来推断总体特征。
5.2.5 标准误★★
样本均值的标准误(standard error),是指样本均值自身的标准差。
由于样本均值X只是一个用于估计总体特征的估计量,在统计学中一般把估计量的标准差叫作标准误,以区别于一般的标准差。
根据中心极限定理,可以推断出:
·若总体的标准差σ已知,则样本均值的标准误。
·若总体的标准差σ未知,那么我们可以用样本的标准差(sx)来代替总体的标准差(σ),此时样本均值的标准误。
何老师说
如何区分“样本均值的标准误”以及“样本的标准差”?我们对此总结如表2-19所示。
表2-19 样本均值的标准误与样本的标准差的区分

【例题】
分析师Bob在研究小盘成长股过去1年的表现情况,他已经获取了一组由40只小盘成长股构成的样本数据,已知市场上所有小盘成长股过去1年收益率为12%,标准差为20%,计算该样本数据的均值的标准误。
解答:
总体的标准差(σ)已知为20%,那么样本均值的标准误为:

根据中心极限定理,我们认为该样本服从一个均值为12%、标准误为3.16%的正态分布。
【例题】
基金经理Jim正在研究大盘价值股过去1年的表现情况,他已经获取了一组由10只大盘价值股构成的样本数据,已知这10只大盘价值股在过去1年的收益率为8%,标准差为10%,计算该样本数据的均值的标准误。
解答:
本题并没有告知我们总体的标准差(σ),于是我们用样本的标准差10%(s)代替总体的标准差参与公式的计算,那么样本均值的标准误为:

【例题】
沿用上例,假设分析师获取的大盘价值股的样本不是10只,而是100只,在其他假设条件不变的情况下,重新计算该样本数据的均值的标准误。
解答:

记忆方法
以上两个例题展示了抽样分布的一个重要特性。随着样本容量从10增加到100,样本均值的标准误从3.16%减少至1%。这是由于随着样本容量的增加,样本均值会越来越趋近于真实的总体均值,也就是说,样本均值的分布与总体均值越来越接近,样本均值的标准误也就越来越小。

5.3 估计

5.3.1 估计量的理想性质★★
当我们用样本统计量来推断总体参数的时候,样本统计量就被称为估计量。一些估计量会因为符合统计学上的性质要求,而备受统计学家们的青睐。一个估计量的理想性质包括:无偏性(unbiasedness)、有效性(efficiency)、一致性(consistency)。三者总结如表2-20所示。
表2-20 估计量的理想性质的总结

5.3.2 点估计和区间估计★
1.点估计
·点估计(point estimate)就是用样本统计量的值去推断总体参数的值。
·当我们用样本统计量来估计总体参数的时候,如果样本统计量为数轴上某一点,估计的结果也以一个点的数值表示,这个数值就被称为点估计。
·点估计的方法不够严谨,更常见的做法是区间估计。
2.区间估计
·区间估计(interval estimate)是从样本统计量出发建立的一个值域,并保证总体参数有给定的概率被包含在该值域范围中。其中这个给定的概率称为置信水平(confidence level),这个值域范围称为置信区间(confidence interval)。
·在对置信区间作进一步的展开之前,我们先来学习一个新的分布:学生t-分布。
5.3.3 学生t-分布★★
学生t-分布(student’s t-distribution,以下简称“t分布”),是一个关于纵轴的对称分布,t分布的图形类似“钟形”具有低峰肥尾的特性。
t分布通常用于以下两种情形:
·对于服从正态分布且方差未知的总体,那么无论此时样本容量是大是小,我们都可以用t分布来构建置信区间。
·对于不服从正态分布且方差未知的总体,但是只要抽取的样本足够大(n≥30),其抽样分布近似正态分布,此时也可以使用t分布来构建置信区间。
t分布以及z分布的选择标准(见表2-21)。
表2-21 t分布以及z分布的选择标准

①②这两种情况下也可使用z分布,但t分布更为精确。
记忆方法
如何选择z分布或t分布?上述表格可总结为三句口诀:
·总体方差已知用z分布。
·总体方差未知用t分布。
·总体非正态分布,用小样本时不可估计。
t分布具有以下三个重要性质:
·t分布是对称的,且均值为零;不同于正态分布由均值以及方差定义,t分布的数定义参数是自由度(degrees of freedom,df)。对于样本均值这样一类无偏估计量,其自由度等于样本容量减1。
·与标准正态分布相比,t分布具有“低峰肥尾(less peaked and fatter tails)”的特征;这表明相较于正态分布,有更多的偏离均值的数据集存在于t分布中。
·随着自由度(或样本容量)的增加,t分布的形状逐渐趋近于正态分布。当样本容量足够大时,一般可把t分布近似地看作正态分布。
何老师说
为什么自由度等于n-1而不是n?
因为在给定均值的条件下,如果已知前面n-1个观测值,就可以根据均值推出第n个观测值,因此第n个观测值不是独立的。所以说,当均值已知时,只有n-1个独立观测值,即自由度为n-1。
t分布的图形(对比标准正态z分布)(见图2-23)。

图2-23 t分布的图形(对比标准正态z分布)
从图2-23中可以看出,t分布的图形具有以下特征,这些特征我们已经论述过。
·t分布的形状由自由度决定。
·和正态分布相比,t分布中间部分较矮,尾部较宽(“低峰肥尾”)。
·随着自由度的增加,t分布逐渐趋近于标准正态分布。因为自由度越大,就有更大比例的观测值会出现在均值附近,即更小比例的观测值出现在尾部,所以说,随着自由度的增加,尾部会变薄,中间部分会变高,“低峰肥尾”的现象越来越不明显,越来越趋近于正态分布。
何老师说
尖峰肥尾与低峰肥尾,两者有何区别?是否矛盾?
·尖峰肥尾:假设两种分布的方差相同,因此当中间数据更集中的时候(尖峰),尾巴上的数据就要分散一些(肥尾),才能保证整体的离散程度相同(见图2-24a)。
·低峰肥尾:没有分布方差相同的前提假设,因此t分布中间的数据较分散(低峰),尾巴上的数据也分散(肥尾)。低峰肥尾的t分布的方差比z分布更大(见图2-24b)。

图2-24 尖峰肥尾与低峰肥尾的比较
由于大前提不同,所以这两种特征并不矛盾。
t分布的查表方法:
·t分布的横轴表示t分布图形两侧尾巴上的概率(第一行表示单尾概率,第二行表示双尾概率),纵轴表示自由度,横轴纵轴的交叉点为查询结果,它是一个分位点,代表t统计量的临界值。
·比如我们需要查询95%的置信水平对应的分位点(n=20),那么双尾对应概率就为5%,自由度DF=19,查得结果为2.093(右边分位点)。而标准正态分布在相同置信水平下,分位点为1.96。这也再次印证了先前的结论:在同等条件下,t分布更宽一些(更容易出现异常值)。
5.3.4 置信区间★★
对于给定的概率1-α,置信区间(confidence interval)是指对某个参数的真实值的估计区间。也就是说这个参数的真实值,有给定的概率(1-α)被包含在置信区间的范围中。其中:
·1-α被称为置信水平(confidence level)或置信度(degree of confidence)。
·α被称为这个置信区间的显著性水平(significance level),至于显著性水平的具体运用我们会在下一节做出详细的介绍。
假设,以90%的置信度(或者在10%的显著性水平上),构造出了一个[-100,-17]的置信区间,那么这个区间有90%的可能性包含了我们所要估计的总体参数。
置信区间的构建公式可以写作以下形式:
置信区间=点估计±(可靠性因子×标准误)
其中:
·点估计(point estimate)=总体参数的样本统计量的值。
·可靠性因子(reliability factor)=基于点估计的假设分布以及置信度所确定的一个数。
·标准误(standard error)=提供点估计的样本统计量的标准误。
比如对于95%的置信水平,区间估计为x±1.96sx,表示“总体均值μ有95%的概率被包含在x±1.96sx的范围内”。
同等条件下,置信水平越高,置信区间也越宽。比如对于99%的置信水平,置信区间则增加到x±2.58sx的范围。
何老师说
在置信区间x±1.96sx中,有两个需要我们注意的地方:
1)这里用的是样本均值的标准误sx,与x相对应,不要与sx相混淆。
2)式子中“1.96”的数值是通过查表得到的,它取决于给定的置信水平95%,以及检验统计量符合z分布。
置信区间的计算,可分为以下三种情况:
·总体符合正态分布,且总体方差已知的情况下的置信区间。
根据t分布一节介绍的记忆方法,此时无论样本容量大小是多少,检验统计量都符合z分布。
总体均值的置信区间为:

式中 x——总体均值的点估计(即样本的均值);
zα/2——可靠性因子(对应左右尾概率各为α/2的标准正态分布);
——样本均值的标准误(其中σ为已知的总体标准差,n为样本大小)。
常用的标准正态分布的可靠性因子有:
·对于90%的置信区间,zα/2=1.645(显著性水平为10%)。
·对于95%的置信区间,zα/2=1.960(显著性水平为5%)。
·对于99%的置信区间,zα/2=2.575(显著性水平为1%)。
【例题】
分析师Bob运用调查问卷法预测大盘指数未来1年的业绩表现,他随机打电话给50位公司的客户,咨询他们的意见(假设公司所有上千名客户的预测结果拟合一个正态分布)。结果受访的这60位客户的平均结果为大盘指数将会上涨5.5%,并且假设该公司所有客户的预测值的标准差为16%。依据以上数据,该分析师将要建立一个置信度为95%的置信区间用以预测大盘的未来表现。计算该区间。
解答:
本题中总体标准差已知为16%。因为总体服从正态分布,又因为置信度为95%,所以我们得到关键值zα/2=1.960。置信区间为:

因此,95%的置信区间为[1.45%,9.55%]。
那么分析师所构建的置信区间有95%的概率包含了总体的真实均值。
·总体符合正态分布,且总体方差未知的情况下的置信区间。
无论样本大小,检验统计量都符合t分布。总体均值的置信区间为:

式中 X——总体均值的点估计(即样本的均值);
tα/2——符合(n-1)个自由度的t分布对应的可靠性因子(左、右边尾部概率各为α/2);
——样本均值的标准误(其中sx为样本的标准差,n为样本大小)。
与标准正态分布不同,t分布的可靠性因子的值与样本容量的大小有关,因此想要获取t分布的可靠性因子的数值,需要通过查找t分布的表格后方能得到。考试时会提供该表格的节选,以便考生获取相关信息。
由于t分布的肥尾现象,通过t分布的可靠性因子而建立的置信区间,比通过标准正态分布的可靠性因子所建立的置信区间要保守一些(区间范围更宽一些);鉴于此,其估计的精确度相对正态分布要模糊一些。
【例题】
分析师Bob想要得到市场上1000只小盘成长股的夏普比率的期望值,但是鉴于计算量较大,他从总体中随机挑选了61只小盘成长股,已知这些样本小盘成长股的夏普比率的均值为0.35,标准差为0.2。基于以上数据,该分析师希望构建一个置信度为99%的置信区间以预测总体的小盘成长股的夏普比率。计算该置信区间。
解答:
本题中总体方差未知,因此我们用样本标准差0.2代替总体的标准差。因为总体服从什么样的情况,我们并不知晓;又因为置信度为99%,自由度为60,所以我们得到关键值tα/2=2.660。置信区间为:

因此,95%的置信区间为[0.2819,0.4181]。
·总体为任意分布、总体方差未知、大样本情况下的总体均值的置信区间。
当总体不符合正态分布(任意分布)时,样本的大小决定了能否构建总体均值的置信区间。
·在大样本的情况下(n≥30)。
①若总体方差已知,可以使用z统计量。因为此时样本均值的分布近似正态分布(依据中心极限定理)。
②若总体方差未知,可以使用t统计量。在这种情况下也可使用z分布,但t分布的估计量更为精确。
·在小样本的情况下(n<30),则无法建立置信区间。
因此,在其他条件不变的情况下,在构建置信区间时需要样本容量越大越好。但是样本容量的增加也会导致收集处理数据的成本增加,所以在实务中,分析师还会衡量两者的利害关系,做出一个取舍。
何老师说
考试时涉及的置信区间与概率问题,是指正态分布的置信区间,还是抽样估计的置信区间?
在正态分布的章节中,也曾涉及置信区间的问题。比如[μ±1.96σ]表示:如果一组数据(总体)服从正态分布,那么总体均值周围1.96倍标准差的范围内包含了总体中95%的数据。这里的调查对象是总体,不涉及抽样估计的问题,公式中用的是总体均值和总体标准差。
而这一章介绍的置信区间,[x±1.96sx]所代表的意义则完全不同:总体均值有95%的概率,将被包含在样本均值周围1.96倍标准差的范围内。需要注意的是,这里由于采用了抽样估计的方法,因此要用样本均值来取代总体均值,用样本均值的标准差(标准误差)来取代总体的标准差。
考试时需要仔细读题,看题目中是否有涉及抽样的问题。一般而言,涉及抽样的公式更常考。
5.3.5 数据估计的5种偏差
目前我们所有的分析都建立在随机抽样的基础上,但是在实际抽取样本的过程中往往存在着诸多的问题,这会导致抽样的结果存在错误并致使分析的结果是没有意义的。接下来,我们主要介绍5种抽样偏差:数据挖掘偏差、样本选择偏差、生存偏差、前视偏差和时间区间偏差。了解并且识别这些偏差将有助于我们在实际工作中更好地选取样本。
1.数据挖掘偏差
数据挖掘偏差(data-mining bias)是指由于结果是通过数据挖掘(利用同一个数据库反复进行分析,寻找可能的规律)发现的,因此一个规律的统计显著性被放大了。也就是说,两组数据虽然在统计上存在关系,经济学上没有任何理论依据可以解释这种关系,这是一种“把偶然当必然”的偏差。
比如曾有人研究发现,降雨量比较大的年份股票收益率也比较高,但降雨量与股票收益率之间的联系缺乏有经济意义的解释。所以上述结论只是一种偶然现象,并不是必然存在的定律。
避免数据挖掘偏差的最好方法是:我们在检验某个“规律”的时候,使用一个与发现该规律的数据集不同的数据集(即使用样本外数据检验)作为实验对象。
2.样本选择偏差
当一部分数据被系统性地排除在抽样分析之外的时候(通常是由于这些数据难以获取),就会出现样本选择偏差(sample selection bias)。
比如研究员要考察上海豪宅装修情况,但在进行调查的时候部分住户拒绝被调查,这些豪宅就被自然而然地排除在样本之外了。
3.生存偏差
生存偏差(survivorship bias)是样本选择偏差的一种特殊情况,也是最常见的偏差之一。
最典型的生存偏差发生在对投资组合进行业绩评估时,尤其是对于对冲基金这类单个基金收益起伏变化巨大的组合。绝大多数研究仅针对目前仍然存续着的投资组合,而没有包括已经终止了的组合。幸存下来的组合收益必定高于已经被淘汰消失的那些组合,因此这种抽样会导致高估投资组合的总体收益率,从而使得分析师对于基金的表现评估表现得过于乐观,从而制订了错误的激进投资计划。只有在调查过程中包括所有的投资组合,而不是将已终止的组合从样本中去除,才能在一定程度上减小生存偏差带来的影响。
4.前视偏差
如果在进行统计研究时,所需要用到的样本数据暂时无法获得(通常是在一段时间之后才会公布的数据),就会出现前视偏差(look-ahead bias)。
假设我们在2018年1月1日,希望参照2017年上市公司的市盈率作为统计量来进行择股,但2017年的市盈率要在次年3月的年报中才会公布,那么在2018年的1月1日我们便无法得到统计结果。这就容易引起前视偏差。
5.时间区间偏差
时间区间偏差(time-period bias)是指由于采集到的数据所对应的时间段过长或者过短,从而导致估计结果不具有代表性的问题。如果选择的时间段太短,那么研究结果可能不会反映长期时间段内的数据现象;而如果选择的时间段太长,虽然反映的数据背后的经济关系更为真实,但是研究结果背后的经济关系就可能在不同时间段里发生了变化,变化前后的数据其实是以两个分布的形式独立呈现的。
比如当衡量国民经济总量的时候,目前常用的指标为GDP,但在20世纪90年代之前的常用指标却是GNP,如果选取近100年的数据作为样本,GDP与GNP数据混杂,数据之间的关联性就不是那么有意义了。在这种情况下,数据应该被分为两个子样本,分别包括改变前和改变后的数据。
考点说明
考试时往往先描述一种现象,然后提问这种现象包含了什么样的偏差。其中数据挖掘偏差与生存偏差在考题中出现的概率较大。另外,由于生存偏差是样本选择偏差的一种特例,在考试时两者一般不会同时出现,我们将其分开记忆即可。

6 假设检验

本节说明
本节在之前学习的基础上开始介绍假设检验。假设检验的步骤需要运用此前所学的临界值、z分布、t分布等概念,除此以外该节还会介绍统计量、决策方法等与检验步骤等相关的新的知识点。在假设检验中,因假设对象以及假定条件不同,具体涉及的检验类型可分为z分布检验、t分布检验、χ2分布检验、F分布检验和P检验。关于总体均值的假设检验方法是考试的重点。检验并非万无一失的,检验结果可能包含错误,假设检验中的第一类错误与第二类错误也是本节的重点内容。本节的最后对参数检验与非参数检验的探讨,鉴于这部分内容并非考试重点,大家了解即可。
知识点自查清单
·假设检验的基本原理
·假设检验的步骤:原假设和备择假设,检验统计量和临界值★★★
·置信区间和假设检验的关系★
·p值法★★
·第一类错误和第二类错误★★
·假设检验的分类
·参数检验与非参数检验

6.1 假设检验的基本原理

假设检验(hypothesis testing)的基本原理可以用小概率原理来解释。小概率原理认为小概率事件在一次试验中是几乎不可能发生的。如果在一次试验中竟然发生了,我们就有理由怀疑这一假设的真实性,从而拒绝这一假设。
何老师说
假设检验的本质:先猜后证。如何证明中国人平均身高是否等于180厘米呢?在此情境下,由于所要研究的总体数目过大,如果对总体内的每一个个体都进行调查统计,需要耗费大量的人力、物力。所以此时我们就通过研究样本数据来推断总体的情况,观察样本呈现的真实情况是否符合我们对总体的猜测。我们首先猜测中国国民平均身高是180厘米(这是对总体的一个假设),之后从全中国国民中随机抽取100人,获得了这100人平均身高是160厘米。如果先前我们对中国国民的猜测正确,那么抽出均值为160厘米的样本就说明发生了小概率事件;抽出的样本平均身高在175~185厘米才符合大概率事件的定义。根据假设检验的基本原理:小概率事件在一次试验中是几乎不可能发生的。可是它发生了,我们就认为此前猜测错误。由此我们猜测全中国人的平均身高在160厘米左右才更加准确。

6.2 假设检验的步骤★★★

假设检验的目的在于检验一个假设的真伪性,从而帮助我们判别是应该接受这个假设还是拒绝它。假设检验基于一整套完备的概率统计理论,其检验的步骤可以分为以下几步:①陈述假设;②选择合适的检验统计量;③给定显著性水平;④陈述假设的决定规则;⑤收集样本,计算样本统计量;⑥针对假设,做出决定;⑦根据检验结果做出决定(了解此过程即可)。这些步骤没有绝对的间隔限定,考生在做题后期熟练了这些方法步骤后,可以合并步骤,加快做题的时间。
6.2.1 陈述假设
原假设(null hypothesis)和备择假设(alternative hypothesis)。
原假设H0,是我们希望拒绝的假设,也是需要被检验的假设。原假设通常是关于总体参数的一个陈述。例如,对于总体均值而言,我猜中国人的平均身高等于170厘米,原假设H0:μ=170。注意,μ是总体均值而不是样本均值X。
何老师说
做假设检验想要检验的是总体的情况,而不是样本的情况,因为样本的统计量是可以通过观察直接求得的。但总体参数是未知的,只能根据样本统计量对总体的参数进行估计。总体的参数用希腊字母表示。需要注意的是“等号”都写进原假设中,这点大家要牢记。
备择假设Ha,是当原假设被证伪拒绝时,可以成立的假设。它可以被看作是原假设的对立面。在统计学中,直接证明一个假设结论是正确的这件事情是很难做到的。我们通常的做法是:首先证明一个假设是不成立的;因此,当证明了原假设不成立时,充当其对立面的备择假设就是成立的。因为原假设是我们希望推翻的结论,所以备择假设就是我们希望得到的结论。
最常见的原假设是“相等”假设(μ=μ0),与之对应的备择假设就是“不相等”(μa≠μ0),这里需要用到的假设检验是双尾检验。
原假设是“小于等于”假设(μ≤μ0)与之对应的备择假设就是“大于”(μa>μ0),此时需要的假设检验是单尾检验。
何老师说
做题熟练的同学在解题时只写原假设就可以了。但是有些假设检验的情况比较复杂,把备择假设一并写出来会方便我们得到结论。
6.2.2 计算检验统计量
检验统计量(test statistic)是一个由样本计算得出的数值,它是我们决定是否拒绝原假设的基础。
检验统计量=(样本统计量-假设总体参数的值)/样本统计量的标准误差
此公式仅适用于z分布和t分布。
检验统计量实际上是基于样本以及总体特性的一个随机变量。检验统计量通常服从四种分布,即标准正态分布(z分布)、t分布、χ2分布以及F分布。
如何通过样本的均值和标准差计算出检验统计量是学习假设检验的一个难点。幸运的是,CFA一级只需要掌握有关均值的检验统计量计算公式。
当已知总体标准差时:
当未知总体标准差时:
何老师说
计算检验统计量就是制定一个游戏规则:如何定义一个小概率事件。我们把样本统计量的观测值与事先假设的数值做差,即取一个距离,看两者究竟相差了多少。如果两者距离太大就说明小概率事件发生了。将样本的统计量减去假设的参数值,再除以统计量的标准误差的过程被称为标准化。标准化后的距离便于我们判断真实距离的大小。当这个真实距离过大时,我们就认为小概率事件发生,其所对应的检验统计量的数值通常落在检验统计量分布的尾巴上,此时我们就拒绝原假设。
6.2.3 临界值
临界值(critical value)是检验统计量的拒绝临界点。将临界值与计算出的检验统计量相比较,以判断出是否应该拒绝原假设。需要注意的是,临界值是通过查找相应的分布表(z分布、t分布、χ2分布以及F分布)确定的,而不是由计算所得。例如,在正态双尾检验中,对应0.05的显著性水平(α=0.05)的分界点是±1.96。这里的±1.96就是通过查表所得。查找分布表须注意以下事项:
1)确定具体需要查找的分布表,因为同一显著水平在不同分布表上的临界值是不一样的。通常情况下,检验统计量服从哪一分布,我们就去查与之相对应的分布表。
2)确定显著性水平α,它代表我们拒绝正确原假设的概率,在分布图上,显著性水平也反映拒绝域的面积。例如,α=0.05的显著性水平表示存在5%的概率拒绝正确的假设。在同一分布表中,不同的显著性水平对应着不同的临界值。考试最常用的显著性水平有三个:0.10、0.05和0.01。我们以前也提及过把(1-α)称为置信度,在这里我们可以把置信度理解为一个假设检验本身的把握程度(信心程度)。
3)确定单尾检验还是双尾检验。单尾检验的拒绝域在对应分布的一侧尾巴上,而双尾检验的拒绝域出现在对应分布的两侧尾巴上。因此即使在同一显著性水平下的单尾检验和双尾检验所对应的临界值也是不同的。例如在5%的显著性水平下,服从正态分布,双尾检验对应的临界值是±1.96,而在统一显著水平下的正态分布单尾检验所对应的临界值是1.65或者-1.65。
何老师说
基于检验统计量和关键值的判断规则如图2-25所示。

图2-25 基于检验统计量和关键值的判断规则
·z分布和t分布大致形态是相似的,都是钟形。那什么时候用z分布,什么时候用t分布?还是前文提及的三句话口诀:总体方差已知,用z分布;总体方差未知,用t分布;非正态总体小样本不可估计。当N≥30时,t分布趋近于z分布。在应对考试时,由于CFA一级以选择题形式出题,我们即使使用z分布答题,误差也不会太大。
·在实务中,分析师根据经验确定显著性水平。例如,分析师认为5%可以定义一个小概率事件,那么显著性水平就是5%,分布图上对应拒绝域的面积也是5%。当检验统计量的数值落入拒绝域时,我们就有理由拒绝原假设,从而备择假设成立。反之,则不能拒绝原假设。
·图2-25a中是一个双尾检验,给定显著性水平5%,所以拒绝域分别落在两侧的尾巴上,每一侧的面积所对应的概率各是2.5%,双尾检验有上下两个临界值,-1.96和1.96。而图2-25b中是一个单尾检验,所以拒绝域只出现在一侧的尾巴上,尾巴面积对应的概率就是5%,单尾检验只有一个临界值1.645。
6.2.4 决策法则
决策法则(decision rule)是指用以判别接受或者拒绝原假设的法则。这个决策法则的运用必须结合临界点。而要确定临界点,就得确定以下三个因素:
·确定假设检验是单尾检验还是双尾检验。
·确定给定的显著性水平。
·确定检验统计量所服从的分布。
如果计算出来的检验统计量的绝对值大于临界值的绝对值,我们就拒绝原假设H0,否则就不能拒绝原假设H0。
何老师说
临界点又叫critical value。它对于做决定而言是非常关键的值。
关于拒绝、不拒绝原假设的表达:在中国国民平均身高的那道例题中,拒绝H0的表达方式为“reject H0,μis significantly different from 180”,即总体均值显著地不等于180。这里的显著是统计上的显著,即在给定的显著性水平下,对于出现不能拒绝H0的情况。在统计学上,考虑到语言的严谨性,接受不说成接受而是表述为“fail to reject=not to reject”。在考试中,对于不能拒绝原假设的情况,选择答案为双重否定的选项,“μis not significantly different from 180”。
6.2.5 单尾和双尾假设检验
正如之前所说,假设检验究竟是用单尾检验(one-tailed test)还是双尾检验(two-tailed test),取决于原假设和备选假设的表达形式;取决于我们希望得到或是推翻结论。例如,我们希望得到“中国人的平均身高小于180厘米”这个结论(μa<180),就应该用单尾检验;如果希望得到“中国人的平均身高不是180厘米”这个结论(μa≠180),就应该用双尾检验。因为在双尾检验下,我们即要检验均值大于180cm的情况(极端值出现在分布的右尾),同时也要检验均值小于180的情况(极端值出现在分布的左尾)。
1.双尾假设检验
关于总体均值的双尾检验的假设如下:
假设H0:μ=μ0,Ha:μ≠μ0。
顾名思义,双尾检验有两个尾巴。每个尾巴分别对应一个拒绝域,每个拒绝域的面积占总拒绝域面积的1/2。所以双尾检验的每个尾巴也有各自对应的临界值。双尾检验总共有两个临界值。
双尾检验的决策法则:如果检验统计量的绝对值大于临界值的绝对值,我们就拒绝原假设H0,否则就不能拒绝原假设H0。
【例题】
分析师Bob正在分析当年市场上所有小盘股的收益率,鉴于此前的定价模型,小盘股的隐含收益率应该为3%,但是该分析师选取了市场上150只小盘股作为一个样本,观测到该样本收益率均值为3.5%。因此分析师开始怀疑定价模型的结果是否正确,已知市场上小盘股的收益率服从正态分布,并且总体的标准差为15%,分析预备在1%的显著性水平下验证自己的观点是否正确。
解答:
首先,陈述原假设和备择假设,因为分析师认为(希望)小盘股过去1年的收益率不等于模型所示的3%,所以我们将这一假设放在备择假设上,得到:

紧接着我们计算检验统计量。

在1%的显著性水平下,正态分布双尾检验对应的临界值z是±2.58。因此,决策规则为:检验统计量<-2.58或者检验统计量>2.58,就拒绝原假设。否则,就不能拒绝原假设。
因为0.41<2.58,因此我们不能拒绝原假设(小盘股收益率等于3%)。分析师应该认同定价模型给出的结果,即观测到的3.5%的样本均值与假设的3%的总体均值是相同的。
2.单尾假设检验
对于总体均值的单尾假设检验,原假设和备择假设有别于双尾检验,它分别存在两种原假设以及备择假设。具体形式表达如下:
H0:μ≤μ0, Ha:μ>μ0
或者
H0:μ≥μ0, Ha:μ<μ0
究竟选用哪个原假设和备择假设,依旧遵照此前论述的原则:我们把希望成立的结论放在备择假设上,把希望否定的结论放在原假设上。
下面,以假设检验H0:μ≤μ0 Ha:μ>μ0为例,说明决策法则:
·检验统计量的绝对值>临界值的绝对值,拒绝了原假设H0。
·检验统计量的绝对值<临界值的绝对值,不能拒绝原假设H0。
【例题】
对于上例中的小盘股的收益率数据,分析师认为总体的回报率可能大于1%,检验这个说法正确与否。
解答:
我们把分析师希望发生的结论放在备择假设上,得到:

接着计算检验统计量:

在1%的显著性水平下,单尾检验的临界值z值是±2.33。因为2.04<2.33,所以我们不能拒绝原假设(收益显著性的大于1%)。但是,请注意,如果我们将1%的显著性水平换成5%的显著性水平,那么此时关键值为±1.645。因为2.04>1.645,我们便可以拒绝原假设,认为分析师的观点是正确的(总体的收益率显著性地大于1)。由此可见,不同的显著性水平直接决定着假设检验的结果。

6.3 置信区间和假设检验★

此前我们学习过置信区间是指这样一个区间范围,它以(1-α)的给定概率包含我们所要估计的总体的参数。一个具体的置信区间可以构建如下:
(样本统计量-标准误×临界值,样本统计量+标准误×临界值)
通过上述表达式,我们可以把置信区间与假设检验联系起来。当我们假设的参数值被置信区间所包含时,那么我们就不能拒绝原假设H0。相反,如果计算求得的置信区间没有包含最初假设的参数值,那么我们就可以拒绝原假设H0。

6.4 p值法★★

p值是指一个最小的可以拒绝原假设的显著性水平;那么在大于这一数值的显著性水平下,原假设都可以被拒绝。所以在p值法(p-value)下给定的显著性水平越小,原假设就越难拒绝原假设。
运用p值判断原假设是否成立的法则非常简单。如果p值小于给定显著性水平α(此时p值落入拒绝域中),那么我们就拒绝原假设H0;如果p值大于显著性水平α(此时p值在拒绝域之外),那么我就接受原假设H0。所以在相同显著性水平下,p值越小,我们就越容易拒绝原假设H0。
何老师说
p值是检验决策的另一个依据。p是probablity概率的意思。p值可以理解为计算所得的检验统计量在对应分布上切得的尾部的面积。在考试中,我们只需要记住“p越小越容易拒绝原假设”的结论即可。如果想要拒绝原假设,就需要p值小于α,那么在此情况下,p值的最大值是α的值。
p值是指单尾的面积还是双尾的面积?这是基于它是单尾检验还是双尾检验。如果是双尾检验,两个尾巴的面积加在一起是p值。如果是单尾检验,它就是一个尾巴的面积。如果是单尾检验,p和α都是对应单尾。如果是双尾检验,p和α都是对应双尾。所以我们不用刻意考虑具体题目是单尾检验还是双尾检验。两者直接做比较即可。

6.5 第一类错误和第二类错误★★

假设检验是根据样本的统计量来对推断总体的参数。然而,样本不一定总能代表总体,因此,基于样本的判断也可能出现错误或者偏差。
假设检验的过程可能会包含以下两类错误:
第一类错误(typeⅠerror):拒真,当原假设为真的时候,检验结果拒绝了原假设。
检验的显著性水平α=P(第一类错误)=P(H0×H0√)
第二类错误(typeⅡerror):存伪,当原假设为假的时候,检验没有能够拒绝原假设。
检验的势就是当原假设为假的时候,拒绝掉原假设的概率。
检验的势=1-P(第二类错误)=P(H0×H0×)
记忆方法
三国杀,主公把内奸当作忠臣,犯二,第二类错误。总结如表2-22所示。
表2-22 第一类错误与第二类错误的计算方法

第一类错误与第二类错误是此消彼长的关系。但是两者之间并没有精确的数学表达公式。如果犯第一类错误的概率在增加,意味着我们越容易拒绝一个正确的原假设;在此情况下就越不容易接受一个错误的原假设。增加样本容量可以同时降低犯这两种错误的概率。我们可以考虑一个极限情况,当样本容量增加到和总体一模一样时,就不会犯错误了。

6.6 假设检验的分类

之前我们已经介绍过t检验与z检验的适用条件,如表2-23所示。
表2-23 t检验与z检验的适用条件

除了经常使用的z检验和t检验之外,还需要了解以下假设检验(见表2-24)。
表2-24 其他假设检验类型

此前我们讨论的所有假设检验,都是针对总体均值的假设检验,并且原假设都假设总体均值等于一个具体的数值。下面我们来简单说明一下其他类型的假设检验在考试中需要特别注意的地方。因为它们所涉及的分布不是我们考试的重点,大家有所了解即可。
当我们用假设检验来判定两个正态分布的总体均值是否相等时(这里假设两个总体的样本相互独立),我们依据两个总体方差是否相等把问题划分为两类:总体方差相等和总体方差不相等。不管哪一种情况,我们都需要用到t分布的统计量和临界值。只不过每种情况下t分布统计量的自由度是不一样的。
上述问题中,其他给定条件不变,我们依然想要通过假设检验来判定两个总体的均值是否相等,但此时我们假定两个总体的样本不再独立。研究这一类问题,我们就需要用到成对检验。成对检验的原假设是H0:μd=0,其中μd代表了两个总体均值的差。成对检验依然需要用到一类t分布,至于其具体统计量表达形式,这里并不展开论述。
除了对总体的均值进行假设检验外,我们还会对总体的方差进行假设检验。对于单个正态分布总体,我们想要判定其方差是否等于一个具体数值时,需要用到的统计量分布是自由度为(n-1)的χ2分布,其中n为样本容量大小。而对于样本独立的两个正态分布总体,我们想判定它们的方差是否相等时,就需要用到第一自由度为(n1-1),第二自由度为(n2-1)的F分布,其中n1为第一个样本容量大小,n2为第二个样本容量大小。
除此之外,我们还可以对两组变量之间是否具有线性相关关系进行显著性检验(significance test of the correlation)。在实务中,我们通常担心两个变量间不存在线性相关关系,这也是我们想要拒绝的命题,所以我们令原假设H0:ρ=0,备择假设Ha:ρ≠0。这是一个双尾检验。检测两组变量之间的相关性是否等于0需要用到t检验方法。如果t<-t临界值,或者t>+t临界值,则拒绝H0。
如果相关系数显著不为0,则两组变量之间具有显著的线性关系。t统计量计算公式如下,其中自由度df=(n-2)。这个检验统计量的公式需要大家记忆。★★

6.7 参数与非参数检验

参数检验(parameter tests)是基于总体服从某种特定分布的假设下,对不同的总体参数(均值、方差等)进行的检验。我们之前所讨论的所有检验都是参数检验。
非参数检验(non-parameter test)不是对具体参数的检验,它不需要假设总体服从一个具体的分布。
非参数检验适用于当参数检验的条件无法成立的情况,如此前我们说到的非正态总体小样本一般无法估计其总体参数,这时我们就会考虑用到非参数检验。此外,当我们想检验一些定性的问题时也会用到非参数检验,如检验一组数据的排序情况。
斯皮尔曼秩相关检验(Spearman rank correlation test)是一种常见的非参数检验法,它主要用于研究两个变量间相关关系的强度。