书籍信息

全书名:《解读量化投资:西蒙斯用公式打败市场的故事》
原书名:《Quant Invertment:How Did James Simons Beat The Market By Using Maths?》
作者名:忻海
出版方:机械工业出版社
ISBN:9787111285830

前言

这本书,重在展望未来的金融、市场,以及未来的交易方式和对风险的管理。

近些年以来,量化交易和金融工程越来越热。在知乎上,满山遍野的都是关于算法、因子投资、人工智能、金融工程的帖子。截至2018年5月,中国量化投资基金市场规模已经达到1160亿元。

可以想见,未来的交易大厅里,一定会象现在的黑灯工厂一样,各种各样的电脑在自动交易。而人类所从事的工作,可能是更与人有关的「情感」型工作,如理财师的工作,聆听客户的需求、理解客户对于风险的诉求。而投资或者资产管理,策略是由人来定的,但是交易是由强大的资讯收集和智能交易软件自动完成的。

文艺复兴基金是全球对冲基金里的顶尖牛掰基金。

文艺复兴的大奖章基金1990年净回报55.9%,第二年,39.4%,1992年和1993年,分别是34%和39.1%。市场越是惊涛骇浪,大奖章基金的表现似乎就越好。1994年,美联储连续6次升息,短期利率从3%升到了5.5%,美国债券市场当年的回报为负6.7%,而大奖章基金净赚了71%。2000年,科技股灾,标准普尔美国股票指数跌了10.1%,大奖章获得了大丰收,净回报98.5%,几乎是满分。每年平均净回报达35%以上、管理费5%、回报提成是令人咋舌的46%。

在过去几年里西蒙斯每年的个人收入都超过10亿美元,多次被列为全球最高收入对冲基金管理人。

而且最牛的是,2005年开始,文艺复兴的大奖章基金把客户的钱都返还了。现在管理的50亿美元是西蒙斯和员工自己的50亿美元。这在规模越大越好的对冲基金行业,是非常特立独行的。

一、关于西蒙斯

1.1 数学天才

西蒙斯的全名叫詹姆斯·哈里斯·西蒙斯。他于1938年出生在美国波士顿郊区一个犹太家庭,是家里的独子。

据说很早的时候,西蒙斯就开始表现出对数字、形状超出年龄的兴趣。他3岁的时候有一次大人告诉他汽车的油箱开几天就没有油了,这令他十分不解,因为他认为汽车会首先用完一半的油,然后接着用去剩下的油的一半,再一半,再一半,这样下去,总会有一丁点儿油剩在油箱里面,永远也不可能用完。这当然是苏格拉底之前的古希腊哲学家芝诺的著名悖论。西蒙斯多年以后讲起这个故事的时候笑着说:「对一个小孩子来说,这个想法应该是很复杂的吧?。

高中毕业以后,西蒙斯进了麻省理工学院读数学。西蒙斯回忆自己在大学本科时代学习很用功,课外玩起来也很疯,花最多精力的是和几个同学一起玩猜点数的纸牌游戏。要想在这个游戏里制胜必须要有很好的概率计算能力和记忆力,一般人都会觉得很头疼,完全把它当成撞大运的游戏,但是对于这几个数学系的学生来说,这正是他们放松大脑的最好办法。

他的一项投资却为他掘到了人生第一桶金。他和那两个哥伦比亚的同学:三个麻省理工的数学系毕业生,联手在哥伦比亚开了一家制造聚乙烯地板的工厂,西蒙斯的父亲帮了他们一把,为他们垫付了一笔起始资金。这家工厂的投资后来回报丰厚。1958年,用了3年学完了本科,20岁的西蒙斯转投加州大学伯克莱分校攻读数学博士学位。

三年以后西蒙斯就拿到了博士学位,回到母校麻省理工学院当老师,那时他才23岁。他的博士学位导师回忆说:「吉姆是个很有独创性的人,喜欢坚持走他自己认定的道路。」

他的博士论文是有关多维弯曲空间里面的几何问题,和后来以西蒙斯和华裔著名数学家陈省身联合命名的陈—西蒙斯理论一样,都属于拓扑几何学的范畴。在麻省理工才待了一年,不安分的西蒙斯又跳槽到麻省理工隔壁的哈佛大学当数学老师。干了两年,1964年,他又走人了。这次他没有去另外一所大学,而是加入了美国国防分析研究院。这个机构是一个地位比较特殊的非营利性研究机构,国防部请麻省理工学院出面聚拢全美科技精英,为国防部解决棘手的技术问题。西蒙斯当年的工作是破译各种密码。

他这次换工作的主要原因是钱,国防研究院的工资要比年轻的大学教授的收入高很多,西蒙斯只需要花一半的时间替国家安全局破译密码,而另一半的时间他待在国防分析研究院设在普林斯顿大学的研究中心,在这里他可以继续考虑他的拓扑问题。那是1967年,西蒙斯29岁。因为结婚早,他已经是三个孩子的父亲了。西蒙斯来到纽约州立大学的石溪分校担任数学系主任,待了8年。在这期间,他不仅仅和陈省身创立了著名的陈-西蒙斯理论,而且使这个新成立大学的数学系的拓扑几何研究在全美名列前茅。陈-西蒙斯理论在天体物理中的应用被称为陈-西蒙斯量子场理论。

但是西蒙斯本人在这过去20年关心最多的却不是宇宙的起源,而是如何赚钱。从后来有关西蒙斯如何赚钱的各种资料来分析,他的赚钱方法和十维空间的拓扑理论基本没有什么直接的关系。可以说,他在赚钱上所依靠的数学理论其实是并不复杂的。

这就是西蒙斯作为数学家的上半生的历史。可以说,他的上半生蛮普通的,就是一个数学牛人该过的生活。

然而,这个怪人并没有按照常理出牌。

1.2 进军金融行业

1974年西蒙斯卖掉了在哥伦比亚的聚乙烯地板厂的股份,得到60万美元,这是一笔不小的财富。

西蒙斯把这笔钱交给了他在哈佛任教时候的学生查尔斯·佛莱菲尔德去投资商品市场,不到7个月,由于糖的价格暴涨,西蒙斯的投资从60万美元变成了600万美元。也许是因为这个意外的惊喜,西蒙斯又回想起了自己数年以前投资大豆的经历,他对于交易和投资的兴趣又开始复苏。

他离开了校园,在石溪分校的旁边,一个快餐厅旁边的普通小房子里,开始了自己的金融生涯。

一个原因是西蒙斯研究的数学领域出成果很难,需要很长的时间,最后的成果有时候还要靠相当的运气。这都使西蒙斯感到沮丧。1976~1978年间,他仅将一半的时间花在他拓扑几何的十维空间里面,另外一半则花在变幻莫测的外汇和商品市场上。

1.3 投资事业的开始:从主观判断型到量化型

刚开始的时候,西蒙斯的投资方法和许多人类似:通过对宏观基本面的分析来判断外汇和商品的价格走势,然后进行相应的买卖。虽说我们找不到西蒙斯当年的投资记录,但是投资开始还没过两年,西蒙斯就决定完全离开校园,全职进行投资活动,就此分析,西蒙斯刚开始的时候就应该是赚钱的。

1978年,他完全脱离了石溪大学,成了专业投资人。他成立了一个叫林姆若伊的基金,专门从事各种投资,其中主要是外汇交易,但是也包括投资各种小公司的现在统称创投基金的投资活动。

10年间,林姆若伊基金的投资回报是25倍,相当于每年增长38%左右,这和后来西蒙斯管理的大奖章基金的回报差不多。那时候西蒙斯还是花很多时间来关注宏观经济事件,比如美联储什么时候加息、加息之后美国债券的长期利率和短期利率都分别会有什么变化,之类的东西(在很多国家,中央银行只是间接控制政策利率,其他利率是由市场机制决定的)。他当年的投资方法是判断型的,直到10年以后的1988年,大奖章基金鸣锣开张,西蒙斯的投资方法才完全转型,从判断型转到量化型。

量化投资者和判断型投资者的最主要的区别在于,不用判断,而是完全依照公式。公式的好处是它的一致性:同样的信息输入同样的公式,得出的结果是一样的,跟输入的人是谁没有关系。

西蒙斯这样说:「首先,数学模型降低你的投资风险。其次,数学模型降低你每天所要承受的各种心理压力。」后面一点是很重要的,因为判断型的投资完全依赖大脑根据最新的信息做出最新的判断,所以,如果想要不贻误战机,大脑必须随时随地地保持高度警觉的状态,因为新的信息在不断出现,投资的仓位需要不断地调整。

西蒙斯正是技术交易量化型投资者的代表,但他不是唯一使用量化型方式投资的人。索罗斯、巴菲特和西蒙斯这三个人或许可以算是投资行业的福、禄、寿三星,他们使用完全不同的两类投资方法也说明这两种方法到目前为止还不能说哪一种更好。但有一点是明确的:量化型的投资方法还很年轻,它的发展壮大也不过是最近30年的事情。

目前,使用量化方式进行投资的各类基金和其他机构所管理的资金数额估计占全球投资总量的20%,在全球很多大型的股票交易所中,接近50%的交易量可以说来自各类量化投资的方式。在金融危机的影响之下,很多投资行业受到影响,但是量化投资(包括指数投资)仍然是基金管理里面增长最快的一个品类。运气依旧是西蒙斯在谈起投资的时候最经常提及的一个词。这当然一方面表现出他的谦逊,另一方面也反映了西蒙斯如何将投资的成败精确地转化成数学的概率来处理。

如果投资的结果完全是靠运气,那么成败各有一半的概率,这不是西蒙斯要做的,而是将概率提高到50%以上,也许从每笔投资来看,成功的概率略微超过50%并不是很出彩,但是很多笔加起来,投资所靠的「运气」就可能被变成风险有限的高额投资回报。

有些人将量化投资叫黑箱投资主要出于三个原因:

其一,大部分的量化投资基金都非常注意保密,因为它们的数学公式就是它们的命根子。如果告诉别人,这就像一个常常到密林的同一个角落采集珍贵蘑菇的人把这个地方告诉了别人,别人抢先挖走了蘑菇,而他自己只能喝雨水。所以,蘑菇在哪里,这是谁都不可以说的秘密。

其二,很多人都认为所有的量化投资公司都采用非常复杂的数学公式来进行,量化基金里面似乎到处都是像西蒙斯这样的,可以轻松出入十维空间的江湖异人。也有相当多的量化基金复杂在于它的科技:电脑系统、通信技术、电子交易手段等。

其三,对相当一部分人来说,依靠对技术型数据的研究分析来进行投资的行为是和使用占星术来预测个人的运程或者预测金融价格的走势很类似的。

二、关于有效市场假说的争议

像西蒙斯这样的人赚钱是轻松的,就像中国乒乓球运动员拿世界冠军一样容易吗?当然。然而真实的回答是,这两样事情都很不轻松。

金融投资领域有理论和实际不符的地方,哪个赚钱哪个说了算。实际中有人通过对已知信息的分析能够赚钱,那么我们就要质疑理论出了什么问题?

其实在20世纪70年代,也有研究结果发现一些有效市场假说所不能解释的现象,其中比较出名的有3个,分别叫规模异常、价值异常和动量异常。叫异常的原因就是因为它们违背了有效市场假说。规模异常是说小公司的股票长期来看表现好于大公司的股票。价值异常是说那些比较稳健、增长不快的公司股票长期来看表现好于高速增长的公司的股票。

按照有效市场假说和资本定价理论,这种现象不应该存在,因为如果大家知道这小公司股票和稳健型股票的收益相对较好的话,就会多买这两类股票,它们的股价相对上升,这两个异常也就不存在了。换句话说,这些异常的存在就说明市场没有合理使用已经知道的信息。

有意思的一点是,通常在金融研究中人们用的是四因子模型而不是法玛-弗伦奇三因子模型,除了上面的两个异常,还包括所谓的动量异常,这其实是市场趋势。过去一段表现好的股票,下面一段表现好的可能性要高于不好的可能性。

基本上所有投资者都可能会认同趋势,很多投资者就是依照趋势来进行投资决策的,包括很多技术交易高手,也有很多研究报告证明动量异常的确是存在的:你能够通过跟随趋势赚钱。但是,动量异常也和有效市场假说格格不入,因为这说明能够根据过去的价格来判断未来的走势。

换言之,市场没有合理使用目前所有的信息,尤其是这样简单的信息。

但是,法玛也许觉得把动量异常加进来的话要给出合理解释的难度比较大,所以法玛-弗伦奇三因子模型没有包括这个因子,只包括了规模因子和价值因子(动量因子和其他两个因子的相关性也比较大)。前面说的三因子模型或者四因子模型都好像少了一个因子,少的那个其实就是大市的回报。

大致来说,这些因子模型指出:任何股票的预期回报中,一部分是来自大市的预期回报,外加一部分是来自其他因子的预期回报,剩下的都是噪声。

有效市场假说有一个前提条件,就是长期而言,市场应该是有效。而短期之内的市场不有效,就是各类量化交易基金存在的空间。

三、算法有多酷不重要,有效才最重要

1988年3月,西蒙斯和埃克斯的文艺复兴公司和大奖章基金鸣锣开张,专门投资各类期货。他们管理的基金叫大奖章基金是源于西蒙斯和埃克斯得到的数学奖章。1976年,西蒙斯获得了美国数学学会5年一度颁发的维布伦奖,1967年埃克斯也曾获得过美国数学学会在数论方面设的5年一度的科尔奖,这都是全球数学界顶尖的奖项。

公司开张前后有三个重要的人物对公司的长期发展产生很大影响:里昂纳多·鲍姆,亨利·劳佛,以及前面已经提到过的数学家詹姆斯·埃克斯。这三个人都不是无名之辈。鲍姆是西蒙斯在国防分析研究院当密码破译员时的同事,在统计学中有一个算法是以他的名字来命名的,叫鲍姆-韦尔奇算法。鲍姆-韦尔奇算法可以确定某种不可确知的变量出现的概率,被广泛应用于生物、语音辨别和统计学上面。

举个投资的例子来说,假定在「正常情况」下,欧元兑美元的汇率背后有一种神秘力量在推动,这个神秘力量使汇率有两种潜在的变动趋势:向上,或者向下。「正常情况」的意思是指没有比较特殊的、小概率突发事件发生,比方说美国突然要接管某家大银行,或者欧洲某国首脑突然宣布辞职,诸如此类的事情。

但是我们无法确切地知道神秘力量究竟到底是在向上推还是向下推,因为我们只能看到实际汇率的升降,而实际汇率的变动既包含了神秘力量所带来的影响,也包含了很多其他因素所带来的影响。所以即便实际汇率升了,我们也不能断定神秘力量在往上推。我们只能判断说,往上推的可能性大一些。

鲍姆-韦尔奇算法可以根据各种过去发生的事件来推断目前神秘力量在往上推的概率有多大。如果这种判断的准确性超过一定水平的话,它就可以被用来交易了。

因为各种其他因素的影响可能是随机的,过一段时间可以互相抵消;但是如果能够比较准确地判断神秘力量向上或者向下推的可能性的话,你可以按照这种判断来交易:向上推的可能性大就买入,向下推的可能性大就抛出。
这样虽说不能每笔交易赚钱,但是过一段时间以后平均就能赚钱,也就是说,从统计的角度来看,你的交易在时间上是可以套利的。

西蒙斯当年觉得可以把鲍姆的算法用到外汇交易上来盈利,所以他央求老同事给他帮忙。西蒙斯曾经说:「当我把鲍姆说通之后,我就知道我们能编出交易模型来。」鲍姆将模型编好之后交给了西蒙斯。其实,当时鲍姆自己也在交易外汇,但是他用的不是模型,而是西蒙斯准备放弃的基本面法。西蒙斯开始使用鲍姆的模型之后几乎屡战屡胜。

当年正值撒切尔夫人当政,美元兑英镑的汇率是大家打猎的好战场,每天大家都赌英镑是升还是跌。那时的很长一段时间美元都持续下滑,英镑持续上涨,走势似乎只有一个方向,所以赚钱很容易。是西蒙斯会。很可能他当时就认定自己作为一个科学家来进行量化投资的比较优势——要成功,必须寻找到自己有比较优势的方向,这样才能事半功倍。

西蒙斯同时还邀来了此前同在石溪大学数学系任教的埃克斯加盟,对鲍姆的模型进行加工。埃克斯自然不是等闲之辈,他在数学的数论学和几何学中都有建树,有几个定理就是以他的名字命名的。埃克斯将鲍姆的模型用在外汇之外的其他投资工具上,发现模型不仅仅能在外汇上赚钱,也可以在其他商品期货交易中赚钱:小麦、原油什么的,都行。西蒙斯和埃克斯成立了一家公司,叫埃克斯有限公司,由埃克斯操刀。

1989年起模型似乎开始罢工,从年初到4月,大奖章赔了30%的钱。这时候西蒙斯和埃克斯的意见相左。后来,西蒙斯和埃克斯分道扬镳,请来了普林斯顿大学的数学教授劳佛来为公司的数学模型继续诊断和手术。

这里有一个传说,说劳佛和西蒙斯花了6个月的时间苦思冥想,最后决定将过去模型中的有关宏观经济数据的部分完全剔除,只留下技术性的数据。但是不知道此说法的真伪。因为毕竟对期货而言,宏观经济数据就是基本面的信息,也是波动的最主要来源。但是他们将注意力集中在短线的交易上也许可行。

这应该算是大奖章基金的「遵义会议」,当时制定的投资战略被保留至今,是大奖章基金长盛不衰的立命之本。劳佛于1991年全职加入了文艺复兴公司,至今仍然是公司的研究部负责人。

四、文艺复兴所追逐的「小的回报」到底有多小

文艺复兴旗下的超新星基金起初只是交易纳斯达克上市的股票,完全采取电子交易方式。20世纪90年代中叶,超新星基金的交易量占到纳斯达克相当大的份额,1997年有一天它的份额曾经达到14%。

从这个数字上我们还可以大致猜测一下大奖章基金的周转率和每笔交易的预期回报:假设它的年交易量是纳斯达克的5%,纳斯达克年交易量大概是10万亿美元,大奖章在纳斯达克的交易量就是5千亿美元,我们假定纳斯达克的交易量占到大奖章整

个交易量的一半,它的年交易量为1万亿美元,但是一来一回算一笔交易,它的部位总额为5千亿美元,大奖章的资产是50亿美元,毛回报假定为80%,一年的利润应该是40亿美元。拿40亿美元除以5千亿美元得到0.8%,也就是说,它每笔交易的平均回报只有0.8%,这就是西蒙斯说的「小的机会」。

拿5千亿美元除以50亿美元的资产得到100倍,意思是大奖章的年周转率为100倍,对共同基金来说已经超高了,但是是对于高速交易的量化基金并不出奇。这当然是个非常粗略的猜测。

五、大奖章基金交易策略的发展状况

开普勒金融管理有限公司于1992年被文艺复兴收购。公司的创始人费雷在随后的12年中,是文艺复兴的董事总经理、执行委员会的成员和管理委员会的成员,全面负责文艺复兴的研究和产品开发。

所以要说谁最知道该公司最核心的秘密,除了西蒙斯之外,弗雷紧随其后。费雷在自己的简历里一个个列出了他在文艺复兴的成就,因此我们可以从中看出不少文艺复兴的模型发展状况,尤其是大奖章基金的发展史上的一些里程碑:

5.1 组建利率研究部

开发风险控制和利率标价方法,使用以预测性为主和以市场性为主的利率模型。文艺复兴很可能是通过判断利率的短期走势(「预测性」的模型)来买卖相关产品。「风险控制」部分指的是总仓位的控制、多空的控制、各种部位相对大小和绝对大小的控制、各种止损措施,等等。

5.2 开发、实施、营销和管理了文艺复兴使用新模型的一档基金:「量股策略」(Equimetrics)

这档基金使用长期投资策略,低风险,股市中性(股票做多和做空的数量大致相等,所以跟大市波动的相关性不大。)。文艺复兴原有的投资人主要是「高净值客户」(也就是通常所说的富人)。

我们知道量股策略是从1999年4月开始运行的,它从1500只流动性比较强的股票或者优先股中由模型挑选出大约1000只股票,可能是做空,也可能是做多,整个投资组合的剩余风险(多的仓位减去空的仓位)通过使用股票指数期货来对冲。任何单一股票的权重都不超过整个组合的5%。

这个策略的交易速度不是很快,每年的换手率在1~3倍之间,杠杆也只有2~3倍。量股策略应该算是股票多空策略的一种,但是交易的频率比通常的多空策略要稍微低一些,它是下面将要说到的统计套利策略的慢速版本。

西蒙斯在谈起量股策略基金的时候说:「他们选股的模型也是在数据堆里面寻找重复性的规律,然后他们问自己:这些规律和市场运作、投资人的心理能不能挂上钩?如果能的话他们就按照新的规律改变选股的策略。」

西蒙斯致投资者的信中他提到了「基本系统」,这个基本系统就是该是在量股策略的基础上演变出来的。西蒙斯通过模型的运算,挑出两组股票来,分别做多和做空,做多的部分是整个基金值的170%左右,做空的部分是70%,两者加起来,整个基金的股票净值接近100%。通过模型的仔细挑选,西蒙斯认为这个基本系统能够和标准普尔500指数的回报相当,也就是能够匹配大市的回报,但是因为有多有空的原因,基本系统的风险只有大市的2/3。

5.3 风险管理模型的建立

费雷还为文艺复兴的风险管理系统,用于当时只有6000万美元的期货和债券基金。在模型提出之前,平均回报为26%,提出之后,1991年回报为34%,1992年为39%,1993年为39%,1994年为71%,1995年为33%,1996年为32%。同期基金规模增加到8.8亿美元。风险管理模型是人们看量化基金的时候容易忽略的一个方面,人们通常只是关注模型是如何选股、如何预测的。

其实军功章的另一半在貌不压人的风险管理模型里面:什么价位给某个仓位止损,投资组合出现何种亏损时给整个投资组合降低杠杆或者止损,各种模型的权重如何分配、如何调整,整个投资组合的杠杆如何调整,等等。这都会直接影响到基金的回报和风险,但是也常常被人忽略。

5.4 总结下关于大奖章的秘密

  1. 交易策略以短线操作为主。
  2. 通过统计信息分析方法来判断外汇和债券短期的价格变化,尤其关注过激反应的一类。在这个基础上加入了风险控制模型。之后又引入了统计套利,开始交易大量股票。
  3. 继续引入其他模型,分析像现价交易指令表这样的不太常用的数据来源。使用「每笔交易数据库」(记录每一笔交易的价格变化,而不是每分钟的价格变化);很可能使用限价指令表之类别人比较少用的数据进行分析。
  4. 模型用的不是很高深的数学,但是使用语音识别的分析方法来分析数据,很可能是统计信息论(伯乐坎普是专家)、最大熵(德拉·皮耶特拉兄弟是专家)及隐含马尔可夫模型(帕特森是专家)。而且使用不止一个交易模型获取信号;交易模型不断变化。
  5. 不用华尔街的专家,雇用研究人员看重科学和电脑背景。电脑和其他交易科技的运用对公司的成功是非常关键的,这家投资公司的名字里面有「科技」两个字就是线索。
  6. 对交易工具的流动性问题的考虑占很重要的位置。

西蒙斯有一次把他的投资策略和巴菲特的相比较,他说大奖章的投资有点儿像科罗拉多州的粗放型农耕:中间架一个喷灌,然后四周是一大圈的麦地,随便拔一个麦穗儿可能长得并不怎么样,但是大部分都还长得不错,靠数量、靠概率取胜。而巴菲特的投资方式更像密集型农耕,种的不多,每一个麦穗儿都很重要。他说:「我们的投资方法正好是两个极端。」

曾经是西蒙斯手下的几个前文艺复兴的成员总是告诫人们:「也许西蒙斯的秘密武器并不是他的秘密公式,而在于其他方面。」

伯乐坎普就很直接地说过:「我一直都认为文艺复兴的成功秘密是它从不雇用工商管理硕士。」他觉得这些从工商管名校出来的学生受到的都是同样的教育,接受的都是同样的价值观,采取的也都是同样的投资手段,所以他们在金融市场上就像一群羊,总要聚在一起,那样要是能有好的投资回报才怪。

很多著名的投资管理人都有这种看法,彼得·林奇在他的两本关于如何选股和投资基金打败华尔街的畅销书里面多次提到这个问题,认为即便是对金融一知半解的散户投资人也有机会打败满口术语、天天盯着电脑的专家,就是因为专家总是想着如何避免在同行评比中丢人,所以专家一般都扎堆儿。和许多成功的投资人一样,西蒙斯做事也不扎堆儿。

大奖章基金当然是量化到牙齿的基金。在量化基金的运作中,电脑模型收集大量的历史数据,然后从这些数据中寻找规律,这些规律一般用数学公式来表述,叫模型。

但这并不是说人完全是机器的奴隶。不管多么复杂的电脑模型,都是需要人去设计、编程、维护和控制的。

连西蒙斯自己都说,没有一个长期不变能赚钱的模型,所以,模型必须要不断更新,这也完全是通过人来完成的。文艺复兴的科学家整天都在寻找可能重复的规律,他们的研究对象是浩如烟海的金融数据。西蒙斯的公司在完成这项任务的时候用的是大批的数学家、统计学家、物理学家、语音识别专家,可以这样说,他们采取的寻找、比较、确定新的模型的方法在很大程度上借鉴了自然科学、工程科学的方法。换句话说,更多情况下,用实验来测试,让数字去说话。

他的投资模型所用的数学有多么高深,他的研究人员所需要的数学水平有多好呢?

西蒙斯透露,其实有些算法的代码才只有一两行。并没有想像当中那么复杂。有些甚至就是传统的技术交易思路,但是依然有效。

西蒙斯介绍说:「数学和其他科学其实很不同。数学要靠直觉,但是直觉对于凭试验来论证的其他自然科学来说并不是最关键的。在其他自然科学中,虽说直觉仍然重要,但是猜测和假设更加重要,设计合理的试验(来验证或者推倒猜测和假设)也是重要的。跟纯数学相比,其他自然科学可能涉及的面更加广,但不是那么深。

在文艺复兴,我们用的数学工具也挺复杂的,但是高深就谈不上了,不过我们用的统计学技巧就可能非常复杂。我所需要的研究人员的确要懂得一定的数学,这样他能很熟练地使用我们所用的各种研究工具。但是更重要的是他应该对事情的根源很好奇,富有想象力,而且有恒心去揭示这些根源。」

这段话是很值得那些立志在量化投资研究领域钻研的人深思的。

要想加入这个文艺复兴的「梦之队」,你可以不懂任何金融和投资,但是你不能不懂科学,每个新的员工候选人必须要在全公司员工面前讲解他的科学研究成果,这通常是和金融毫无关系的课题。很多科学家到了文艺复兴之后仍然从事跟他们过去的研究类似的工作,过去他们也许研究的是人的语音,或者基因,或者流动的液体,现在研究的数据是股票价格,所用的工具没有什么不同,工作单位的氛围也和大学或者科研机构相似。他们能看到自己的工资、奖金和投资的价值在飞速增长,但是很多人对金融仍然是一无所知。

六、重新审视西蒙斯的量化模型

6.1 市场过激反应

如果某个期货的价格在开盘的时候远远高于前一天的收盘价,沽空这个期货,如果开盘价远低于上一天的收盘价,就会买入。这个模型,创始人之一斯劳斯说,过去大家都靠这个模型赚了很多钱。这个模型针对的正是市场对于新的消息,反应过激的现象。当市场波动性较高的时候,模型表现会加好。

6.2 套利交易

如果美国政府债券长期债券的折价远远高于短期债券的折价,那么购入长期债券抛出短期债券,这是西蒙斯自己在2000年11月接受采访时透露过的,这样的机会现在已经不存在了。但在一些新兴市场的国家债券,市场上这类机会仍然可能存在。

6.3 趋势和联动性

就是追踪商品市场的中长期趋势,这个模型基本上现在已经不存在。但是由于商品期货交易的流动性越来越大,这个市场进行短线交易的机会应该越来越多,主要就是过激反应。

6.4 偏门信息

通过分析现价买卖指令表数据,来对下一步的价格变化进行预测。

6.5 买卖掉期合同

选择买卖流动性高,历史数据齐全,交易成本低的各种工具,外汇商品期货利率,蓝筹股票等。一个不得不提的失败

长期资本是含着金钥匙出生的,创始人麦利威瑟(John Meriwether)是华尔街的套利之王,掌管所罗门兄弟公司的固定收益套利部门超过二十年,这个部门是所罗门兄弟最赚钱的业务。团队核心骨干的奖金,经常比所罗门兄弟的CEO还要高几十倍。麦利威瑟知道光靠他个人肯定是不行的,需要构建一个强大的投资团队。于是他挖来了两位诺贝尔奖得主,一位是哈佛大学的教授罗伯特.默顿,另一位是著名的Black-Scholes期权模型创建者斯科尔斯。

1994~1997年间,长期资本管理将投资者投入的每1美元变成了2.83美元,这个成就丝毫不逊于西蒙斯的大奖章基金。开张第一年,1994年,基金的回报约为30%,这一年,大部分投资债券的人一般都赔了钱。1995年基金的毛回报59%1996年的毛回报为57%,净回报为41%,基金赚了21亿美元。

按照《纽约时报》记者洛温斯坦在他《营救华尔街》一书中所说,这一年,这个由有限的几个人组成的公司赚的钱要比麦当劳在全球卖汉堡包赚的钱多。

有一次创始人之一舒尔斯和美林银行几个销售人员共同去一个投资公司,舒尔斯兴致勃勃地讲述他们的套利策略,美林的一个年轻销售人员突然插嘴说美国政府债券市场不可能有这样的机会,舒尔斯很扫兴,他很生气地指着这个人说:「你就是我们的机会。正是因为市场上都是你这样的傻瓜我们才能赚钱」。可见当时长期资本多么的不可一世。塔勒布在《黑天鹅》一书中提出的,书中所提到的很多现象其实都是金融里面的肥尾:第一次世界大战、互联网的出现、「9·11」事件等的黑天鹅现象。

一个常常被人提到的黑天鹅的例子是「黑色星期一」,1987年10月19日,全球股市大崩盘,道琼斯美国股票指数一日之内狂泻23%,有人计算,按照正态分布和过去若干年的平均波动性,如果美国股市从宇宙存在的那一天开始天天开门交易,这样的跌法出现的概率仍然是微不足道的。不过,「黑色星期一」这种在布莱克-舒尔斯-默顿理论所做的假设下完全不可能发生的奇迹,还是发生了而且相当经常地发生。长期资本管理的衍生工具越来越多,1995年,面额为6500亿美元,到了1997年,面额达到12500亿美元,这是一个天文数字。

这个巨人,怀揣着12500亿美元的合同,站在10米跳台上,突然发现脚下的游泳池变得只有洗澡盆那样大,如果它要是强行跳下去,后果我们都可以想象。两位诺贝尔奖得主的诺贝尔奖约为100万美元,他们的长期资本管理基金在他们得奖后的第二年损失了4600个诺贝尔奖的奖金,总计46亿美元。长期资本的倒闭对于量化投资理念的打击在当时是沉重的。When Genius Failed是最为全面的金融历史书。

七、西蒙斯的动力究竟来自何方

他回答说:「我总是想把自己做的每一件事情做好。能够创造出一样好用的东西就是我的回报。文艺复兴有很多很多的模型,每添一个新的模型都会使我很开心,因为又有一个新的、好用的东西被创造出来了。」

金融投资的规律对西蒙斯来说是个特别的挑战,不像物理、化学定理,一旦发现,一般不会变化,而投资里面的规律则在不断变化。他说:「预测一个彗星的轨迹要比预测花旗银行的股价容易得多。但是,如果你能预测花旗银行的股价,你赚的钱要比预测彗星多许多。」

西蒙斯说:「我的确想同时干太多的事情,正是这样生活才有趣嘛。」

八、一些量化交易相关的工具

量化投资的模型和研究手段太多了,涉及很多貌似不相干的领域。可以毫不夸张地说,基本上所有理工科能用到的工具都已经在投资模型上试过了。除了高等统计学里面所罗列的研究方法之外,在量化投资中扎下根的还包括许多常常被人提到的其他研究工具和方法,比如:分型几何、模糊逻辑、神经网络、基因编程、隐含马尔可夫模型、小波变换、贝叶斯网络、分型几何、聚类分析,等等。

8.1 分型几何

「曼德勃罗特在50年就提出,各种金融价格的分布不是正态的,而是有比较明显的肥尾,价格的变化也有可能出现蝴蝶效应:很小的改变可能会引发市场的巨幅波动。他用棉花期货的价格作例子,用分型几何的方法分析了价格的分布,证明了他的观点。

他的研究表明:棉花的价格变动既有可以预测的一面,又有完全出人意料的一面。价格的变化不可以用正态分布来描述,但是可以用分型几何来很精确地描述。因为正态分布是漂亮的,又很容易计算,所以多数人都选择正态分布,而曼德勃罗特的关于肥尾的警告只有当黑天鹅游出来、金融体系岌岌可危的时候才被人想到。

8.2 模糊逻辑

一种进行逻辑判断和运算的方法,假定各种概念不能完全用「是」或者「否」来代表,而可以是70%的「是」,30%的「否」,亦即我们通常说的似是而非;做逻辑判断的时候也不能简单地说如果「是」的情况下则如何如何,要么如果「否」的情况下则如何如何,因为「是」或者「否」本来都不是完全确定的。在模糊逻辑中,判断都是要通过一些特定的模糊运算来完成。

可以看到,模糊逻辑的运算方法是针对现实生活中许多不能用泾渭分明的逻辑关系来表达的情况设计的,在量化投资分析中常常无法准确判断,所以存在同样的情况,使用模糊逻辑可能比较合适。

8.3 神经网络

前面提过,将很多小的模型组合起来,模拟人脑判断方式的运算方法,每一个小的模型都相当于一个神经元,可以单独简单思考,然后由一个「大脑」做出总判断。比如一个小模型只用双移动平均线法判断短期趋势,另外一个判断长期趋势,还有一个使用通道突破法,等等。每种模型分别判断,然后神经网络会把它们综合起来。这种方法也可以和模糊逻辑联合使用。

8.4 遗传编程

前面也提过。模仿生物进化中基因突变和重组的过程,让很多模型自由突变、组合,通过现实数据来寻找最能适应环境的模型组合。

8.5 隐含马尔可夫模型

马尔可夫模型指某种价格或者系统从上一个状态跳到下一状的随机过程,下一步和上一步之间没有什么直接的关系,也就是说,这个系统没有记忆。隐含的马尔可夫模型是指有些变量无法直接观测的情况,这个模型是在文艺复兴创业时代参与过的里昂纳多·鲍姆首先提出来的,现在在很多领域都有应用。

在金融中它可以被用来推测目前的市场状态究竟是趋势呢还是在区间徘徊,究竟是高波动性的状态还是低波动性的状态,等等。1993年加盟文艺复兴的剑桥大学数学博士尼克·帕特森就是全球这项分析技术公认的专家。2000年他离开文艺复兴,将这种分析技术用到人类基因的破译工作上。文艺复兴使用这种模型的可能性非常大。

8.6 子波变换

信号处理的一种技术。通俗地说,就是制造出一些特定的波动,叫小波,然后让这些小波跟所要研究的对象互动,等到再把小波分离出来的时候,小波里面就有关于研究对象的一些信息了。制造不同的小波,就能探听出不同的信息,这种方法在很多行业都有应用。

在处理金融数据的时候,用波的方法来分析应当算是一个比较独特的角度,因为波的长度、频率之类的概念是我们平常研究金融数据的时候不十分关注的东西。

举个例子,小波可以是一笔小的交易,通过市场价格对此的响应,你可以推断出是不是有什么大的交易潜伏在什么价位。

8.7 贝叶斯网络

贝叶斯计算方法归功于18世纪的英国数学家贝叶斯神父,主要的意思是说各种概率只是目前的一个不完全的信念,而不是上帝安排好的一成不变的东西(这当然不是贝叶斯神父的原话),人们应该按照最新出现的信息来更新各种概率。贝叶斯网络就是按照这个思路建立起来的一个网络,描述一系列不确定的数据和过程之间的可能存在的因果关系,并不断更新。

8.8 聚类分析

一种统计工具,按照数据和一些事先制定的标准将各种不同的对象分成不同的组群,其实也就是我们通常说的个子大的人站后边,个子小的往前站的杂版本。当然,用机器来完成的聚类分析不仅仅能在很短的时间内将大量的数据分门别类,而且能找到我们并不知道的类别。

后记

金融工程很吸引人。当然吸引人的一部分原因也是百万美元计的收入和未来的美好前景。以下是两个参考资料:

第一,弗雷的量化投资专业课程,文艺复兴的元老之一弗雷在石溪大学开办了量化投资专业。

这个专业的基础课包括线性规划、线性几何、数据分析原理、统计方法和概率论,专业课包括投资组合管理、资本市场、金融衍生工具和随机微积分、计算金融学、案例,高级课程包括高级投资组合最优化算法、高级期权标价理论、固息证券、信用衍生工具和标价等。这个专业和传统的金融、投资专业的侧重点有所不同。

第二,著名量化基金:大本营基金的招聘要求。

有金融或者相关学科的研究生以上的训练;之前的量化投资经验优先考虑;很强的电脑编程能力(C或者C++语言优先考虑),熟悉统计软件包(S+、MatLab或 SAS),熟悉网络编程语言;很强的数学或统计分析技能、时间序列和抽样数据分析能力;适应复杂、压力大、技术性很强的工作环境;处理大型数据库的能力;对投资类问题感兴趣,尤其是衍生工具、资产定价、市场异常、市场微观结构等;股票、固定收益投资、大宗商品经验;良好的写作能力和口头表达能力。

学历要求:金融、经济、统计、数学、运筹学、电子计算机、物理或其他相关学科的论文阶段博士生、博士。