在这一章节中,作者主要讲述了3方面的内容:1. 如何寻找潜在的好策略;2. 如何甄别适合自己的策略;3. 如何识别貌似可行的策略以及可能面临的陷阱。
一、在哪获取策略?
作者认为:
- “寻找交易理念事实上’并不是‘打造量化交易业务最困难的部分。每时每刻都可以廉价或免费的从公共空间找到成百上千项策略。
- 从事量化交易真正的窍门是”对基础策略进行变形,并用于挣钱”。
- 量化交易真正困难的是缺乏甄别策略的能力。
作者推荐的获取策略的途径:金融投资方面的相关书籍、报纸杂志、主流媒体网站、学术论文、交易员论坛、博客等。
二、如何甄别适合自己的策略?
“一项策略是否可行通常并不取决于策略本身,而是取决于使用策略的人。”在甄别策略时需要考虑如下内容:
工作时间:如果交易只是兼职,建议考虑隔夜持仓的策略,或是那些完全自动交易的策略;日内交易的策略一般
适合于全职交易者。
编程水平:如果编程水平高,可以开发高频交易策略,交易大量的证券;反之,适合选取那些每天只交易一次或
是只交易几只股票、期货、外汇的策略。
交易资本:可用资本是策略选择的一个约束条件。可用资本会影响开户类型(零售经纪账户、自营交易账户)、
可用资金还决定应该选择单向交易(纯多头、纯空头)还是货币中性交易(对冲交易、配对交易), 一般货币
中性组合或市场中性组合需要的资本或杠杆是单向组合的2倍。此外,可用资金还会制约你在设备、数据库、软
件上的花费。目标:你的目标是获取稳定的月度或季度收入还是大额的长期资本收益,对应策略的持有期是不一样的。一般如果想要更频繁的实现盈利或挣取收入,持有期应该尽可能的短,一般选择夏普率高的策略。在不考虑成本的情况下,即使目标是大额长期增长,“高夏普率和低年化收益的短期策略”也会比“低夏普率和高年化收益的长期策略”要好。
三、如何识别可行的策略?
3.1 与业绩基准相比如何?收益持续性如何?
选择收益比业绩基准高且比业绩基准收益更稳定的策略;
- 基准一般指证券所属的市场指数、无风险资产等;
- 业绩衡量指标:信息比率、夏普比率。如果一项策略的年交易次数有限,夏普比率很可能就不会太高;如果一项策略的挫跌很大(如>10%),或者挫跌时间很长(如4个月或更长),也不大可能有较高的夏普比率。
经验规则:任何夏普率低于1的策略都不适合单独使用。几乎每个月都盈利的策略,其(年化)夏普率通常大于2;几乎每天都盈利的策略,其夏普率通常大于3。
3.2 挫跌多深?多久?
时刻t的挫跌 = 当前净值(假定期间内未发生任何赎回或注资)- t时刻或之前的净值曲线最大值;
- 最大挫跌 = 净值曲线最大值(高水位线) - 之后的净值曲线最小值;
- 最长挫跌期 = 净值重返亏损前的水平所花费的最长时间;
在投资组合清盘或策略结束前,需要弄清楚自己能承受的多深和多久的挫跌?将自己的承受底线与备选策略结果进行比较,从而选择最适合自己的那个策略。
3.3 交易成本如何影响策略?
交易越频繁,交易成本对策略盈利的影响越大;
交易成本包括:
① 经纪商收取的佣金;
② 流动性成本:当以市场价格买卖大笔证券时,在完成交易之前,下达的交易指令就会引起市场价格的变动,
造成“市场冲击”,最终未能按预定价格成交,多支付了买卖价差;这个多支付的买卖价差也称
为“冲击成本”,常用来衡量市场的流动性;
③ 机会成本:若限价交易指令不被执行,会因此错失交易的潜在盈利所造成的成本;
④ 滑点:由于互联网或各种软件的滞后,使得指令通过程序传送给经纪商的时刻与指令在交易所被执行时刻存
在滞后(延迟),这种滞后(延迟)会造成“滑价”,即触发指令的价格与执行价格之差。造成滑点的原因可能有:
① 经纪商执行速度较慢;
② 风险控制原因:指令被传至交易所前,或检查你账户是否有购买能力、各项风险控制是否达标,使得交易被
延迟;
③ 经纪商连接交易所的网速太慢;
④ 经纪商没有足够的“暗池”流动性。
3.4 数据有无存活偏差?
- 金融数据库中存的股票价格历史数据,往往不包含破产、退市、兼并或收购而消失的股票,只有那些幸存下来的股票,就会存在存活偏差;
利用有存活偏差的数据进行回测,会夸大策略的历史业绩,这对有“价值偏好”的策略影响尤为突出。如果一个策略是倾向于买便宜的股票,如果存在“存活偏差”,那该策略选出的股票都是在当时非常便宜却幸存下来的股票,而不包含那些没有幸存下来的退市的股票,这样得到的回测结果当然会比当时的真实情况下的结果好很多,所以回测结果是被夸大了。
3.5 策略如何随时间变化而变化?
在判断一项策略的适用性时,需要重点关注最近几年的业绩;
早年的金融数据并不能简单的应用于今天相同的模型,因为金融市场可能会发生“状态转换”(指金融市场结构或宏观经济环境发生了巨变,从而使得原本盈利的策略现在不盈利了),如证券市场监管的变化、宏观经济事件都能导致重要的市场转换。
3.6 策略是否存在数据迁就偏差?
一般而言,策略的规则越多,模型的参数越多,就越有可能遭遇数据迁就,也就所谓的过拟合现象;
- 有效的AI方法通常具有以下特征:
① 基于正确的计量经济学或理论基础,而不是随机发现的模式;
② 所需参数用到历史数据较少;
③ 只用到了线性回归,并未使用复杂的非线性函数;
④ 概念上很简单;
⑤ 所有优化都必须在不含未来未知数据的移动回顾窗口中实现,并且这种优化的效果必须不断地被未来未知的
数据所证明。