裙摆指数

    信息理论严格分析信息对股市涨跌的影响




    条件熵




    同一条信息使用一万遍,只有第一次会产生结果,后面都不会产生结果。


    股市的不确定性不再是 H(X)






    信息增益(IG)














    如何找到遗漏的信号,确定有效性
    假定,股市的涨跌是个随机变量,用 X 表示,对于它的全部不确定性,就是 X 概率分布所对应的信息熵,通常用 H(X) 这个符号来表示。

    若得到内部信息,用 Y 表示,那么股市对于你的不确定性就是 Y 条件下,X 概率分布的信息熵了,通常 H(X|Y) 表示,它被称为条件熵,Y 是条件。

    也就是说,在别人眼里,股市的不确定性是 H(X),而在你眼里,因为有了信息 Y,因此它的不确定性变成了 H(X|Y)。

    H(X|Y) <= H(X)。等号成立的条件是,你得到的消息和股市无关,那些无关的信息既不会帮你也不会害你。

    好消息:如果你得到的消息,是股市变化的等价消息,别人还不知道。股市对你来说就确定了,X 和 Y 是等价信息,他们的条件熵瞬间降到了 0。

    坏消息:如果你知道的消息,别人也知道了。由于市场的有效性,也就是股价能够充分反映所有信息。

    假定大家使用过的关于股市的各种技术指标分别是 Y1,Y2,Y3,…,YN,有 N 种。

    股市的不确定性是在这些信息下的 H(X|Y),Y2,Y3,…,YN),也就是在 Y1,Y2,Y3 一直到 YN 所有信息都使用后的条件熵。

    这时再将其中的某个指数,比如 Y5 重复使用,不会得到任何更好的结果。


    最有效的信息已经被发现了,剩下来留给大家的微乎其微。


    在没有任何信息的情况下,X 的不确定性是 H(X)。在有了 Y1 这个有用信息后,它的不确定性变成了条件熵 H(X|Y1)。它比 H(X) 有所减少。

    那么 Y1 所带来的信息增益就是 H(X) - H(X|Y1),我们写作 IG(Y1)。

    IG 越大,说明消除的不确定性越大,X 和 Y 越具有相关性。

    Y2 所带来的信息增益就是在原来Y1基础上的增加,写作 IG(Y2)。
    N 种不同的信息,从数学上看,它们带来的信息增益,每一个都是在原来所有信息基础上递减的。

    通常,人们总是率先发现和所要解决问题互信息最大的信息,也就是增益最大的信息,因此通常来讲,越往后发现的信息,带来的增益越小。世界上的股市已经被人研究了几百年,各种直观的能够预测股市的有用信号已经被挖掘殆尽。


    找到遗漏的信息,要确定两件事,才能知道它有没有用:
    1. 这个信号不要和其他已经采用过的信号重复,或者相互覆盖。
    2. 这个信号带来的结果要有足够高的置信度,也就是说,如果它让你的收益平均高出 1 %,收益浮动的区间要远远小于 1%,否则浮动区间高达 10%,那就一点意义没有了。


    一条信息价值的决定因素:
    - 取决于这条信息对未知系统所带来的信息增益。
    - 两条信息,先出现的,价值更大,第二条价值就小。
    - 两条信息相互正交,那么第二条信息依然有价值。
    - 学术论文出现;媒体报道首发;第一个提出看法的是意见领袖。

    1. 用条件熵的概念,解释了为什么大众已知的信息对投资和其它决策其实都没有意义。
    2. 我们给出了一个定量衡量每一条信息价值的尺度,就是信息增益。
    3. 我们用上述理论解释了为什么在一个研究领域最初的发明贡献,影响力最大。对于每个人,第一个发表意见,以及能够发表与众不同的意见,对提高自己的影响力至关重要。




    H(X|Y) <= H(X) 这里的 Y 是指只有我知道,别人不知道的独特信息。如果尽人皆知的共同认知,那么在这里也没用。
    所以真正擅长利用信息去挣钱的人,是不会把自己的独特秘密放到公开场合的,这样就失效了。
    如果想要被人记住,也要敢为人先,不做意见追随者,而是意见领袖。