这一模块围绕着信息的产生,也就是信息的源泉,香农称为信息源。

    |






    定义 |
    - 过去:人们试图从内容出发,通过对比重要性,度量信息。
    - 目标:香农说,对于一条信息,重要的是找出其中有多少信息量,要搞清楚信息量,就要对信息进行量化的度量。


    度量信息量的基本单位,就是 比特。

    比特的定义:
    - 如果一个黑盒子中有 A 和 B 两种可能性,它们出现的概率相同,那么要搞清楚到底是 A 还是 B,所需要的信息量就是一比特。
    - 如果我们队这个黑盒子有一点知识,知道 A 的概率比 B 大,那么解密它们所需要的信息就不到一比特。


    多于 A 和 B 两种场景消除它的不确定性需要多少信息呢?
    - 确定四选一问题的答案需要 2 比特。
    - 确定世界杯冠军的问题需要 5 比特。


    信息概念的关系:
    - 信息源:充满不确定性的黑盒子。
    - 信息熵:黑盒子里的不确定性。
    - 信息:用来消除不确定性(信息熵)。
    - 搞清楚黑盒子里是怎么一回事,需要的信息量等于黑盒子里的信息熵。


    熵的概念:
    - 热力学中表示一个系统的无序状态,或者说随机性。
    - 信息系统,表示一个系统的不确定性。
    - 一个系统中的状态数量,也就是可能性,越多,不确定性就越大;在状态数量保持不变时,如果各个状态的可能性相同,不确定性就很大;相反,如果个别状态容易发生,大部分状态都不可能发生,不确定性就小。


    信息熵的计算公式:
    image.png
    举例说明:
    - 买彩票两个号,一个必中奖,不确定性小,10000 个号,不确定性大。


    image.png
    - 横轴是 A 发生的概率,从 0 到 1 分布,纵轴就是熵,也就是确定它发生,你需要的信息量。
    - 当 A 发生的概率正好是 1/2 时需要的信息熵达到顶峰,是一比特。


    赌球的庄家总是稳赚不赔,可以从信息论的角度看清这个问题。很多类似的复杂难题都是信息熵的计算问题。
    - 如果大家都往德国队身上下注,结果预测德国获冠军的概率就很高,所以押注的多少其实就是大家给出的概率。
    - 开赌局的,只要收费比信息实际的价值高,都是稳赚不赔的。
    - 开赌局的从来不是拿自家的钱和你对赌,而是让你们彼此互相赌,他通过变相多收费盈利。
    - 金融市场的结构化证券。高盛。


    信息过载问题解决:
    - 判断一篇报道里有多少信息量。
    - 讲的事情大部分大家都知道,信息量就很少。
    | | | —- | —- | —- | | | |
    - 永远不要听那些正确率总是 50% 的专家的建议,因为那相当于什么都没说,没有提供能够减少信息熵的信息量。
    - 很多交易和产品都是利用了信息的可度量性,知道这点,可以看清很多复杂交易背后的原理。


    要点:
    1. 香农告诉大家,信息可以衡量,但不是用重要性,而是用信息量,单位是 比特。
    2. 你可以把一个充满可能性的系统视为一个 信息源,它里面的不确定性叫做 信息熵,而 信息 就是用来消除这些不确定性的,所以搞清楚黑盒子里是怎么一回事,需要的 信息量 就等于黑盒子里的 信息熵。
    3. 很多复杂交易和产品都是利用了信息的可度量性,把信息问题变成了概率问题。
    4. 信息量的大小不在于长短,而在于开创多少新知。
    | | |