1. 信源编码

【网易公开课】信源编码

1.1 概述

通信系统的有效性最直观的体现方式就是信息传输速率，也就是单位时间内传递的信息量
信息传输速率主要取决于三个方面的因素，分别是符号速率，信源熵和噪声熵
符号速率与信道带宽有关，一般根据应用需求来确定，噪声熵与信道条件有关，由应用环境确定，而且两者也与系统成本有关。
提高信源熵是提高通信系统有效性的一个重要途径,也就是提高信源单位符号所携带的信息量。

1.1.1 信源编码的作用

提高通信的有效性。压缩信源的冗余度。（信源的不等概带来的）
压缩每个信源符号的平均比特数。（使一个符号传输足够多的信息）

1.1.2 无失真信源编码

实质上是统计匹配编码，根据信源符号的不同概率分布选择匹配的码

1.1.3 信源统计剩余度

无记忆信源
- 概率分布的非均匀性
有记忆信源
- 符号的相关性及符号概率分布的非均匀性
压缩信源冗余度
- 去除码符号间的相关性
- 使码符号等概分布
  1.2 信源编码器模型
  1.2.1 信源编码
  将信源符号序列按一定数学规律映射成码符号序列的过程

解释：

信源单符号有种可能
每种可能需要与码字对应，然后送到信道上
每一个码字是由编码器编码完成映射，由码符号组成，长度为

1.3 N次扩展码

信源符号S的N次扩展视为，N个信源符号的排列组合
对应的码字的N次扩展视为，N和码字的排列组合

1.4 编码术语

码字：码符号序列
码长：一个码字的码符号个数，即
码组：全体码字的集合
定长码：一个码中所有码字的码长相等
变长码：一个码中不是所有码字的码长都相等

1.5 奇异码

若信源符号和码字是一一对应的，为非奇异码，否则为奇异码
奇异码无法完成正常的传输，存在同一码字对应不同信源的情况

1.6 唯一可译性

任意一串有限长的码符号序列只能被唯一地译为对应的信源符号序列，则为唯一可译码（单义可译码、异前置码）
需要满足
- 码字与符号是一一对应的（即奇异码不具备唯一可译性）
- 不同的信源符号序列对应不同的码字序列（编码唯一性）
- 非奇异码不一定是唯一可译的
- 非奇异码+等长码⇨唯一可以码
非唯一可译性常常存在于不等长码时，起始的码字由几个码符号组成不确定，有不同的翻译结果

1.7 即时码

1.7.1 即时码的判断

某个唯一可译码在接收到一个完整的码字时无需参考后续的码符号就能立即译码，称为即时码
即时码的要求：任何一个码字不是其它码字的延长或前缀

1.7.2 即时码的构造
即时码的构造方法
- 树图法
- 将码字安排在终端节点上
码树分类
- 完全树：每个中间节点的具备的分支数相同
- 整树（满树）：终端节点阶数相等，整个树完全生长
  1.7.3 码树和码字的对应
树根——码字起点
分支数——码的进制数
节点——码字或码字的一部分
终止节点——码字
节数——码长
非满树——变码长
满树——等码长
[x] 例题

构成的瞬时可译码是不唯一的
同样可以用于多元编码

1.8 相互关系

2. 定长码及定长信源编码定理

2.1 唯一可译长码存在条件

非奇异码
定长码
唯一可译码

信源符号集有【信息论】无失真信源编码 - 图11 个符号，码符号集【信息论】无失真信源编码 - 图12 种码元，定长码码长【信息论】无失真信源编码 - 图13
需要满足
【信息论】无失真信源编码 - 图14
N次扩展信源后需要满足
【信息论】无失真信源编码 - 图15

2.2 定长信源编码定理

如果不考虑符号间的依赖关系
码长为
【信息论】无失真信源编码 - 图16

若考虑符号间的依赖关系，对不可能出现的符号不进行编码，可以缩短码长
求定长信源编码所需码长的极限值

【信息论】无失真信源编码 - 图17

【信息论】无失真信源编码 - 图18 个码元承载的信息量要大于N个信源信号的信息量
只要满足这个条件，就可以实现无错通信

定长编码定理同样适用于离散平稳有记忆信源，需要将信源熵【信息论】无失真信源编码 - 图19 改为极限熵【信息论】无失真信源编码 - 图20
定义
【信息论】无失真信源编码 - 图21
代表每个信源符号编码后能载荷的最大信息量

定义
【信息论】无失真信源编码 - 图22
为编码效率
最佳编码效率接近于1

2.3 信源序列长度界限

在已知方差和信源熵的条件下，要达到最佳编码效率并且允许的译码错误概率小于任一给定的正数，信源序列的长度存在一定的要求

【信息论】无失真信源编码 - 图28
解释（【信息论】无失真信源编码 - 图29 求解）：
【信息论】无失真信源编码 - 图30
解释（【信息论】无失真信源编码 - 图31 求解）：
【信息论】无失真信源编码 - 图32

3. 变长码及变长信源编码定理

3.1 Kraft不等式

即时码和唯一可译码存在的充要条件：

【信息论】无失真信源编码 - 图33

此为存在性证明不能当作判断性证明
变长码要成为唯一可译码，不仅本身应是非奇异的，它的有限长次扩展码也应该是非奇异的
例题

3.2 变长唯一可译码的判别

构造F1 ：
- 考察C中所有码字，如果一个码字是另一个码字的前缀，则将后缀作为F1 中的元素。
构造Fn：
- 将C 与Fn-1比较。如果 C 中有码字是中元素的前缀，则将相应的后缀放入Fn中；
- 同样Fn-1中若有元素是C 中码字的前缀，也将相应的后缀放入Fn中。
检验Fn
- 如果是空集，则断定码C 是唯一可译码，退出循环；
- 反之，如果 Fn 中的某个元素与 C中的某个元素相同，则断定码C不是唯一可译码，退出循环。
- 如果上述两个条件都不满足，则为唯一可译码。

3.3 紧致码平均码长界定定理

平均码长

【信息论】无失真信源编码 - 图35

对于无噪声信道来说，如果假设信源符号速率r=1，信息传输率R（熵速率）即单位时间内传输的信息量就等于信源熵H(S)
原始信源S 经过信源编码器之后，原始信源符号集S:{s1,s2,…,sn}经过映射变换为由信道码元表示的码字符号集W:{W1,W2,…,Wn}。这时在接收机看来，信源已经是一个由信道码元符号集A:{a1,a2,…,aq}表示的新的信源A，这时的信息传输率为

【信息论】无失真信源编码 - 图36