TSAC:极低比特率音频压缩
TSAC 是一种音频压缩工具,能够实现极低的比特率,例如对于单声道音频为 5.5 kb/s,对于立体声音频为 7.5 kb/s,采样率为 44.1 kHz,同时保持良好的感知质量。因此,TSAC 可以将一首 3.5 分钟的立体声歌曲压缩成一个 192 KiB 的文件。
为了快速操作,需要一块 Nvidia GPU。当然,仅使用 CPU 也是支持的,但速度会更慢。
技术信息
TSAC 基于一个修改版的 Descript Audio Codec(描述性音频编码器),该编码器已扩展至立体声,并结合了一个 Transformer 模型以进一步提高压缩比。两个模型的参数均被量化到每个参数 8 位。
Transformer 模型以一种确定性且可复现的方式进行评估。因此,结果不依赖于具体的 GPU 或 CPU 型号,也不依赖于配置的线程数量。这个关键点确保了一个压缩文件可以使用不同的硬件或软件配置进行解压缩。
下载
- Linux 版本:tsac-2024-04-08.tar.gz。
- Windows 版本(实验性):tsac-2024-04-08-win64.zip。