- 数据压缩入门
- (美)柯尔特·麦克安利斯 亚历克斯·海奇
- 372字
- 2020-08-29 00:38:21
1.1 5类数据压缩算法
数据压缩算法其实是一个相当大的主题,好在我们可以对所有这些算法进行分类。分类之后,这些算法理解起来也就更容易了。简单地说,数据压缩算法有5类:变长编码(variable-length codes,VLC)、统计压缩(statistical compression)、字典编码(dictionary encodings)、上下文模型(context modeling)和多上下文模型(multicontext modeling)。所有这5类算法都有很多变种,这是一件好事,因为我们可以根据自己的需要来选择。每类算法的变种在输入数据、算法性能、内存要求以及输出大小方面存在细微的差别。要选出其中最佳的一个算法,需要在准备的数据上测试这些算法,然后找出压缩效果最好的那个。
这几类算法也可以混合使用,因为其中有些算法的目的就是转换数据,使得其他的算法在压缩时更有效。
如果想成为数据压缩方面的专家,那么你就必须理解这几类算法、如何搭配使用它们,以及对于特定的数据集需要从哪类算法中选出一个具体的算法。
下面我们开启学习之旅吧。