字符串压缩

>>> aaabbbcc
<<< a3b3c2
直接操作二进制数据以避免字符串复制
识别出原始字符串的数字 => 整数(重复数字)固定长度表示法

霍夫曼编码压缩(熵编码法):频繁使用的数据用较短的代码代替,很少使用的数据用较长的代码代替,每个数据的代码各不相同。产生霍夫曼编码需要对原始数据扫描两遍,第一遍扫描要精确地统计出原始数据中的每个值出现的频率,第二遍是建立霍夫曼树并进行编码,由于需要建立二叉树并遍历二叉树生成编码,因此数据压缩和还原速度都较慢

字节对编码(字典编码法)