Huffman Coding 霍夫曼编码

霍夫曼编码主要是利用当前出现的不同字符重新创建对应键值,且字符出现频率越高,采用越短键值映射,降低大小。

比如对“Life is beautiful.”进行霍夫曼编码的话,只要创建[L|i|f|e|s|b|a|u|t|l| |.]12个不同键值代替即可,而不是如UTF8编码,每个字符都需要占用不变的大小(大小由该编码总共可表示的字符数决定):1~4字节。

霍夫曼编码后大小约为:65bits
原大小:18symbols * 8bits 约为144bits
效果:大小降低一倍多

huffman