1. 哈夫曼压缩原理
- 首先要明确一点,计算机里面所有的文件都是以二进制的方式存储的。
- 在计算机的存储单元中,一个ASCII码值占一个字节,1个字节等于8位(1Byte = 8bit)
可以参考这个网站:
ASCII码在线转换计算器
以"JavaJavaJavaJavaJavaJava"这个字符串为例,它在计算机内部是这样存储的(每一个字符的ASCII码转换为二进制存储起来):
public static void main(String[] args) {
String beforeStr = "JavaJavaJavaJavaJavaJava";
StringBuilder afterStr = new StringBuilder("");
for (int i = 0; i < beforeStr.length(); i++) {
afterStr.append(binaryToDecimal((int) beforeStr.charAt(i)));
}
System.out.println(beforeStr + "\n 在计算内是这样存储的: \n" + afterStr);
System.out.println("afterStr.length = " + afterStr.length());
}
public static String binaryToDecimal(int n) {
StringBuilder str = new StringBuilder();
while (n != 0) {
str.insert(0, n % 2);
n = n / 2;
}
while (str.length() < 8) {
str.insert(0, '0');
}
return str.toString();
}
可以发现现在“JavaJavaJavaJavaJavaJava”转01字符串的长度位192
验证文件大小:
-
首先,我新建了一个文件 -
填充内容
- 查看大小
文件大小为24字节 = 24 * 8 = 192bit
以 “JavaJavaJavaJavaJavaJava” 这个字符串每个字符出现的次数为权值建立最优二叉数
所以“JavaJavaJavaJavaJavaJava”可以表示为: 001011001011001011001011001011001011 ? 长度为36
所以压缩率为: 原来长度是 192,压缩了 (192-36) = 156 压缩率:156/ 192= 81.25%
|