IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 数据结构我好爱:09 Huffman树(无理论版) -> 正文阅读

[数据结构与算法]数据结构我好爱:09 Huffman树(无理论版)

现在默认你已经明白了Huffman树的原理!(问就是理论我也不会!)

通过我片面操作的有了片面的结论:

? ?在Huffman应用与字符压缩的时候,虽然原理是树,但是确实主要的就表,有好几种记录表来记录信息:孩子双亲以及权重的记录,单个字符对应编码串的记录等

各种结构体:

? ? ? ? 1.单个node存储字符与出现次数

? ? ? ? 2.根据ASII码,字符共128种且有部分无法打印显示

? ? ? ? ? ? ? ? 创建List记录表

? ? ? ? 3.创建孩子双亲记录表:

? ? ? ? 4.字符编码记录表:通过char就可以确定它的编码串

typedef struct {
	char ch;
	int count;
}node;

typedef struct {
	node data[catage];//128种
	int length;
}List,*ListPtr;

typedef struct {
	int parent;
	int lchild;
	int rchild;
	int weight;
	char data;
}record_map,*record_mapPtr;//记录表

typedef struct {//unoder_map <char,int>
	char data;
	char* str;
}code_graph, * code_graphPtr;//编码表

初始化:

? ? ? ? 1.List记录表的初始化,length是为了记录有多少种不同的字符串(与后文cat:category相同);

? ? ? ? 2.创建字符编码记录表

ListPtr Init() {
	ListPtr list = (ListPtr)malloc(sizeof(List));
	list->length = 0;
	return list;
}

//----------------------------------------------

code_graphPtr Init_graph(int len) {
	code_graphPtr graph = (code_graphPtr)malloc(sizeof(code_graph)*len);

	for (int i = 0; i < len; i++) {
		graph[i].str = (char*)malloc(sizeof(char) * len);
	}
	return graph;
}

读取文件:

? ? ? ? fgets?读取一行(.txt的一行可以 “ 无限长 ”)读取到source数组;

void Read(char* source) {
	FILE* fp = fopen("D:\\D_desktop\\input.txt", "r+");
	if (fp == NULL) return;
	else {
		fgets(source, Max, fp);
	}
	fclose(fp);
}

字符计数:(靠字符串与整数的变换)

? ? ? ? ASII数组,字符的编码小于128;

? ? ? ? memset ASII数组全置为0;

? ? ? ? ASII [i] 的值表示字符 i 的出现次数

? ? ? ? ASII数组非0的数据都交给List记录表吧!

void CharCount(ListPtr list, char* source) {
	int ASII[catage];
	memset(ASII, 0, sizeof(int) * catage);
	for (int i = 0; i < strlen(source); i++) {
		ASII[(int)source[i]]++;
		//printf("%c --%d \n", source[i],ASII[source[i]]);
	}
	for (int i = 0; i < catage; i++) {
		if (ASII[i] != 0) {
			//printf("%c --%d \n", i, ASII[i]);
			list->data[list->length].ch = (char)i;//???
			list->data[list->length].count = ASII[i];
			list->length++;
		}
	}
}

选择两个较小权值:每次选取前 len 个当中的两个权重较小值

????????_CRT_INT_MAX; 是vs自带定义的宏

void select(int len, int* tow_ints, record_mapPtr root) {
	int min = _CRT_INT_MAX;
	for (int i = 1; i <= len; i++) {
		if (root[i].weight < min && root[i].parent==0) {
			tow_ints[0] = i;
			min = root[i].weight;
		}
	}
	min = _CRT_INT_MAX;
	for (int i = 1; i <= len; i++) {
		if (root[i].weight < min && i != tow_ints[0] && root[i].parent == 0) {
			tow_ints[1] = i;
			min = root[i].weight;
		}
	}
}

创建孩子双亲权重记录表:

? ? ? ? 二叉树有一种数组表示方法:创建孩子双亲权重记录表的过程其实就是创建了一颗树;

record_mapPtr creatHuff(ListPtr list) {
	record_mapPtr root = (record_mapPtr)malloc(sizeof(record_map) * ((list->length) * 2 + 1));
	int total = 2 * list->length - 1;
	for (int i = 0; i <= list->length; i++) {
		root[i].parent = 0;
		root[i].lchild = 0;
		root[i].rchild = 0;
		root[list->length + i].parent = 0;
		root[list->length + i].lchild = 0;
		root[list->length + i].rchild = 0;

		root[i+1].weight = list->data[i].count;
		root[i+1].data = list->data[i].ch;
		//printf("%c ", list->data[i].ch);
	}
	int min[2];
	for (int i = list->length + 1; i <= total; i++) {
		select(i - 1, min, root);
		root[i].lchild = min[0];
		root[i].rchild = min[1];
		root[i].weight = root[min[0]].weight + root[min[1]].weight;
		root[min[0]].parent = i;
		root[min[1]].parent = i;
	}
	return root;
}

?生成code文件:

? ? ? ? 1.只查找叶子结点,并得出单个字符的编码串;

? ? ? ? 因为是从叶子往上知道根节点(0节点就是根节点),所以编码串顺序为倒序,通过从后往前取来解决;

????????2.获得编码串;

? ? ? ? 当前叶子的父母为p,如果它是p的左孩子则存入 0,否则 1

????????然后p的父母为q,如果它是q的左孩子则存入 0,否则 1、、(开始套娃!!!)

????????直到p==0;

? ? ? ? 3.获得codefile.txt文本

????????由上得到的是出现字符的编码,有编码记录表记录,遍历源文件source,挨个字符转化为编码串并存入codefile.txt当中;

void codefile(code_graphPtr graph, ListPtr list,record_mapPtr root,char* source) {

	FILE* fp = fopen("D:\\D_desktop\\codefile.txt", "w+");
	if (fp == NULL) return;
	int cat = list->length;
	char* code_str = (char*)malloc(sizeof(char) * (cat + 1));
	code_str[cat] = '\0';
	int start = cat - 1;
	for (int i = 1; i <= cat; i++) {
		graph[i-1].data = root[i].data;
		int p = root[i].parent;
		int child = i;
		while (p != 0) {
			if (root[p].lchild == child) code_str[start--] = '0';
			else code_str[start--] = '1';
			child = p;
			p = root[p].parent;
		}
		strcpy(graph[i-1].str, &code_str[start+1]);
		/*printf("%c---> %s \n", graph[i - 1].data, &code_str[start+1]);
		fputc(graph[i - 1].data, fp);
		fputc(':', fp);
		fputs(graph[i-1].str, fp);
		fputc('\n', fp);*/
		start = cat - 1;
	}
	for (int i = 0; i < strlen(source); i++) {
		for (int j = 0; j < cat; j++) {
			if(source[i]==graph[j].data) fputs(graph[j].str, fp);
		}
	}
	fclose(fp);
}

解码并存入output文件:

? ? ? ? 因为每个编码串不可能有重叠部分:每个结点都特意被放在了叶子结点上,如果要有前缀重叠部分就一定得是祖先与后辈的关系!

? ? ? ? 通过特定的编码串找回原来的叶子结点(无左右孩子就是其判断条件!)

void decode(int len,record_mapPtr root) {
	FILE* fp = fopen("D:\\D_desktop\\codefile.txt", "r");
	if (fp == NULL) return;
	FILE* fp2 = fopen("D:\\D_desktop\\output.txt", "w+");
	if (fp2 == NULL) return;
	char* code = (char*)malloc(sizeof(char) * Max * len);
	fgets(code, Max * len, fp);
	int R = 2 * len - 1;
	for (int i = 0; i < strlen(code); i++) {
		if (code[i] == '0') R = root[R].lchild;
		if (code[i] == '1') R = root[R].rchild;
		if (root[R].lchild == 0 && root[R].rchild == 0)  // 如果已经是叶子节点,输出到输出文件中,然后重新回到根节点 
		{
			fputc(root[R].data, fp2);
			R = 2 * len - 1;
		}
	}
	fclose(fp);
	fclose(fp2);
}

?效果:

input.txt:

????????Life is full of confusing and disordering Particular time,a particular location,Do the arranged thing of ten million time in the brain,Step by step ,the life is hard to avoid delicacy and stiffness No enthusiasm forever,No unexpected happening of surprising and pleasing So,only silently ask myself in mind Next happiness,when will come?

codefile.txt:

????????011100010001001111011010000101101100111111010010001010100111001110111111100111100100111111010101000110011101110110001100100101011001000001010011111001001011011110000011001110111010111001010001110001100001111111111010010100011100101011000011110011011110101000101011111000111000110000111111111101001010001110010100100011111111100001100000011110011101001110000001110101100100111011011000111001110010001100111011110110010101011001001000110011101110100111001110101101101110010111110000000100010000001111001010110000111100110110100011001010110010011101101111110111110010000001100111010111110100110110101111101111110110111011010101011011010111110111101001100100111011010010000100111101101000010110101001100011100100101010110001110110000100000001100010010101100101101001000011111110001111110111011011000110010010101010101100001001110011110011010101010110111111000011101110111000110010011111010101000100001011111001011001100111110011010100000110111100111010111110000111011111011100110101000100111111011111110110110110010101010011000011110111111011100000110011101110100111001110101011111011110001111111000000101000110011101110110001100100101010111100101101100001010001100111011101111110100011111010001111000010011101101010100000101101110001100010011101101100001010111001110111110001110101011101001010011101000110010111110000011001001010111111001101010001001101010100110000111101111000110011010101010111101001000010100111011100101010000100000100010101111111001111110011010100011101000110?

???????

?完整代码:

#include<stdio.h>
#include<string.h>
#include<malloc.h>

#define Max 1024
#define catage 128//数字 32–126 分配给了能在键盘上找到的字符,当您查看或打印文档时就会出现


typedef struct {
	char ch;
	int count;
}node;

typedef struct {
	node data[catage];//128种
	int length;
}List,*ListPtr;

typedef struct {
	int parent;
	int lchild;
	int rchild;
	int weight;
	char data;
}record_map,*record_mapPtr;//记录表

typedef struct {//unoder_map <char,int>
	char data;
	char* str;
}code_graph, * code_graphPtr;//编码表

ListPtr Init() {
	ListPtr list = (ListPtr)malloc(sizeof(List));
	list->length = 0;
	return list;
}

void Read(char* source) {
	FILE* fp = fopen("D:\\D_desktop\\input.txt", "r+");
	if (fp == NULL) return;
	else {
		fgets(source, Max, fp);
	}
	fclose(fp);
}

void CharCount(ListPtr list, char* source) {
	int ASII[catage];
	memset(ASII, 0, sizeof(int) * catage);
	for (int i = 0; i < strlen(source); i++) {
		ASII[(int)source[i]]++;
		//printf("%c --%d \n", source[i],ASII[source[i]]);
	}
	for (int i = 0; i < catage; i++) {
		if (ASII[i] != 0) {
			//printf("%c --%d \n", i, ASII[i]);
			list->data[list->length].ch = (char)i;//???
			list->data[list->length].count = ASII[i];
			list->length++;
		}
	}
}

void select(int len, int* tow_ints, record_mapPtr root) {
	int min = _CRT_INT_MAX;
	for (int i = 1; i <= len; i++) {
		if (root[i].weight < min && root[i].parent==0) {
			tow_ints[0] = i;
			min = root[i].weight;
		}
	}
	min = _CRT_INT_MAX;
	for (int i = 1; i <= len; i++) {
		if (root[i].weight < min && i != tow_ints[0] && root[i].parent == 0) {
			tow_ints[1] = i;
			min = root[i].weight;
		}
	}
}

record_mapPtr creatHuff(ListPtr list) {
	record_mapPtr root = (record_mapPtr)malloc(sizeof(record_map) * ((list->length) * 2 + 1));
	int total = 2 * list->length - 1;
	for (int i = 0; i <= list->length; i++) {
		root[i].parent = 0;
		root[i].lchild = 0;
		root[i].rchild = 0;
		root[list->length + i].parent = 0;
		root[list->length + i].lchild = 0;
		root[list->length + i].rchild = 0;

		root[i+1].weight = list->data[i].count;
		root[i+1].data = list->data[i].ch;
		//printf("%c ", list->data[i].ch);
	}
	int min[2];
	for (int i = list->length + 1; i <= total; i++) {
		select(i - 1, min, root);
		root[i].lchild = min[0];
		root[i].rchild = min[1];
		root[i].weight = root[min[0]].weight + root[min[1]].weight;
		root[min[0]].parent = i;
		root[min[1]].parent = i;
	}
	return root;
}


code_graphPtr Init_graph(int len) {
	code_graphPtr graph = (code_graphPtr)malloc(sizeof(code_graph)*len);

	for (int i = 0; i < len; i++) {
		graph[i].str = (char*)malloc(sizeof(char) * len);
	}
	return graph;
}


void codefile(code_graphPtr graph, ListPtr list,record_mapPtr root,char* source) {

	FILE* fp = fopen("D:\\D_desktop\\codefile.txt", "w+");
	if (fp == NULL) return;
	int cat = list->length;
	char* code_str = (char*)malloc(sizeof(char) * (cat + 1));
	code_str[cat] = '\0';
	int start = cat - 1;
	for (int i = 1; i <= cat; i++) {
		graph[i-1].data = root[i].data;
		int p = root[i].parent;
		int child = i;
		while (p != 0) {
			if (root[p].lchild == child) code_str[start--] = '0';
			else code_str[start--] = '1';
			child = p;
			p = root[p].parent;
		}
		strcpy(graph[i-1].str, &code_str[start+1]);
		/*printf("%c---> %s \n", graph[i - 1].data, &code_str[start+1]);
		fputc(graph[i - 1].data, fp);
		fputc(':', fp);
		fputs(graph[i-1].str, fp);
		fputc('\n', fp);*/
		start = cat - 1;
	}
	for (int i = 0; i < strlen(source); i++) {
		for (int j = 0; j < cat; j++) {
			if(source[i]==graph[j].data) fputs(graph[j].str, fp);
		}
	}
	fclose(fp);
}

void decode(int len,record_mapPtr root) {
	FILE* fp = fopen("D:\\D_desktop\\codefile.txt", "r");
	if (fp == NULL) return;
	FILE* fp2 = fopen("D:\\D_desktop\\output.txt", "w+");
	if (fp2 == NULL) return;
	char* code = (char*)malloc(sizeof(char) * Max * len);
	fgets(code, Max * len, fp);
	int R = 2 * len - 1;
	for (int i = 0; i < strlen(code); i++) {
		if (code[i] == '0') R = root[R].lchild;
		if (code[i] == '1') R = root[R].rchild;
		if (root[R].lchild == 0 && root[R].rchild == 0)  // 如果已经是叶子节点,输出到输出文件中,然后重新回到根节点 
		{
			fputc(root[R].data, fp2);
			R = 2 * len - 1;
		}
	}
	fclose(fp);
	fclose(fp2);
}




int main() {
	char source[1000];
	Read(source);
	ListPtr list = Init();
	CharCount(list, source);
	record_mapPtr root = creatHuff(list);
	code_graphPtr graph = Init_graph(list->length);
	codefile(graph, list, root,source);
	decode(list->length,root);
	return 0;
}

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-06-01 15:26:10  更:2022-06-01 15:26:37 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/28 9:23:52-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码