百度百科简介:
1.哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,一般就叫做Huffman编码(有时也称为霍夫曼编码)。 2.哈夫曼树给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。 通过这个简介我们可以发现,我们可以通过哈夫曼树来实现哈夫曼编码
主要解决问题类型
构造一棵包含
n
n
n个叶子结点的
k
k
k叉树,每个叶子都有一个点权
w
[
i
]
w[i]
w[i],和根节点到叶子节点的距离
l
[
i
]
l[i]
l[i],目的就是要最小化
∑
w
i
?
l
i
∑w_i*l_i
∑wi??li?
二叉哈夫曼树
当
k
=
2
k=2
k=2的时候,我们很容易可以想到一个贪心策略,就是
w
[
i
]
w[i]
w[i]大的数让它的
l
[
i
]
l[i]
l[i]要小这样才会使得总答案变小 主要步骤就是: 1.建立一个小根堆,插入这n个点 2.每次取出两个点,并且进行合并 3.再把合并后的点插入到小根堆当中 重复123的操作直到小根堆的大小为1,也就是只合并到了一个点
K叉哈夫曼树
对于k叉哈夫曼树的求解,直观的想法是在贪心的基础上,改为每次从堆中去除最小的k个权值合并。然而,仔细思考可以发现,如果在执行最后一次循环时,堆的大小在(2~k-1)之间(不足以取出k个),那么整个哈夫曼树的根的子节点个数就小于k。这显然不是最优解因为我们任意取哈夫曼树中一个深度最大的节点,改为树根的子节点,就会使
∑
w
i
?
l
i
∑w_i*l_i
∑wi??li? 变小,但是二叉的时候为啥就不会出现这样的问题呢???
当要更新下一层的时候下一层所加的个数是k-1,所以总数就是要当(n-1)%(k-1)!=0时,我们要补K-(n-1)%(k-1)个点,其中(n-1)%(k-1)为多了的点(如果这里不理解可以模拟一下)。然后建树就行了。
模板题,荷马史诗
#include<bits/stdc++.h>
#define maxn 1001000
#define int long long
using namespace std;
inline int read()
{
int res=0,f=1;char ch=getchar();
while(!isdigit(ch)){if(ch=='-')f=-f;ch=getchar();}
while(isdigit(ch)){res=(res<<1)+(res<<3)+(ch&15);ch=getchar();}
return res*f;
}
struct node{
int val;
int id;
inline bool operator <(const node &a) const{
if(a.val==val)return a.id<id;
return a.val<val;
}
};
priority_queue<node>q;
int n,k;
int ans;
int tot;
int a[maxn];
int zero;
signed main()
{
n=read();k=read();
if((n-1)%(k-1))zero=k-1-((n-1)%(k-1));
while(zero--)q.push((node){0,1});
for(int i=1;i<=n;i++)q.push((node){read(),1}); 补充0+数字
while(q.size()!=1)
{
tot=0;
int maxh=0;
for(int i=1;i<=k;i++)
{
maxh=max(maxh,q.top().id);
tot+=q.top().val;
q.pop();
}
ans+=tot;
q.push((node){tot,maxh+1});
}
cout<<ans<<endl<<q.top().id-1;
return 0;
}
|