算法之贪心算法
贪心算法
概念:
- 贪心算法是一种思想 ,并不是一种算法,贪心算法是分阶段地工作,在每一个阶段,可以认为所作决定是好的,而不考虑将来地后果。
- 算法的每个阶段总是选择当前阶段最优 ,这种策略希望当算法终止时,能够将每一次的局部最优变成全局最优。
调度问题
概念:
- 调度问题 就是安排一个完成任务的顺序使得全部任务完成的平均完成的时间能够最小化。
单个处理器
- 调度任务的方式我们一般使用非预占调度 :一旦开始一个任务,就必须将这个任务运行到完成
- 调度问题一般都是最短任务最先进行 ,这样将会产生出每个阶段最优的调度,使得达到全局最优的调度。
- 操作系统调用程序一般把优先权赋予那些更短的任务。
多处理器:
- 如果我们有多个处理器,并且任务是有序的(按照最短时间排序),这个时候的任务调度问题需要进行小部分的改变,但跟单个处理器的思想是一样的
- 假设我们有p个处理器 ,则我们选择前p个任务分配给各个处理器各一个 ,然后第p+1任务分配给第一个处理器 ,然后后面的就是按照这个规则分配。
- 第二个最优解,是将任务分组分配给各个处理器 ,且任务个数能整除处理器个数 ,是对于0<=i<N/p ,p为处理器个数,N为任务总数,i为处理器序号,我们从任务i*p+1直到任务(i+1)*p的每个任务放到编号为i的处理器中。
Huffman编码
概念:
- 哈夫曼(Huffman)编码是一种压缩文件的编码 ,根据文件出现的字符使用一种将数据存在树叶上的二叉树来表示每个字符的二进制代码。
- 每个字符通过从根节点开始用0指示左分支用1表示右分支而以记录路径的方法表示出来 。如果字符c~i~在深度d~i~处并且出现f~i~次,那么该字符代码的值为对d~i~f~i~的求和。
- 一个最优的哈夫曼编码 是一种满二叉树 :所有的节点或者是树叶,或者有两个子节点。
- 而贪心算法在这里就是根据字符出现的频率找出总价值最小的满二叉树 ,其中所有字符位于树叶。就是将出现次数少的放在深度深的地方(编码位数较多),将出现最多放在最浅的地方(编码位数较少)
- 例如图10-9,字符a压缩后所表示的二进制代码为000
哈夫曼算法:
- 为了生成最优的哈夫曼编码树,哈夫曼提出了哈夫曼算法,这个算法也是使用了贪心的策略
- 假设字符个数为C ,算法的描述如下:算法对一个由树组成的森林进行。一棵树的权等于它的树叶(字符)的频率的和 。任意选取最小权的两棵树T1和T2 ,并任意形成以T1和T2为子树的新树 ,将这样的过程进行C-1次 。在算法的开始 ,存在C课单节点树 --每个字符一颗树。在算法结束时得到一棵树,这棵树就是最优哈夫曼编码树。
实现代码:
cpp
//树的结构体
struct tree{
char data; //存字符
tree* left;
tree* right;
int weight; //权重
};
//用来定义优先队列的比较规则
struct cmp{
bool operator()(tree *a, const tree* b){
return a->weight<b->weight;
}
};
//需要将数据先存入优先队列中
priority_queue<tree*,vector<tree*>,cmp>pq;
tree* createNode(char data,int weight){
tree* p=new tree;
p->data=data;
p->left= nullptr;
p->right= nullptr;
p->weight=weight;
return p;
}
tree* merge(tree* &t1,tree* &t2){
int n=t1->weight+t2->weight;
tree* p= createNode(0,n);
p->left=t1;
p->right=t2;
return p;
}
tree* Huffman(){
tree* p;
while (!pq.empty()){
tree* t1=pq.top();
pq.pop();
tree* t2=pq.top();
pq.pop();
p=merge(t1,t2);
pq.push(p);
}
return p;
}