算法笔记(0002) - 【贪心算法】活动安排问题
贪心算法
原理
在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,但对范围相当广泛的许多问题他能产生整体最优解或者是整体最优解的近似解。
特性
所谓贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素。贪心算法则通常以自顶向下的方式进行,以迭代的方式作出相继的贪心选择,每作一次贪心选择就将所求问题简化为规模更小的子问题。
对于一个具体问题,要确定它是否具有贪心选择性质,必须证明每一步所作的贪心选择最终导致问题的整体最优解。证明的大致过程为:首先考察问题的一个整体最优解,并证明可修改这个最优解,使其以贪心选择开始。做了贪心选择后,原问题简化为规模更小的类似子问题。然后用数学归纳法证明通过每一步做贪心选择,最终可得到问题的整体最优解。其中,证明贪心选择后的问题简化为规模更小的类似子问题的关键在于利用该问题的最优子结构性质。
1、建立数学模型来描述问题。
2、把求解的问题分成若干个子问题。
3、对每一子问题求解,得到子问题的局部最优解。
4、把子问题的解局部最优解合成原来解问题的一个解。
活动安排问题
下面给出求解活动安排问题的贪心算法,各活动的起始时间和结束时间存储于数组s和f中,且按结束时间的非减序排列。如果所给的活动未按此序排列,可以用O(nlogn)的时间重排。具体代码如下:
1#include "stdafx.h"
2#include <iostream>
3using namespace std;
4
5template<class Type>
6void GreedySelector(int n, Type s[], Type f[], bool A[]);
7
8const int N = 11;
9
10int main()
11{
12 //下标从1开始,存储活动开始时间
13 int s[] = {0,1,3,0,5,3,5,6,8,8,2,12};
14
15 //下标从1开始,存储活动结束时间
16 int f[] = {0,4,5,6,7,8,9,10,11,12,13,14};
17
18 bool A[N+1];
19
20 cout<<"各活动的开始时间,结束时间分别为:"<<endl;
21 for(int i=1;i<=N;i++)
22 {
23 cout<<"["<<i<<"]:"<<"("<<s[i]<<","<<f[i]<<")"<<endl;
24 }
25 GreedySelector(N,s,f,A);
26 cout<<"最大相容活动子集为:"<<endl;
27 for(int i=1;i<=N;i++)
28 {
29 if(A[i]){
30 cout<<"["<<i<<"]:"<<"("<<s[i]<<","<<f[i]<<")"<<endl;
31 }
32 }
33
34 return 0;
35}
36
37template<class Type>
38void GreedySelector(int n, Type s[], Type f[], bool A[])
39{
40 A[1]=true;
41 int j=1;//记录最近一次加入A中的活动
42
43 for (int i=2;i<=n;i++)//依次检查活动i是否与当前已选择的活动相容
44 {
45 if (s[i]>=f[j])
46 {
47 A[i]=true;
48 j=i;
49 }
50 else
51 {
52 A[i]=false;
53 }
54 }
55}
由于输入的活动以其完成时间的非减序排列,所以算法greedySelector每次总是选择具有最早完成时间的相容活动加入集合A中。直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是使剩余的可安排时间段极大化,以便安排尽可能多的相容活动。算法greedySelector的效率极高。当输入的活动已按结束时间的非减序排列,算法只需O(n)的时间安排n个活动,使最多的活动能相容地使用公共资源。如果所给出的活动未按非减序排列,可以用O(nlogn)的时间重排。
例:设待安排的11个活动的开始时间和结束时间按结束时间的非减序排列如下:
算法greedySelector 的计算过程如下图所示。图中每行相应于算法的一次迭代。阴影长条表示的活动是已选入集合A的活动,而空白长条表示的活动是当前正在检查相容性的活动。
若被检查的活动i的开始时间Si小于最近选择的活动j的结束时间fi,则不选择活动i,否则选择活动i加入集合A中。贪心算法并不总能求得问题的整体最优解。但对于活动安排问题,贪心算法greedySelector却总能求得的整体最优解,即它最终所确定的相容活动集合A的规模最大。这个结论可以用数学归纳法证明。
证明如下:设E={0,1,2,…,n-1}为所给的活动集合。由于E中活动安排安结束时间的非减序排列,所以活动0具有最早完成时间。首先证明活动安排问题有一个最优解以贪心选择开始,即该最优解中包含活动0.设a是所给的活动安排问题的一个最优解,且a中活动也按结束时间非减序排列,a中的第一个活动是活动k。如k=0,则a就是一个以贪心选择开始的最优解。若k>0,则我们设b=a-{k}∪{0}。由于end[0] ≤end[k],且a中活动是互为相容的,故b中的活动也是互为相容的。又由于b中的活动个数与a中活动个数相同,且a是最优的,故b也是最优的。也就是说b是一个以贪心选择活动0开始的最优活动安排。因此,证明了总存在一个以贪心选择开始的最优活动安排方案,也就是算法具有贪心选择性质。
例题练手
有若干个活动,第i个开始时间和结束时间是[Si,fi),只有一个教室,活动之间不能交叠,求最多安排多少个活动?
开始最早的活动优先,目标是想尽早结束活动,让出教室。然而, 这个显然不行,因为最早的活动可能很长,影响我们进行后面的活动。例如活动开始和结束时间分别为[0, 100), [1,2) ,[2, 3), [3, 4),[4,5],安排[0,100)的这个活动之后,其他活动无法安排,可是最优解是安排除它外的4个活动。
2. 短活动优先, 目标也是尽量空出教室。但是不难构造如下反例:[0,5) [5,10) [3, 7), 这里[3,7)最短,但如果我们安排了[3,7),其它两个无法安排了。但是最优解显然是安排其它两个,而放弃[3,7),可见这个贪心策略也是不行的。
3. 最少冲突的活动优先, 既然上面安排活动是想减少冲突,那么如果我们优先安排冲突最少的活动可以么?至少从(1)和(2)看来,这个策略是有效的。真是对的么?尝试这个例子:
[0,2) [2,4) [4,6) [6,8)
[1,3) [1,3) [1,3) [3,5) [5,7) [5,7) [5,7)
看一下[0,2) 和3个活动冲突——3个[1,3)
[2,4)和4个活动冲突3个[1,3)和一个[3,5)
[4,6)和也和4个活动冲突3个[5,7)和一个[3,5)
[6,8)和3个活动冲突——3个[5,7)
下面[1,3)和[5,7)每个都和5个活动冲突,
而[3,5)只和两个活动冲突——[2,4)和[4,6)。
那按照我们的策略应该先安排[3,5), 可是一旦选择了[3,5),我们最多只可能安排3个活动。
但明显第一行的4个活动都可以安排下来,所以这种策略也是不对的。
4. 看似最不对的策略——结束时间越早的活动优先。这个策略是有效的,我们可以证明。假设最优解OPT中安排了m个活动,我们把这些活动也按照结束时间由小到大排序,显然是不冲突的。假设排好顺序后,这些活动是a(1) , a(2), a(3)….am
假设按照我们的贪心策略,选出的活动自然是按照结束时间排好顺序的,并且也都是不冲突的,这些活动是b(1), b(2) …b(n)
问题关键是,假设a(1) = b(1), a(2) = b(2)…. a(k) = b(k),但是a(k+1) != b(k+1),回答几个问题:
b(k+1)会在a(k+2), a(k+3), …. a(m)中出现么?
不会。因为b(k+1)的结束时间是最早的,即f(b(k+1)) <= f(a(k+1)),而a(k+2), a(k+3), …. a(m)的开始时间和结束时间都在f(a(k+1))之后,所以b(k+1)不在其中。b(k+1)和a(1), a(2), …. a(k) 冲突么?
不冲突,因为a(1), a(2), …. a(k)就是b(1), b(2), …. b(k)b(k+1)和a(k+2), a(k+3), …. a(m)冲突么?
不冲突,因为f(b(k+1)) <= f(a(k+1)),而a(k+2), a(k+3), …. a(m)的开始时间都在f(a(k+1))之后,更在f(b(k+1))之后。
因此我们可以把a(k+1) 换成b(k+1), 从而最优解和我们贪心得到的解多了一个相同的,经过一个一个替换,我们可以把最优解完全替换成我们贪心策略得到的解。从而证明了这个贪心策略的最优性。
最后,我们来提供输入输出数据,由你来写一段程序,实现这个算法,只有写出了正确的程序,才能继续后面的课程。
输入
第1行:1个数N,线段的数量(2 <= N <= 10000)
第2 - N + 1行:每行2个数,线段的起点和终点(-10^9 <= S,E <= 10^9)
输出
输出最多可以选择的线段数量。
输入示例
3
1 5
2 3
3 6
输出示例
2
代码
1#include<iostream>
2#include<cstdio>
3#include<cstring>
4#include<algorithm>
5using namespace std;
6struct Node{
7 int start;
8 int end;
9} a[10001];
10/**
11 自定义的排序规则
12*/
13bool cmp(Node x,Node y){
14 if(x.end<y.end)
15 return true;
16 else if(x.end==y.end&&x.start>y.start)
17 return true;
18 return false;
19}
20int main(){
21 int n;
22 cin>>n;
23 for(int i=0;i<n;i++){
24 cin>>a[i].start>>a[i].end;
25 }
26 //a是待排序的数组的首地址,a+n是尾地址
27 //cmp是自定义排序规则
28 sort(a,a+n,cmp);
29 int ans =0;
30 int end = -1000000000;
31 for(int i=0;i<n;i++){
32 if(a[i].start>=end){
33 ans++;
34 end=a[i].end;
35 }
36 }
37 cout<<ans<<endl;
38 return 0;
39}
参考文档
贪心算法与活动安排问题
ACM--贪心算法--活动安排问题