贪心算法是一种常见的解决优化问题的算法,其基本思想是在问题的每个决策阶段,都选择当前看起来最优的选择,即贪心地做出局部最优的决策,以期望获得全局最优解。
贪心算法简洁且高效,在许多实际问题中都有着广泛的应用。
贪心算法和动态规划都常用于解决优化问题。它们之间存在一些相似之处,比如都依赖最优子结构性质,但工作原理是不同的。
我们先通过例题 零钱兑换 了解贪心算法的工作原理。这道题已经在动态规划章节中介绍过,相信你对它并不陌生。
给定 𝑛 种硬币,第 𝑖 种硬币的面值为 𝑐𝑜𝑖𝑛𝑠 [ 𝑖 ? 1 ] ,目标金额为 𝑎𝑚𝑡 ,每种硬币可以重复选取,问能够凑出目标金额的最少硬币个数。如果无法凑出目标金额则返回 ?1 。
本题的贪心策略如图所示。给定目标金额,我们贪心地选择不大于且最接近它的硬币,不断循环该步骤,直至凑出目标金额为止。
实现代码如下所示。你可能会不由地发出感叹:So Clean !
贪心算法仅用十行代码就解决了零钱兑换问题。
/* 零钱兑换:贪心 */
int coinChangeGreedy(int[] coins, int amt) {
// 假设 coins 列表有序
int i = coins.length - 1;
int count = 0;
// 循环进行贪心选择,直到无剩余金额
while (amt > 0) {
// 找到小于且最接近剩余金额的硬币
while (i > 0 && coins[i] > amt) {
i--;
}
// 选择 coins[i]
amt -= coins[i];
count++;
}
// 若未找到可行方案,则返回 -1
return amt == 0 ? count : -1;
}
贪心算法不仅操作直接、实现简单,而且通常效率也很高。
在以上代码中,记硬币最小面值为 min(𝑐𝑜𝑖𝑛𝑠) ,则贪心选择最多循环 𝑎𝑚𝑡/ min(𝑐𝑜𝑖𝑛𝑠) 次,时间复杂度为 𝑂(𝑎𝑚𝑡/ min(𝑐𝑜𝑖𝑛𝑠)) 。这比动态规划解法的时间复杂度 𝑂(𝑛 × 𝑎𝑚𝑡) 提升了一个数量级。
然而,对于某些硬币面值组合,贪心算法并不能找到最优解。下图给出了两个示例。
也就是说,对于零钱兑换问题,贪心算法无法保证找到全局最优解,并且有可能找到非常差的解。它更适合用动态规划解决。
一般情况下,贪心算法适用于以下两类问题:
那么问题来了,什么样的问题适合用贪心算法求解呢?
或者说,贪心算法在什么情况下可以保证找到最优解?
相较于动态规划,贪心算法的使用条件更加苛刻,其主要关注问题的两个性质:
最优子结构已经在动态规划章节中介绍过,不再赘述。值得注意的是,一些问题的最优子结构并不明显,但仍然可使用贪心算法解决。
我们主要探究贪心选择性质的判断方法。虽然它的描述看上去比较简单,但实际上对于许多问题,证明贪心选择性质不是一件易事。
例如零钱兑换问题,我们虽然能够容易地举出反例,对贪心选择性质进行证伪,但证实的难度较大。如果问:满足什么条件的硬币组合可以使用贪心算法求解?我们往往只能凭借直觉或举例子来给出一个模棱两可的答案,而难以给出严谨的数学证明。
有一篇论文给出了一个 𝑂(𝑛3) 时间复杂度的算法,用于判断一个硬币组合是否可以使用贪心算法找出任何金额的最优解。
Pearson, David. A polynomial?time algorithm for the change?making problem.
Operations Research Letters 33.3 (2005): 231?234
贪心问题的解决流程大体可分为以下三步:
确定贪心策略是求解问题的核心步骤,但实施起来可能并不容易,主要包含以下原因:
为了保证正确性,我们应该对贪心策略进行严谨的数学证明,通常需要用到反证法或数学归纳法。
然而,正确性证明也很可能不是一件易事。如若没有头绪,我们通常会选择面向测试用例进行 Debug ,一步步修改与验证贪心策略。
贪心算法常常应用在满足贪心选择性质和最优子结构的优化问题中,以下列举了一些典型的贪心算法问题。
给定 𝑛 个物品,第 𝑖 个物品的重量为 𝑤𝑔𝑡 [ 𝑖 ? 1 ]、价值为 𝑣𝑎𝑙 [ 𝑖 ? 1 ] ,和一个容量为 𝑐𝑎𝑝 的背包。每个物品只能选择一次,但可以选择物品的一部分,价值根据选择的重量比例计算,问在不超过背包容量下背包中物品的最大价值。
分数背包和 0?1 背包整体上非常相似,状态包含当前物品 𝑖 和容量 𝑐 ,目标是求不超过背包容量下的最大价值。
不同点在于,本题允许只选择物品的一部分。如图所示,我们可以对物品任意地进行切分,并按照重量比例来计算物品价值。
最大化背包内物品总价值,本质上是要最大化单位重量下的物品价值。由此便可推出图 所示的贪心策略。
我们建立了一个物品类 Item ,以便将物品按照单位价值进行排序。循环进行贪心选择,当背包已满时跳出并返回解。
/* 物品 */
class Item {
int w; // 物品重量
int v; // 物品价值
public Item(int w, int v) {
this.w = w;
this.v = v;
}
}
/* 分数背包:贪心 */
double fractionalKnapsack(int[] wgt, int[] val, int cap) {
// 创建物品列表,包含两个属性:重量、价值
Item[] items = new Item[wgt.length];
for (int i = 0; i < wgt.length; i++) {
items[i] = new Item(wgt[i], val[i]);
}
// 按照单位价值 item.v / item.w 从高到低进行排序
Arrays.sort(items, Comparator.comparingDouble(item -> -((double) item.v / item.w)));
// 循环贪心选择
double res = 0;
for (Item item : items) {
if (item.w <= cap) {
// 若剩余容量充足,则将当前物品整个装进背包
res += item.v;
cap -= item.w;
} else {
// 若剩余容量不足,则将当前物品的一部分装进背包
res += (double) item.v / item.w * cap;
// 已无剩余容量,因此跳出循环
break;
}
}
return res;
}
最差情况下,需要遍历整个物品列表,因此时间复杂度为 𝑂(𝑛) ,其中 𝑛 为物品数量。
由于初始化了一个 Item 对象列表,因此空间复杂度为 𝑂(𝑛) 。
采用反证法。假设物品 𝑥 是单位价值最高的物品,使用某算法求得最大价值为 res ,但该解中不包含物品 𝑥。
现在从背包中拿出单位重量的任意物品,并替换为单位重量的物品 𝑥 。由于物品 𝑥 的单位价值最高,因此替换后的总价值一定大于 res 。这与 res 是最优解矛盾,说明最优解中必须包含物品 𝑥 。
对于该解中的其他物品,我们也可以构建出上述矛盾。总而言之,单位价值更大的物品总是更优选择,这说明贪心策略是有效的。
如图所示,如果将物品重量和物品单位价值分别看作一个 2D 图表的横轴和纵轴,则分数背包问题可被转化为 求在有限横轴区间下的最大围成面积。这个类比可以帮助我们从几何角度理解贪心策略的有效性。
输入一个数组 ?𝑡 ,数组中的每个元素代表一个垂直隔板的高度。数组中的任意两个隔板,以及它们之间的空间可以组成一个容器。
容器的容量等于高度和宽度的乘积(即面积),其中高度由较短的隔板决定,宽度是两个隔板的数组索引之差。
请在数组中选择两个隔板,使得组成的容器的容量最大,返回最大容量。
容器由任意两个隔板围成,因此本题的状态为两个隔板的索引,记为 [ 𝑖, 𝑗 ] 。
根据题意,容量等于高度乘以宽度,其中高度由短板决定,宽度是两隔板的索引之差。设容量为 𝑐𝑎𝑝 [ 𝑖, 𝑗 ] ,则可得计算公式:
设数组长度为 𝑛 ,两个隔板的组合数量(即状态总数)为 𝐶
2
n
\frac{2}{n}
n2? =𝑛(𝑛?1)/2 个。最直接地,我们可以穷举所有状态,从而求得最大容量,时间复杂度为 𝑂(𝑛2) 。
这道题还有更高效率的解法。如图所示,现选取一个状态 [ 𝑖, 𝑗 ] ,其满足索引 𝑖 < 𝑗 且高度 ?𝑡 [ 𝑖 ] < ?𝑡 [ 𝑗 ],即 𝑖 为短板、𝑗 为长板。
如图所示,若此时将长板 𝑗 向短板 𝑖 靠近,则容量一定变小。
这是因为在移动长板 𝑗 后,宽度 𝑗 ? 𝑖 肯定变小;
而高度由短板决定,因此高度只可能不变(𝑖 仍为短板)或变小(移动后的 𝑗 成为短板)。
反向思考,我们只有向内收缩短板 𝑖 ,才有可能使容量变大。因为虽然宽度一定变小,但高度可能会变大(移动后的短板 𝑖 可能会变长)。
例如在下图中,移动短板后面积变大。
由此便可推出本题的贪心策略:初始化两指针分裂容器两端,每轮向内收缩短板对应的指针,直至两指针相遇。
下图展示了贪心策略的执行过程。
代码循环最多 𝑛 轮,因此时间复杂度为 𝑂(𝑛) 。
变量 𝑖、𝑗、𝑟𝑒𝑠 使用常数大小额外空间,因此空间复杂度为 𝑂(1) 。
/* 最大容量:贪心 */
int maxCapacity(int[] ht) {
// 初始化 i, j 分列数组两端
int i = 0, j = ht.length - 1;
// 初始最大容量为 0
int res = 0;
// 循环贪心选择,直至两板相遇
while (i < j) {
// 更新最大容量
int cap = Math.min(ht[i], ht[j]) * (j - i);
res = Math.max(res, cap);
// 向内移动短板
if (ht[i] < ht[j]) {
i++;
} else {
j--;
}
}
return res;
}
之所以贪心比穷举更快,是因为每轮的贪心选择都会 跳过 一些状态。
比如在状态 𝑐𝑎𝑝 [ 𝑖, 𝑗 ] 下,𝑖 为短板、𝑗 为长板。若贪心地将短板 𝑖 向内移动一格,会导致下图所示的状态被 跳过 。这意味着之后无法验证这些状态的容量大小。
观察发现,这些被跳过的状态实际上就是将长板 𝑗 向内移动的所有状态。
而在第二步中,我们已经证明内移长板一定会导致容量变小。
也就是说,被跳过的状态都不可能是最优解,跳过它们不会导致错过最优解。
以上的分析说明,移动短板的操作是 安全的,贪心策略是有效的。
给定一个正整数 𝑛 ,将其切分为至少两个正整数的和,求切分后所有整数的乘积最大是多少。
假设我们将 𝑛 切分为 𝑚 个整数因子,其中第 𝑖 个因子记为 𝑛𝑖 ,即
本题目标是求得所有整数因子的最大乘积,即
我们需要思考的是:切分数量 𝑚 应该多大,每个 𝑛𝑖 应该是多少?
根据经验,两个整数的乘积往往比它们的加和更大。假设从 𝑛 中分出一个因子 2 ,则它们的乘积为 2(𝑛 ? 2)。我们将该乘积与 𝑛 作比较:
如图 15?14 所示,当 𝑛 ≥ 4 时,切分出一个 2 后乘积会变大,这说明大于等于 4 的整数都应该被切分。
贪心策略一:如果切分方案中包含 ≥ 4 的因子,那么它就应该被继续切分。最终的切分方案只应出现 1、2、3 这三种因子。
接下来思考哪个因子是最优的。在 1、2、3 这三个因子中,显然 1 是最差的,因为 1 × (𝑛 ? 1) < 𝑛 恒成立,即切分出 1 反而会导致乘积减小。
如图所示,当 𝑛 = 6 时,有 3 × 3 > 2 × 2 × 2 。这意味着切分出 3 比切分出 2 更优。
贪心策略二:在切分方案中,最多只应存在两个 2 。因为三个 2 总是可以被替换为两个 3 ,从而获得更大乘积。
总结以上,可推出以下贪心策略:
如图所示,我们无须通过循环来切分整数,而可以利用向下整除运算得到 3 的个数 𝑎 ,用取模运算得到余数 𝑏 ,此时有:
请注意,对于 𝑛 ≤ 3 的边界情况,必须拆分出一个 1 ,乘积为 1 × (𝑛 ? 1) 。
/* 最大切分乘积:贪心 */
int maxProductCutting(int n) {
// 当 n <= 3 时,必须切分出一个 1
if (n <= 3) {
return 1 * (n - 1);
}
// 贪心地切分出 3 ,a 为 3 的个数,b 为余数
int a = n / 3;
int b = n % 3;
if (b == 1) {
// 当余数为 1 时,将一对 1 * 3 转化为 2 * 2
return (int) Math.pow(3, a - 1) * 2 * 2;
}
if (b == 2) {
// 当余数为 2 时,不做处理
return (int) Math.pow(3, a) * 2;
}
// 当余数为 0 时,不做处理
return (int) Math.pow(3, a);
}
时间复杂度取决于编程语言的幂运算的实现方法。
以 Python 为例,常用的幂计算函数有三种。
变量 𝑎 和 𝑏 使用常数大小的额外空间,因此空间复杂度为 𝑂(1) 。
使用反证法,只分析 𝑛 ≥ 3 的情况: