动态规划-经典dp（打家劫舍，股票等）

发布时间：2024年01月17日

1.常规dp

1.1 爬楼梯

1.1.1 爬楼梯

?由于求的是组合数，我们将不同路径相加即可

dp定义：
dp[i]为爬到第i阶楼梯的方法数；

转移方程:

dp[i] = dp[i-2] +dp[i-1];

初始化：
?由于涉及到i-2和i-1，那么我们要从i=2开始遍历，因此要初始化dp[0] = 0,dp[1] = 1(根据定义)

遍历顺序：

从左往右?

完整代码：

class Solution {
public:
    int climbStairs(int n) {
        vector<int> dp(n+1,0);
        dp[0] = 0;
        dp[1] = 1;
        if(n==1)return 1;
        dp[2] = 2;
        for(int i =3;i<=n;i++){
            dp[i] = dp[i-2] +dp[i-1];
        }
        return dp[n];
    }
};

?1.1.2?使用最小花费爬楼梯

?此题和上一题非常类似，只要理解题意就不难

由于是求解最优路径，我们使用min而不是相加，同时我们要理解假如有n层台阶，那么顶层就是顶n+1层（由题意可知）：

1）因此我们设置dp大小为n+1

2）同时初始化时，不要初始化错误，

如果我们认为dp[1]是跳过0 1 两级就错了，会初始化为：

        dp[0] = 0;
        dp[1] = min(cost[0],cost[1]);

实际上dp[1]表示跳到第1级台阶上面的顶层，而dp[0]表示顶层就是地板的下一级

        dp[0] = 0;
        dp[1] = 0;

其实不用专门初始化，dp[i]全为0即可?

其他不多赘述，详细步骤参考下面代码和1.1.1：

class Solution {
public:
    int minCostClimbingStairs(vector<int>& cost) {
        int n = cost.size();
        vector<int> dp(n+1,0);
        dp[0] = 0;
        dp[1] = min(cost[0],cost[1]);
        
         for(int i =2;i <= n;i++){
            dp[i] = min(dp[i- 1]+cost[i-1],dp[i-2]+cost[i-2]);
         }
         return dp[n];
    }
};

1.2? 不同路径

1.2.1 不同路径

这样的题显然会第一时间想到dfs，但这里使用dfs会超时，使用备忘录优化的话时间复杂度和dp相同，因此我们直接使用dp来做

dp定义：
这类问题的dp定义很简单，要么就是表示组合数要么就是最优路径，且一般为二维dp

?此题dp[i][j]表示走到（i，j）有多少路径

?转移方程：
转移方程也比较固定，dp[i][j]由dp[i-1][j] 和dp[i][j1]（上面和左边，因为机器人只能这样走）转移过来

此处为：

dp[i][j] = dp[i-1][j]+dp[i][j-1];

初始化：
注意二维dp同时是从左上角往右下角更新，因此，我们要初始化第一行和第一列?，具体怎么初始化，根据定义即可

此处为：

        for(int i = 0;i < n;i++)dp[i][0] = 1;
        for(int i = 0;i < m;i++)dp[0][i] = 1;

遍历方向：

斜向下

完整代码：

class Solution {
public:
    int uniquePaths(int m, int n) {
        vector<vector<int>> dp(n,vector<int>(m,0));

        for(int i = 0;i < n;i++)dp[i][0] = 1;
        for(int i = 0;i < m;i++)dp[0][i] = 1;
        
        for(int i = 1; i < n;i++)
            for(int j = 1;j <m;j++){
                dp[i][j] = dp[i-1][j]+dp[i][j-1];
            }
            return dp[n-1][m-1];
    }
};

1.2.2 不同路径2

核心和上一题相同，注意的点：
1）只有当一个点没有障碍时我们才能更新这个点

2）我们可以从有障碍的点推到无障碍的点，因为有障碍的点路径为0，相当于没有使用，也即是之前的转移方程不用变，加一点限制条件即可：

                if(obstacleGrid[i][j]!=1){
                    dp[i][j] = dp[i-1][j]+dp[i][j-1];
                }

3)初始化时，如果一行里有一个障碍，那么障碍之后都走不通了，也就是第一个障碍及其之后初值都为0

        for(int i =0;i <m;i++){
            if(obstacleGrid[i][0]==0)
                dp[i][0] = 1;
            else if(obstacleGrid[i][0]==1)
                break;
        }
        for(int i =0;i <n;i++){
            if(obstacleGrid[0][i]==0)
                dp[0][i] = 1;
            else if(obstacleGrid[0][i]==1)
                break;
        }

其余没有什么注意点，完整代码如下：

class Solution {
public:
    int uniquePathsWithObstacles(vector<vector<int>>& obstacleGrid) {
        int m = obstacleGrid.size();
        int n = obstacleGrid[0].size();
        vector<vector<int>> dp(m,vector<int>(n,0));
        for(int i =0;i <m;i++){
            if(obstacleGrid[i][0]==0)
                dp[i][0] = 1;
            else if(obstacleGrid[i][0]==1)
                break;
        }
        for(int i =0;i <n;i++){
            if(obstacleGrid[0][i]==0)
                dp[0][i] = 1;
            else if(obstacleGrid[0][i]==1)
                break;
        }

        for(int i = 1;i  < m;i++)
            for(int j = 1;j < n;j++){
                if(obstacleGrid[i][j]!=1){
                    dp[i][j] = dp[i-1][j]+dp[i][j-1];
                }
            }
        return dp[m-1][n-1];
    }
};

1.2.3 最小路径和

?核心与上面两题相同，注意以下点：
1）这里是求最优路径不是组合数，因此使用min

2）每次更新当前点，需要加上当前点的数字

dp[i][j] = min(dp[i-1][j]+grid[i][j],dp[i][j-1]+grid[i][j]);

3）初始化也是根据定义来，第0行和第0列结果都是递增的

        for(int i = 0;i < m;i++){
            sum1+= grid[i][0];
            dp[i][0] =  sum1;
        }
        for(int i = 0;i < n;i++){
            sum2+= grid[0][i];
            dp[0][i] = sum2;
        }

?完整代码如下：

class Solution {
public:
    int minPathSum(vector<vector<int>>& grid) {
        int m = grid.size(),n = grid[0].size();
        vector<vector<int>> dp(m,vector<int>(n,0));
        int sum1= 0,sum2=0;
        for(int i = 0;i < m;i++){
            sum1+= grid[i][0];
            dp[i][0] =  sum1;
        }
        for(int i = 0;i < n;i++){
            sum2+= grid[0][i];
            dp[0][i] = sum2;
        }
        for(int i =1;i < m;i++)
            for(int j = 1;j < n;j++){
                dp[i][j] = min(dp[i-1][j]+grid[i][j],dp[i][j-1]+grid[i][j]);
            }
        return dp[m-1][n-1];
    }
};

1.3 整数拆分?

?dp定义：
dp[j]为j经过至少2次拆分得的最大乘积和

我们从后往前思考，要想得到dp[n]，我们就把先拆为两份dp[i - j] 和 j, dp[i - j]中包含k-1中拆解，j表示一种拆解，这样往前递推
注意，这里容易误写为：

dp[i] = max(dp[i-j] * j ,dp[i]);

相当于只把j拆为dp[i - j]和j这两部分，我们认为dp[i - j]就包含了i - j的所有拆分情况，但是我们没有考虑dp定义，dp[i - j]表示将i - j至少拆为了2份，那么上式就表示将dp[i]至少拆为三份（2+1）和dp定义不符

所以我们要知道，i - j为一个没拆分的整体这种情况并没有归类到dp[i - j]中，所以我们要单独将其列出来，如下：

dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j));

初始化：

这里我只初始化dp[2] = 1，从dp[i]的定义来说，拆分数字2，得到的最大乘积是1

dp[2] = 1;

遍历顺序：
?dp[i] 是依靠 dp[i - j]的状态，所以遍历i一定是从前向后遍历，先有dp[i - j]再有dp[i]。

        for(int i = 3;i <= n;i++)
            for(int j = 1;j < i;j++){
                dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j));//max(dp[i-j] * j ,dp[i]);
            }//因为定义的问题，dp[i-j]至少包含两个数，不然不对

注意枚举j的时候，是从1开始的。从0开始的话，那么让拆分一个数拆个0，求最大乘积就没有意义了。

完整代码如下：

class Solution {
public:
    int integerBreak(int n) {
        vector<int> dp(n+1,0);
        // dp[0] = 0;
        // dp[1] = 1;
        dp[2] = 1;
        for(int i = 3;i <= n;i++)
            for(int j = 1;j < i;j++){
                dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j));//max(dp[i-j] * j ,dp[i]);
            }//因为定义的问题，dp[i-j]至少包含两个数，不然不对
        return dp[n];
    }
};

优化：

因为拆分一个数n 使之乘积最大，那么一定是拆分成m个近似相同的子数相乘才是最大的。

例如 6 拆成 3 * 3， 10 拆成 3 * 3 * 4。 100的话也是拆成m个近似数组的子数相乘才是最大的。

只不过我们不知道m究竟是多少而已，但可以明确的是m一定大于等于2，既然m大于等于2，也就是最差也应该是拆成两个相同的可能是最大值。

那么 j 遍历，只需要遍历到 n/2 就可以，后面就没有必要遍历了，一定不是最大值。

class Solution {
public:
    int integerBreak(int n) {
        vector<int> dp(n+1,0);
        // dp[0] = 0;
        // dp[1] = 1;
        dp[2] = 1;
        for(int i = 3;i <= n;i++)
            for(int j = 1;j <= i/2;j++){
                dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j));//max(dp[i-j] * j ,dp[i]);
            }//因为定义的问题，dp[i-j]至少包含两个数，不然不对
        return dp[n];
    }
};

?2.打家劫舍

2.1 打家劫舍 1

这道题类似子序列问题的dp定义

首先要明确选择和状态是什么

1）选择：
?是否抢nums[i]

2）状态：
当前金额

dp定义：
只有一个状态，所以使用一维dp，dp[i]为nums[0,i]（不一定会包括i）抢劫到的最大金额

转移方程：
因为只有一个选择我们要做的就是分情况讨论，抢劫和不抢劫两种情况：
1）不抢劫：
继承dp[i-1]的结果

2)抢劫：

假如dp[i-1]中nums[i-1]被抢过，那么我们不能使用dp[i-1] + nums[i],只有使用dp[i-2] + nums[i]

假如dp[i-1】中nums[i-1]没被抢过，那么dp[i-1]就等于dp[i-2],那么结果也是dp[i-2] + nums[i]

因此转移方程如下：

dp[i] = max(dp[i-2]+nums[i],dp[i-1]);

初始化：
由于我们使用i-2更新i，那么要从i=2开始遍历，那么就要根据定义初始化dp[0]和dp[1]:

        dp[0] = nums[0];
        dp[1] = max(nums[0],nums[1]);

?遍历方向：
顺序遍历即可

完整代码如下：

class Solution {
public:
    int rob(vector<int>& nums) {
        int n = nums.size();
        if(n==1)return nums[0];
        vector<int> dp(n);
        dp[0] = nums[0];
        dp[1] = max(nums[0],nums[1]);
        for(int i = 2; i < n; i++){
            dp[i] = max(dp[i-2]+nums[i],dp[i-1]);
        }

        return dp[n-1];
    }
};

?2.1.2 打家劫舍2

?此题为环形数组打家劫舍，其实就是打家劫舍1的变种，我们分清各种情况即可

一开始的错误想法：
由于是环形，我们直接将nums[0]拼接到nums之后，在新的nums进行打家劫舍

1)如果开头的nums[0]被抢了，就用金额-nums[0]

2)如果开头的nums[0]没有被抢，就不用减?

class Solution {
public:
    int rob(vector<int>& nums) {
        int n = nums.size();
        if(n==1)return nums[0];
        nums.push_back(nums[0]);
        vector<int> dp(n+1,0);
        dp[0] = nums[0];
        dp[1] = max(nums[0],nums[1]);
        for(int i = 2;i <= n;i++)
            dp[i] = max(dp[i - 1],dp[i - 2]+nums[i]);
        return dp[n] - nums[0];
    }
};

?但问题在于，我们的策略都是动态自动执行的，并不能通过nums就知道nums[0]该不该抢，因此上述代码没法考虑到第一个nums[0]没被抢的那一部分情况

?正确做法：错误做法里，主要是矛盾点在于我们将nums[0]包含进了打劫的范围，从而造成情况难以区分

现在，我们直接将不打算打劫的地方剔除，然后分情况讨论，并且不将nums[0]拼接到后面

我们只要让nums[0]和nums[n-1]分开即可，下面3种情况，纳入范围不一定取得到，但是不纳入一定取不到

1）考虑不包含首尾元素

2）考虑包含首元素，不包含尾元素

3）?考虑包含尾元素，不包含首元素

4）首尾都取

虽然首尾都取时，也会有部分情况满足题意，但是我们仔细分析，如果满足题意，那么一定是上面三种情况之一，所以4）中的有效部分已经被上面三种情况所包含，因此不做考虑了

?而情况二和情况三都包含了情况一了，所以只考虑情况二和情况三就可以了。

?我们只要两种情况分别进行打家劫舍，然后结果取最大值即可

?我们只需将打家劫舍的基础版增加一个区间限制，然后套用即可：

class Solution {
public:
    int rob_tmp(vector<int>& nums,int start,int end) {
        int n = nums.size();
        if(end == start)return nums[start];
        vector<int> dp(n,0);
        dp[start] = nums[start];
        dp[start+1] = max(nums[start],nums[start+1]);
        for(int i = start+2;i < end;i++)
            dp[i] = max(dp[i - 1],dp[i - 2]+nums[i]);
        return dp[end-1];
    }

    int rob(vector<int>& nums) {
        int n = nums.size();
        if(n==1)return nums[0];
        if(n==2)return max(nums[0],nums[1]);
        int res1 = rob_tmp(nums,1,n);
        int res2 = rob_tmp(nums,0,n-1);

        return max(res1,res2);
    }
};

2.1.3 打家劫舍3

?涉及二叉树，复习之后再说

?3.股票买卖的最佳时机

3.1 框架?-股票买卖的最佳时机4

?我们以较难但是很全面的4为框架，对这一类题进行解答

?首先我们要找到选择和状态：

1）选择：

每天都有三种「选择」：买入、卖出、无操作，我们用?buy,?sell,?rest?表示这三种选择。

但问题是，并不是每天都可以任意选择这三种选择的，因为?sell?必须在?buy?之后，buy?必须在?sell?之后。那么?rest?操作还应该分两种状态，一种是?buy?之后的?rest（持有了股票），一种是?sell?之后的?rest（没有持有股票）。而且别忘了，我们还有交易次数?k?的限制，就是说你?buy?还只能在?k > 0?的前提下操作。?

2）状态：

?这个问题的「状态」有三个，第一个是天数，第二个是允许交易的最大次数，第三个是当前的持有状态（我们不妨用 1 表示持有，0 表示没有持有）。

不要把当前持有状态和是否继续持有混为一谈，一个当前是否还持有股票，另一个是对当天股票的决策

(1)dp定义：

dp[i][j][0]第i天时，我们已经进行了最多j次交易，此时手上没有股票，此时我们利润(身上剩的钱)为dp[i][j][0]

dp[i][j][1]第i天时，我们已经进行了最多j次交易，此时手上有股票，此时我们利润(身上剩的钱)为dp[i][j][1]

（2）转移方程：
这里要理解转移方程，画出状态转移图时最直观的

画出状态转移图（以某一天为例）：

完整的状态转移图：?

?我们发现图中没有对最大交易次数进行比较明显的解释，这部分是本问题的理解难点，写转移方程的时候会具体说明

我们分两部分定义dp数组，因此自然而然更新也要分两部分：

1）当天手上并没有股票：
?max( 今天选择 rest, ? ? ? ?今天选择 sell ? ? ? )

?今天选择 rest = 保留昨天的无股票

今天选择 sell? ? ?= 昨天有，今天卖了，由于卖了股票，利润增加

dp[i][k][0] = max(dp[i-1][k][0], dp[i-1][k][1] + prices[i])

2）当天手上有股票：
?max( 今天选择 rest, ? ? ? ? 今天选择 buy ? ? ? ? )

今天选择 rest = 保留昨天的有股票

?今天选择 buy = 昨天没有股票今天买入

注意，我们最开始分析三种选择时发现，每一种选择都有限制

因为?sell?必须在?buy?之后；buy?必须在?sell?之后；交易还只能在?k > 0?的前提下操作。

前两种通过当前手上是否持有股票实现了（因为不能同时进行多笔交易，所以我们0也可以表示卖了，1表示买了），那么k的限制如何实现呢？

我们可以在buy和sell的时候进行k的变更，但是如果在sell才进行变更，对于有些只买不卖的情况，k会错误，所以我们选择从buy开始就更改k

我们将k引入，如下：

dp[i][k][1] = max(dp[i-1][k][1], dp[i-1][k-1][0] - prices[i])

解释：
k为当前允许的最大次数，由于今天要进行购买，那么也就是截至前一天为止k次交易次数不能全部使用，也就是最多交易了k-1次

其他情况，由于没有涉及到buy，交易次数不改变?

完整转移方程如下：

                dp[i][j][0] = max(dp[i-1][j][0],dp[i-1][j][1]+prices[i]);
                dp[i][j][1] = max(dp[i-1][j][1],dp[i-1][j-1][0]-prices[i]);

（3）初始化：?

在本题我们只需要初始化i=0的二维数组即可，由于第0天肯定赚不了，所以利润全为0即可

（4）遍历方向：
顺序遍历

完整代码如下：

class Solution {
public:
    int maxProfit(int k, vector<int>& prices) {
        int n = prices.size();
        vector<vector<vector<int>>> dp(n,vector(k+1,vector(2,0)));

        for(int i = 1;i<=k;i++)dp[0][i][1] = - prices[0]; 
            for(int i = 1;i < n;i++)
                for(int j = 1;j<=k;j++){
                dp[i][j][0] = max(dp[i-1][j][0],dp[i-1][j][1]+prices[i]);
                dp[i][j][1] = max(dp[i-1][j][1],dp[i-1][j-1][0]-prices[i]);
            }
        return dp[n-1][k][0];
    }
};

3.2 买卖股票的最佳时机1

?本题非常契合这个转移图，因为k=1，我们不需要对k进行处理，只需要构建一个二维数组即可：

关键区别?

?1）转移方程：

            dp[i][0] = max(dp[i-1][0],dp[i-1][1] + prices[i]);
            dp[i][1] = max(dp[i-1][1], - prices[i]);

?这里一开始令我很疑惑，为什么第二行是- prices[i] 而不是 dp[ i - 1][0]- prices[i]

看了其他人解释发现，

?dp【i】【1】表示，第i天手里不持有股票状态（这里的不持有股票有三种情况，一是从第0天到第i天，一直没买过股票，二是第i天之前的某一天买过股票，我们在第i天卖掉，三是在第i天之前已经有过一次买股票和一次卖股票的操作了所以在第i天是不持有股票的状态），能有的最多的利润

而我们想要的是?从第0天到第i天，一直没买过股票，然后今天进行buy操作，如果直接使用 dp[ i - 1][0]的话，我们并不能区分当前是第几次交易，而本题只允许一次

且第一种情况利润为0，因此我们直接用0替代第一种情况即可

2）初始化：

根据定义即可，这里只需要初始化第0天的一个大小为2的一维数组即可

其他部分不多赘述，完整代码如下：

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        vector<vector<int>> dp(n,vector(2,0));
        dp[0][0] = 0;
        dp[0][1] = -prices[0];
        for(int i = 1;i < n;i++){
            dp[i][0] = max(dp[i-1][0],dp[i-1][1] + prices[i]);
            dp[i][1] = max(dp[i-1][1], - prices[i]);
        }
        return dp[n-1][0];
    }
};

3.3?买卖股票的最佳时机2

此题和股票买卖1的差别在于不限制交次数，那么buy的时候就可以使用 dp[ i - 1][0]- prices[i]进行更新，其余相同，代码如下：

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        vector<vector<int>> dp(n,vector(2,0));
        dp[0][0] = 0;
        dp[0][1] = -prices[0];
        for(int i = 1;i < n;i++){
            dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i]);
            dp[i][1] = max(dp[i-1][1], dp[i-1][0]- prices[i]);
        }
        return dp[n-1][0];
    }
};

3.4 股票买卖的最佳时机3

本题就是股票买卖4的阉割版，令k=2即可，代码如下：

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        int k =2;
        vector<vector<vector<int>>> dp(n,vector(k+1,vector(2,0)));

        for(int i = 1;i<=k;i++)dp[0][i][1] = - prices[0]; 
            for(int i = 1;i < n;i++)
                for(int j = 1;j<=k;j++){
                dp[i][j][0] = max(dp[i-1][j][0],dp[i-1][j][1]+prices[i]);
                dp[i][j][1] = max(dp[i-1][j][1],dp[i-1][j-1][0]-prices[i]);
            }
        return dp[n-1][k][0];
    }
};

3.5 最佳买卖股票时机含冷冻期

?此题就只多了一个冷冻期条件，我们仔细观察这个条件：

是对buy进行限制，也就是我们要buy的话，需要考虑前一天是否sell过

那么可以这样分情况：

1）昨天sell过

我们只能从两天前开始继承，因此buy部分为dp[i-2][0]- prices[i]

2）昨天没有sell

我们可以从昨天进行继承，但是昨天没有卖过，那么dp[i-2][0] ==?dp[i-1][0] ，因此，buy部分同样为dp[i-2][0]- prices[i]

这种思想在dp的情况讨论中很常见，有时候我们发现一种写法里面包含了多种情况，我们具体分析后就会发现多半是这多种情况的表达式一样

?同时注意根据初始化，此处更新涉及到i-2，因此要初始化前两天

完整代码如下：

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        vector<vector<int>> dp(n,vector(2,0));

        dp[0][0] = 0;
        dp[0][1] = -prices[0];
        if(n == 1)return 0;
        dp[1][0] = max(dp[0][0],dp[0][1] + prices[1]);
        dp[1][1] = max(-prices[1],dp[0][1]);


        for(int i = 2;i < n;i++){
            dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i]);
            dp[i][1] = max(dp[i-1][1], dp[i-2][0]- prices[i]);
        }
        return dp[n-1][0];
    }
};

?3.6 股票买卖的最佳时机含手续费

此题的区别在于每次交易都要给手续费，但是其他部分不变，也即是在buy或者sell时多减去一个手续费fee即可

那么应该在sell还是buy时候减呢？

答案是都可以：
在sell时减，那么初始化由于只初始化第0天，没有遇到sell的情况，不减去fee

在buy时减，初始化时就要将第一次交易的fee减去

sell时减去fee的代码如下：

class Solution {
public:
    int maxProfit(vector<int>& prices, int fee) {
        int n = prices.size();
        vector<vector<int>> dp(n,vector(2,0));
        dp[0][0] = 0;
        dp[0][1] = -prices[0];
        for(int i = 1;i < n;i++){
            dp[i][0] = max(dp[i-1][0],dp[i-1][1] + prices[i] - fee);
            dp[i][1] = max(dp[i-1][1],dp[i-1][0] -prices[i]);
        }
        return dp[n-1][0];
    }
};

文章来源:https://blog.csdn.net/qwertyasdfghh/article/details/135539249
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！