华为 OD 训练营 · 题解精讲

LC123. 买卖股票的最佳时机 III

题目描述

给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成两笔交易。注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。示例 1: 输入：prices = [3,3,5,0,0,3,1,4] 输出：6 解释：在第 4 天（股票价格 = 0）的时候买入，在第 6 天（股票价格 = 3）的时候卖出，这笔交易所能获得利润 = 3-0 = 3 。随后，在第 7 天（股票价格 = 1）的时候买入，在第 8 天（股票价格 = 4）的时候卖出，这笔交易所能获得利润 = 4-1 = 3 。示例 2：输入：prices = [1,2,3,4,5] 输出：4 解释：在第 1 天（股票价格 = 1）的时候买入，在第 5 天（股票价格 = 5）的时候卖出, 这笔交易所能获得利润 = 5-1 = 4 。注意你不能在第 1 天和第 2 天接连购买股票，之后再将它们卖出。因为这样属于同时参与了多笔交易，你必须在再次购买前出售掉之前的股票。示例 3：输入：prices = [7,6,4,3,1] 输出：0 解释：在这个情况下, 没有交易完成, 所以最大利润为 0。示例 4：输入：prices = [1] 输出：0 提示： 1 <= prices.length <= 10(5) 0 <= prices[i] <= 10(5)

题目解析

解题思路

本题限制最多两笔交易，采用三维动态规划。定义 dp[i][k][b] 表示第 i 天结束时，最多交易 k 次（买入时扣减次数），持有状态 b（0 不持有，1 持有）下的最大利润。状态转移考虑两种操作：当天不操作（继承前一天状态）或进行买卖（卖出获利、买入扣钱并减少一次交易机会）。

关键步骤

1. 初始化第 0 天：

dp[0][0][0]=0，dp[0][1][0]=0，dp[0][2][0]=0（不持有，利润 0）
dp[0][1][1]=-prices[0]，dp[0][2][1]=-prices[0]（买入持有，利润为负股价）

2. 从第 1 天开始递推，每天更新四个状态：


dp[i][2][0] = max(dp[i-1][2][0], dp[i-1][2][1] + prices[i])   // 卖出或不动
dp[i][2][1] = max(dp[i-1][2][1], dp[i-1][1][0] - prices[i])   // 买入（消耗一次交易）或不动
dp[i][1][0] = max(dp[i-1][1][0], dp[i-1][1][1] + prices[i])   // 卖出或不动
dp[i][1][1] = max(dp[i-1][1][1], dp[i-1][0][0] - prices[i])   // 买入（消耗一次交易）或不动

3. 最终答案：dp[length-1][2][0]（最后一天不持有股票，最多两次交易的最大利润）

复杂度分析

时间复杂度：O(n)，只需遍历 prices 数组一次，每次常数操作。
空间复杂度：O(n)，三维数组大小为 n×3×2，可优化为 O(1) 但参考代码未优化。

参考代码

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        # 先获取数组的长度
        length = len(prices)

        # 设置一个三维数组 dp
        # dp[i][k][b]
        # i 表示天数，dp[i] 表示第 i 天的最大利润
        # k 表示最多交易次数，每次交易包含买入和卖出，这里只在买入的时候将 k - 1
        # 注意：【 k 表示最多交易次数，而不是实际交易次数，比如最多交易两次可能实际只交易一次】
        # b 表示当前是否持有股票，取值为 0 和 1
        # 其中 0 表示当前持有 0 份股票，即【不持有】股票
        # 而 1 表示当前持有 1 份股票，即【持有】股票
        
        # 在本题中，k 的值为 2，i 的取值范围为数组 prices 的长度，从 0 开始
         # 越在前面的维度，总体上是越出现在后面
        dp = [[[0] * 2 for _ in range(3)] for _ in range(length)]

        # dp[0][0][0] 表示在第 0 天结束时，即收盘后，手上持有 0 份股票，且此时最多进行了 0 次交易的情况下可以获得的最大收益
        # 此时，就是什么都没做，利润为 0
        dp[0][0][0] = 0

        # dp[0][1][0] 表示在第 0 天结束时，即收盘后，手上持有 0 份股票，且此时最多进行了 1 次交易的情况下可以获得的最大收益
        # 此时，就是什么都没做，利润为 0
        dp[0][1][0] = 0

        # dp[0][1][1] 表示在第 0 天结束时，即收盘后，手上持有 1 份股票，且此时最多进行了 1 次交易的情况下可以获得的最大收益
        # 手上持有了 1 份股票，那肯定是执行了买入操作，然后又还没有卖出，那么钱都投入了股票中，利润就是负的，即为 -prices[0]
        dp[0][1][1] = -prices[0]

        # dp[0][2][0] 表示在第 0 天结束时，即收盘后，手上持有 0 份股票，且此时最多进行了 2 次交易的情况下可以获得的最大收益
        # 此时，就是什么都没做，利润为 0
        dp[0][2][0] = 0

        # dp[0][2][1] 表示在第 0 天结束时，即收盘后，手上持有 1 份股票，且此时最多进行了 2 次交易的情况下可以获得的最大收益
        # 手上持有了 1 份股票，那肯定是执行了买入操作，然后又还没有卖出，那么钱都投入了股票中，利润就是负的，即为 -prices[0]
        dp[0][2][1] = -prices[0]

        # 动态规划：自底向上，即从前向后遍历，实现一个萝卜一个坑
        for i in range( 1 ,length) : 
            
            # 对于每个坑来说，都有两种状态
            # 今天也就是第 i 天

            # 1、今天【不持有】股票，且此时最多进行了 2 次
            # 第 i - 1 天【持有】股票，第 i 天卖出
            # 昨天【持有】股票，今天卖出
            # vs
            # 第 i - 1 天【不持有】股票，第 i 天不操作
            # 昨天【不持有】股票，今天不操作
            dp[i][2][0] = max( dp[i - 1][2][0] , dp[i - 1][2][1] + prices[i] ) 

            # 2、今天【持有】股票，且此时最多进行了 2 次
            # 第 i - 1 天【持有】股票，第 i 天不操作
            # 昨天【持有】股票，今天不操作
            # vs
            # 第 i - 1 天【不持有】股票，第 i 天买入
            # 昨天【不持有】股票，今天买入
            dp[i][2][1] = max( dp[i - 1][2][1] , dp[i - 1][1][0] - prices[i] ) 

            # 3、今天【不持有】股票，且此时最多进行了 1 次
            # 第 i - 1 天【持有】股票，第 i 天卖出
            # 昨天【持有】股票，今天卖出
            # vs
            # 第 i - 1 天【不持有】股票，第 i 天不操作
            # 昨天【不持有】股票，今天不操作
            dp[i][1][0] = max( dp[i - 1][1][0] , dp[i - 1][1][1] + prices[i] ) 

            # 4、今天【持有】股票，且此时最多进行了 1 次
            # 第 i - 1 天【持有】股票，第 i 天不操作
            # 昨天【持有】股票，今天不操作
            # vs
            # 第 i - 1 天【不持有】股票，第 i 天买入
            # 昨天【不持有】股票，今天买入
            dp[i][1][1] = max( dp[i - 1][1][1] , dp[i - 1][0][0] - prices[i] ) 


        

        # for 循环结束后，dp 数组填充完毕
        # dp[length - 1][1][0]
        # 表示第 length - 1 天结束时，即收盘后，手上持有 0 份股票，且此时最多进行了 2 次交易的情况下可以获得的最大收益
        return dp[length - 1][2][0]

← 上一篇

LC122. 买卖股票的最佳时机 II（贪心解法）

LC125. 验证回文串