AlgoMooc
你已开通华为OD训练营权益,还差最后一步——完成入营激活(兑换课程 + 加飞书 + 登记服务群),即可解锁全部课程与专属服务。去激活 →
← OD 20 天课程

华为 OD 训练营 · 题解精讲

LC123. 买卖股票的最佳时机 III

LC123. 买卖股票的最佳时机 III

题目描述

给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。 注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。 示例 1: 输入:prices = [3,3,5,0,0,3,1,4] 输出:6 解释:在第 4 天(股票价格 = 0)的时候买入,在第 6 天(股票价格 = 3)的时候卖出,这笔交易所能获得利润 = 3-0 = 3 。随后,在第 7 天(股票价格 = 1)的时候买入,在第 8 天 (股票价格 = 4)的时候卖出,这笔交易所能获得利润 = 4-1 = 3 。 示例 2: 输入:prices = [1,2,3,4,5] 输出:4 解释:在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5-1 = 4 。 注意你不能在第 1 天和第 2 天接连购买股票,之后再将它们卖出。 因为这样属于同时参与了多笔交易,你必须在再次购买前出售掉之前的股票。 示例 3: 输入:prices = [7,6,4,3,1] 输出:0 解释:在这个情况下, 没有交易完成, 所以最大利润为 0。 示例 4: 输入:prices = [1] 输出:0 提示: 1 <= prices.length <= 10(5) 0 <= prices[i] <= 10(5)

题目解析

解题思路

本题限制最多两笔交易,采用三维动态规划。定义 dp[i][k][b] 表示第 i 天结束时,最多交易 k 次(买入时扣减次数),持有状态 b(0 不持有,1 持有)下的最大利润。状态转移考虑两种操作:当天不操作(继承前一天状态)或进行买卖(卖出获利、买入扣钱并减少一次交易机会)。

关键步骤

1. 初始化第 0 天

  • dp[0][0][0]=0dp[0][1][0]=0dp[0][2][0]=0(不持有,利润 0)
  • dp[0][1][1]=-prices[0]dp[0][2][1]=-prices[0](买入持有,利润为负股价)

2. 从第 1 天开始递推,每天更新四个状态:


dp[i][2][0] = max(dp[i-1][2][0], dp[i-1][2][1] + prices[i])   // 卖出或不动
dp[i][2][1] = max(dp[i-1][2][1], dp[i-1][1][0] - prices[i])   // 买入(消耗一次交易)或不动
dp[i][1][0] = max(dp[i-1][1][0], dp[i-1][1][1] + prices[i])   // 卖出或不动
dp[i][1][1] = max(dp[i-1][1][1], dp[i-1][0][0] - prices[i])   // 买入(消耗一次交易)或不动

3. 最终答案dp[length-1][2][0](最后一天不持有股票,最多两次交易的最大利润)

复杂度分析

  • 时间复杂度:O(n),只需遍历 prices 数组一次,每次常数操作。
  • 空间复杂度:O(n),三维数组大小为 n×3×2,可优化为 O(1) 但参考代码未优化。

参考代码

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        # 先获取数组的长度
        length = len(prices)

        # 设置一个三维数组 dp
        # dp[i][k][b]
        # i 表示天数,dp[i] 表示第 i 天的最大利润
        # k 表示最多交易次数,每次交易包含买入和卖出,这里只在买入的时候将 k - 1
        # 注意:【 k 表示最多交易次数,而不是实际交易次数,比如最多交易两次可能实际只交易一次】
        # b 表示当前是否持有股票,取值为 0 和 1
        # 其中 0 表示当前持有 0 份股票,即【不持有】股票
        # 而 1 表示当前持有 1 份股票,即【持有】股票
        
        # 在本题中,k 的值为 2,i 的取值范围为数组 prices 的长度,从 0 开始
         # 越在前面的维度,总体上是越出现在后面
        dp = [[[0] * 2 for _ in range(3)] for _ in range(length)]

        # dp[0][0][0] 表示在第 0 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 0 次交易的情况下可以获得的最大收益
        # 此时,就是什么都没做,利润为 0
        dp[0][0][0] = 0

        # dp[0][1][0] 表示在第 0 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 1 次交易的情况下可以获得的最大收益
        # 此时,就是什么都没做,利润为 0
        dp[0][1][0] = 0

        # dp[0][1][1] 表示在第 0 天结束时,即收盘后,手上持有 1 份股票,且此时最多进行了 1 次交易的情况下可以获得的最大收益
        # 手上持有了 1 份股票,那肯定是执行了买入操作,然后又还没有卖出,那么钱都投入了股票中,利润就是负的,即为 -prices[0]
        dp[0][1][1] = -prices[0]

        # dp[0][2][0] 表示在第 0 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 2 次交易的情况下可以获得的最大收益
        # 此时,就是什么都没做,利润为 0
        dp[0][2][0] = 0

        # dp[0][2][1] 表示在第 0 天结束时,即收盘后,手上持有 1 份股票,且此时最多进行了 2 次交易的情况下可以获得的最大收益
        # 手上持有了 1 份股票,那肯定是执行了买入操作,然后又还没有卖出,那么钱都投入了股票中,利润就是负的,即为 -prices[0]
        dp[0][2][1] = -prices[0]

        # 动态规划:自底向上,即从前向后遍历,实现一个萝卜一个坑
        for i in range( 1 ,length) : 
            
            # 对于每个坑来说,都有两种状态
            # 今天也就是第 i 天

            # 1、今天【不持有】股票,且此时最多进行了 2 次
            # 第 i - 1 天【持有】股票,第 i 天卖出
            # 昨天【持有】股票,今天卖出
            # vs
            # 第 i - 1 天【不持有】股票,第 i 天不操作
            # 昨天【不持有】股票,今天不操作
            dp[i][2][0] = max( dp[i - 1][2][0] , dp[i - 1][2][1] + prices[i] ) 

            # 2、今天【持有】股票,且此时最多进行了 2 次
            # 第 i - 1 天【持有】股票,第 i 天不操作
            # 昨天【持有】股票,今天不操作
            # vs
            # 第 i - 1 天【不持有】股票,第 i 天买入
            # 昨天【不持有】股票,今天买入
            dp[i][2][1] = max( dp[i - 1][2][1] , dp[i - 1][1][0] - prices[i] ) 

            # 3、今天【不持有】股票,且此时最多进行了 1 次
            # 第 i - 1 天【持有】股票,第 i 天卖出
            # 昨天【持有】股票,今天卖出
            # vs
            # 第 i - 1 天【不持有】股票,第 i 天不操作
            # 昨天【不持有】股票,今天不操作
            dp[i][1][0] = max( dp[i - 1][1][0] , dp[i - 1][1][1] + prices[i] ) 

            # 4、今天【持有】股票,且此时最多进行了 1 次
            # 第 i - 1 天【持有】股票,第 i 天不操作
            # 昨天【持有】股票,今天不操作
            # vs
            # 第 i - 1 天【不持有】股票,第 i 天买入
            # 昨天【不持有】股票,今天买入
            dp[i][1][1] = max( dp[i - 1][1][1] , dp[i - 1][0][0] - prices[i] ) 


        

        # for 循环结束后,dp 数组填充完毕
        # dp[length - 1][1][0]
        # 表示第 length - 1 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 2 次交易的情况下可以获得的最大收益
        return dp[length - 1][2][0]