华为 OD 训练营 · 题解精讲
LC123. 买卖股票的最佳时机 III
LC123. 买卖股票的最佳时机 III
题目描述
给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。 注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。 示例 1: 输入:prices = [3,3,5,0,0,3,1,4] 输出:6 解释:在第 4 天(股票价格 = 0)的时候买入,在第 6 天(股票价格 = 3)的时候卖出,这笔交易所能获得利润 = 3-0 = 3 。随后,在第 7 天(股票价格 = 1)的时候买入,在第 8 天 (股票价格 = 4)的时候卖出,这笔交易所能获得利润 = 4-1 = 3 。 示例 2: 输入:prices = [1,2,3,4,5] 输出:4 解释:在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5-1 = 4 。 注意你不能在第 1 天和第 2 天接连购买股票,之后再将它们卖出。 因为这样属于同时参与了多笔交易,你必须在再次购买前出售掉之前的股票。 示例 3: 输入:prices = [7,6,4,3,1] 输出:0 解释:在这个情况下, 没有交易完成, 所以最大利润为 0。 示例 4: 输入:prices = [1] 输出:0 提示: 1 <= prices.length <= 10(5) 0 <= prices[i] <= 10(5)
题目解析
解题思路
本题限制最多两笔交易,采用三维动态规划。定义 dp[i][k][b] 表示第 i 天结束时,最多交易 k 次(买入时扣减次数),持有状态 b(0 不持有,1 持有)下的最大利润。状态转移考虑两种操作:当天不操作(继承前一天状态)或进行买卖(卖出获利、买入扣钱并减少一次交易机会)。
关键步骤
1. 初始化第 0 天:
dp[0][0][0]=0,dp[0][1][0]=0,dp[0][2][0]=0(不持有,利润 0)dp[0][1][1]=-prices[0],dp[0][2][1]=-prices[0](买入持有,利润为负股价)
2. 从第 1 天开始递推,每天更新四个状态:
dp[i][2][0] = max(dp[i-1][2][0], dp[i-1][2][1] + prices[i]) // 卖出或不动
dp[i][2][1] = max(dp[i-1][2][1], dp[i-1][1][0] - prices[i]) // 买入(消耗一次交易)或不动
dp[i][1][0] = max(dp[i-1][1][0], dp[i-1][1][1] + prices[i]) // 卖出或不动
dp[i][1][1] = max(dp[i-1][1][1], dp[i-1][0][0] - prices[i]) // 买入(消耗一次交易)或不动3. 最终答案:dp[length-1][2][0](最后一天不持有股票,最多两次交易的最大利润)
复杂度分析
- 时间复杂度:O(n),只需遍历 prices 数组一次,每次常数操作。
- 空间复杂度:O(n),三维数组大小为 n×3×2,可优化为 O(1) 但参考代码未优化。
参考代码
class Solution:
def maxProfit(self, prices: List[int]) -> int:
# 先获取数组的长度
length = len(prices)
# 设置一个三维数组 dp
# dp[i][k][b]
# i 表示天数,dp[i] 表示第 i 天的最大利润
# k 表示最多交易次数,每次交易包含买入和卖出,这里只在买入的时候将 k - 1
# 注意:【 k 表示最多交易次数,而不是实际交易次数,比如最多交易两次可能实际只交易一次】
# b 表示当前是否持有股票,取值为 0 和 1
# 其中 0 表示当前持有 0 份股票,即【不持有】股票
# 而 1 表示当前持有 1 份股票,即【持有】股票
# 在本题中,k 的值为 2,i 的取值范围为数组 prices 的长度,从 0 开始
# 越在前面的维度,总体上是越出现在后面
dp = [[[0] * 2 for _ in range(3)] for _ in range(length)]
# dp[0][0][0] 表示在第 0 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 0 次交易的情况下可以获得的最大收益
# 此时,就是什么都没做,利润为 0
dp[0][0][0] = 0
# dp[0][1][0] 表示在第 0 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 1 次交易的情况下可以获得的最大收益
# 此时,就是什么都没做,利润为 0
dp[0][1][0] = 0
# dp[0][1][1] 表示在第 0 天结束时,即收盘后,手上持有 1 份股票,且此时最多进行了 1 次交易的情况下可以获得的最大收益
# 手上持有了 1 份股票,那肯定是执行了买入操作,然后又还没有卖出,那么钱都投入了股票中,利润就是负的,即为 -prices[0]
dp[0][1][1] = -prices[0]
# dp[0][2][0] 表示在第 0 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 2 次交易的情况下可以获得的最大收益
# 此时,就是什么都没做,利润为 0
dp[0][2][0] = 0
# dp[0][2][1] 表示在第 0 天结束时,即收盘后,手上持有 1 份股票,且此时最多进行了 2 次交易的情况下可以获得的最大收益
# 手上持有了 1 份股票,那肯定是执行了买入操作,然后又还没有卖出,那么钱都投入了股票中,利润就是负的,即为 -prices[0]
dp[0][2][1] = -prices[0]
# 动态规划:自底向上,即从前向后遍历,实现一个萝卜一个坑
for i in range( 1 ,length) :
# 对于每个坑来说,都有两种状态
# 今天也就是第 i 天
# 1、今天【不持有】股票,且此时最多进行了 2 次
# 第 i - 1 天【持有】股票,第 i 天卖出
# 昨天【持有】股票,今天卖出
# vs
# 第 i - 1 天【不持有】股票,第 i 天不操作
# 昨天【不持有】股票,今天不操作
dp[i][2][0] = max( dp[i - 1][2][0] , dp[i - 1][2][1] + prices[i] )
# 2、今天【持有】股票,且此时最多进行了 2 次
# 第 i - 1 天【持有】股票,第 i 天不操作
# 昨天【持有】股票,今天不操作
# vs
# 第 i - 1 天【不持有】股票,第 i 天买入
# 昨天【不持有】股票,今天买入
dp[i][2][1] = max( dp[i - 1][2][1] , dp[i - 1][1][0] - prices[i] )
# 3、今天【不持有】股票,且此时最多进行了 1 次
# 第 i - 1 天【持有】股票,第 i 天卖出
# 昨天【持有】股票,今天卖出
# vs
# 第 i - 1 天【不持有】股票,第 i 天不操作
# 昨天【不持有】股票,今天不操作
dp[i][1][0] = max( dp[i - 1][1][0] , dp[i - 1][1][1] + prices[i] )
# 4、今天【持有】股票,且此时最多进行了 1 次
# 第 i - 1 天【持有】股票,第 i 天不操作
# 昨天【持有】股票,今天不操作
# vs
# 第 i - 1 天【不持有】股票,第 i 天买入
# 昨天【不持有】股票,今天买入
dp[i][1][1] = max( dp[i - 1][1][1] , dp[i - 1][0][0] - prices[i] )
# for 循环结束后,dp 数组填充完毕
# dp[length - 1][1][0]
# 表示第 length - 1 天结束时,即收盘后,手上持有 0 份股票,且此时最多进行了 2 次交易的情况下可以获得的最大收益
return dp[length - 1][2][0]