动态规划 - 矩阵链相乘

vlambda
2020-08-24

动态规划 - 矩阵链相乘

一、动态规划的简单介绍

1. 动态规划的定义：

动态规划，通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。

2. 动态规划的特征：

重叠子问题、最优子结构、无后效性

最优子结构是指一个问题的最优解如果包含其子问题的最优解，则这个问题具有最优子结构。

无后效性的定义是某阶段的状态一旦确定，则此后过程的演变不再受此前各种状态及决策的影响。

判断一个问题适不适合用动态规划解决，可以判断问题是不是具有以上3种特征。具有则适合用动态规划方法解决。

3. 解决动态规划问题的步骤：

a. 确定子问题

b.确定状态转移方程

c.确定边界条件

二、矩阵链相乘案例：

1. 题目：

给定n个矩阵序列，(A1,A2,A3,A4,...,An). 计算他们的乘积：A1A2A3...An，求使得乘法次数最小的代价方法

由于矩阵的乘法运算符合结合律，因而可以通过调整计算顺序，从而降低计算量。

示例：

输入p = [5, 10, 3, 12, 5]，即: A1 为 5*10的矩阵，A2为10*3的矩阵， A3为3*12的矩阵，A4为12*5的矩阵，求A1*A2*A3*A4 的最小代价方法。

输出为：最优计算代价：405

最优方案为：((A1A2)(A3A4))

2. 分析：

A1*A2*A3*A4可化为A1~4。

m[i,j]表示Ai一直到Aj相乘的乘法最小次数。

Ai~j可化为Ai~j = Ai~k * Ak~j。其中i<k<j

则m[i,j] = m[i,k]+m[k+1, j]+pi-1*pk+pj

针对示例来说：m[1,4]=m[1, 3]+m[3, 4]+p0*p3*p4=m[1,2]+m[2,4]+p0*p2*p4=m[1,1]+m[1,4]+p0*p1*p4

所以转化为求m[i,j]的问题。

使用前要确定这个问题是不是适合动态规划，即有没有重叠子问题，有没有最优子结构，有没有无后效性质。

a. 有没有重叠子的问题

A1*A2*A3*A4有A1(A2(A3A4))、A1((A2A3)A4))、(A1A2)(A3A4)、A1A2A3A4四种方案

分析过程：

可以看到其中有很多的重叠子。比如 A1*A2，A3A4等等

b. 有没有最优子结构

m[i,j] = m[i,k]+m[k+1, j]+pi-1*pk+pj

m[i,j]的最优解，需要求m[i,k]的最优解和m[k+1, j]的最优解，所以是包含子问题的最优解的

所以具有最优子结构

c. 有没有无后效性

m[i,k]的最优解确定后，无论其他的最优解怎么变化，m[i,k]的最优解是不变的。

综上此问题可以使用动态规划问题解决。

3. 解决步骤：

a. 确定子问题 m[i,j]

b.明确状态，明确选择，确定状态转移方程 m[i,j] = m[i,k]+m[k+1, j]+pi-1*pk+pj

c.确定计算顺序及边界条件 m[i,i] = 0

最优子问题m[i,j]的每一步结果都要存储的话，最适合的存储结构是二维数组。

可以看出，计算顺序最适合的方式是：先求第一条对角线上的解，在求第二条对角线上的解，最后求第三条对角线上的解。因为这样，前边的问题都已经有了计算结果

4. 代码：

'''

matrixChain方法：

设置i为行号，j为列号,n为矩阵个数，目标求m[i，j]

i的取值范围0～n-1，j的取值范围0～n-1

求解顺序，先求第一条对角线上的，在求第二条对角线上的，以此类推，直到最后一条对角线

对角线d的取值范围0～n-1

在每个对角线上，i，j，d之间的关系为 j=i+d

a. 确定对角线d

b. 确定i

c. 确定j

d. 确定k

m 记录的是乘法次数最小的次数

s 记录的是最优解对应的k值

getFun方法：获取最优解的括号位置

同样是一个动态规划问题

s[i,j]记录的是AiAj最优解时k的值

同样以k做为区分点，s[i,k]记录的是AiAk的最优解时对应的k值， s[k+1,j]记录的是Ak+1Aj的最优解时对应的k值

k = s[i-1][j-1]

边界条件，i = j, 意味着就是一个矩阵，故可以直接返回Ai

'''

def matrixChain(p):

num = len(p) - 1

m = [[0] * num for _ in range(num)]

s = [[0] * num for _ in range(num)]

for d in range(1, num):

for i in range(1, num-d+1):

j = i + d

m[i - 1][j - 1] = 9999999999

for k in range(i, j):

template = m[i-1][k-1] + m[k][j-1] + p[i-1]*p[k]*p[j]

if template < m[i-1][j-1]:

m[i-1][j-1] = template

s[i-1][j-1] = k

return m, s

def getFun(s, i, j):

if i == j:

print("A" + str(i), end="")

else:

print("(", end="")

getFun(s, i, int(s[i-1][j-1]))

getFun(s, int(s[i-1][j-1])+1, j)

print(")", end = "")

p = [5, 10, 3, 12, 5]

res, s = matrixChain(p)

print(res)

print(s)

getFun(s, 1, 4)

5. 复杂度

时间复杂度：计算代价的时间：三层循环 O(n^3)

构造最优解的时间：O(n)

总的时间复杂度:O(n^3)

空间复杂度：使用了两个数组，需要空间2*O(n^2)，即O(n^2)

vlambda博客
学习文章列表