vlambda博客
学习文章列表

动态规划 - 矩阵链相乘

一、动态规划的简单介绍

1. 动态规划的定义:

动态规划,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。

2. 动态规划的特征:

重叠子问题、最优子结构、无后效性

最优子结构是指一个问题的最优解如果包含其子问题的最优解,则这个问题具有最优子结构。

无后效性的定义是某阶段的状态一旦确定,则此后过程的演变不再受此前各种状态及决策的影响。

判断一个问题适不适合用动态规划解决,可以判断问题是不是具有以上3种特征。具有则适合用动态规划方法解决。

3. 解决动态规划问题的步骤:

a. 确定子问题

b.确定状态转移方程

c.确定边界条件

二、矩阵链相乘案例:

1. 题目:

给定n个矩阵序列,(A1,A2,A3,A4,...,An). 计算他们的乘积:A1A2A3...An,求使得乘法次数最小的代价方法

由于矩阵的乘法运算符合结合律,因而可以通过调整计算顺序,从而降低计算量。

示例:

输入p = [5, 10, 3, 12, 5],即: A1 为 5*10的矩阵,A2为10*3的矩阵, A3为3*12的矩阵,A4为12*5的矩阵,求A1*A2*A3*A4 的最小代价方法。

输出为:最优计算代价:405

最优方案为:((A1A2)(A3A4))

2. 分析:

A1*A2*A3*A4可化为A1~4。

m[i,j]表示Ai一直到Aj相乘的乘法最小次数。

Ai~j可化为Ai~j = Ai~k * Ak~j。其中i<k<j

则m[i,j] = m[i,k]+m[k+1, j]+pi-1*pk+pj

针对示例来说:m[1,4]=m[1, 3]+m[3, 4]+p0*p3*p4=m[1,2]+m[2,4]+p0*p2*p4=m[1,1]+m[1,4]+p0*p1*p4

所以转化为求m[i,j]的问题。

使用前要确定这个问题是不是适合动态规划,即有没有重叠子问题,有没有最优子结构,有没有无后效性质。

a. 有没有重叠子的问题

A1*A2*A3*A4有A1(A2(A3A4))、A1((A2A3)A4))、(A1A2)(A3A4)、A1A2A3A4四种方案

分析过程:

可以看到其中有很多的重叠子。比如 A1*A2,A3A4等等

b. 有没有最优子结构

m[i,j] = m[i,k]+m[k+1, j]+pi-1*pk+pj

m[i,j]的最优解,需要求m[i,k]的最优解和m[k+1, j]的最优解,所以是包含子问题的最优解的

所以具有最优子结构

c. 有没有无后效性

m[i,k]的最优解确定后,无论其他的最优解怎么变化,m[i,k]的最优解是不变的。

综上此问题可以使用动态规划问题解决。

3. 解决步骤:

a. 确定子问题 m[i,j]

b.明确状态,明确选择,确定状态转移方程 m[i,j] = m[i,k]+m[k+1, j]+pi-1*pk+pj

c.确定计算顺序及边界条件 m[i,i] = 0

最优子问题m[i,j]的每一步结果都要存储的话,最适合的存储结构是二维数组。

可以看出,计算顺序最适合的方式是:先求第一条对角线上的解,在求第二条对角线上的解,最后求第三条对角线上的解。因为这样,前边的问题都已经有了计算结果


4. 代码:

'''

matrixChain方法:

设置i为行号,j为列号,n为矩阵个数,目标求m[i,j]

i的取值范围0~n-1,j的取值范围0~n-1

求解顺序,先求第一条对角线上的,在求第二条对角线上的,以此类推,直到最后一条对角线

对角线d的取值范围0~n-1

在每个对角线上,i,j,d之间的关系为 j=i+d

a. 确定对角线d

b. 确定i

c. 确定j

d. 确定k

m 记录的是乘法次数最小的次数

s 记录的是最优解对应的k值

getFun方法:获取最优解的括号位置

同样是一个动态规划问题

s[i,j]记录的是AiAj最优解时k的值

同样以k做为区分点,s[i,k]记录的是AiAk的最优解时对应的k值, s[k+1,j]记录的是Ak+1Aj的最优解时对应的k值

k = s[i-1][j-1]

边界条件,i = j, 意味着就是一个矩阵,故可以直接返回Ai

'''

def matrixChain(p):

num = len(p) - 1

m = [[0] * num for _ in range(num)]

s = [[0] * num for _ in range(num)]

for d in range(1, num):

for i in range(1, num-d+1):

j = i + d

m[i - 1][j - 1] = 9999999999

for k in range(i, j):

template = m[i-1][k-1] + m[k][j-1] + p[i-1]*p[k]*p[j]

if template < m[i-1][j-1]:

m[i-1][j-1] = template

s[i-1][j-1] = k

return m, s

def getFun(s, i, j):

if i == j:

print("A" + str(i), end="")

else:

print("(", end="")

getFun(s, i, int(s[i-1][j-1]))

getFun(s, int(s[i-1][j-1])+1, j)

print(")", end = "")

p = [5, 10, 3, 12, 5]

res, s = matrixChain(p)

print(res)

print(s)

getFun(s, 1, 4)

5. 复杂度

时间复杂度:计算代价的时间:三层循环 O(n^3)

构造最优解的时间:O(n)

总的时间复杂度:O(n^3)

空间复杂度:使用了两个数组,需要空间2*O(n^2),即O(n^2)