《算法技术手册》一3.6.3 动态规划

3.6.3 动态规划

动态规划是分治算法的一个衍生,它将一个问题切分成多个更加简单的子问题,然后按照顺序逐个解决。对于每个子问题,它只求解一次,然后将结果存储起来以供后续使用,这样可以避免重复计算。此外,动态规划在计算当前解时,会结合较小规模的子问题的解,并且不断增加子问题的规模。很多情况下,最终计算出来的解即为全局最优解。
动态规划常用于求解最值优化类问题上。下面通过一个示例来阐释动态规划算法。
科学家经常通过比对DNA序列来确定其相似性。现有这样一个DNA序列——由A、C、T、G所组成。因此,一个DNA序列就可以使用一个字符串进行表示,而DNA序列的相似性就可以转化成计算两个字符串的最小编辑距离。也就是说,给定一个字符串s1和一个目标字符串s2,需要使用最少的编辑操作来将s1转化成s2。支持的编辑操作包括:

例如字符串s1为“GCTAC”,可以通过3次编辑操作来得到目标字符串“CTCA”:

当然,还有其他方式来得到目标字符串,但是最少也需要3次编辑操作。对于初学者来说,计算出需要操作的次数就已经足够了,我们暂时还不需要计算出具体的操作顺序。
动态规划的关键点是存储子问题的结果。在这个例子中,我们可以使用一个二维矩阵mi,来记录s1的前i个字符和s2的前j个字符之间的最小编辑距离。这个矩阵可以初始化为:

在这个矩阵中,行标为i,列标为j。以m0为例,这个元素表示的是s1的前0个字符(也就是空字符串)和s2的前4个字符串(整个字符串“CTCA”)之间的最小编辑距离。可以很容易计算出来,m0的值为4,因为我们需要插入全部s2的4个字符到s1中去。同样的,我们也可以轻易得到m3的值为3,因为从s1的前3个字符来考虑,我们需要删除这所有3个字符来得到s2的前0个字符(即空字符串)。
动态规划的巧妙之处在于如何不断地从规模较小的子问题的解中构建出当前的最优解。让我们先来看看m1,这是表示s1的第一个字符G和s2的第一个字符C之间的编辑距离,现在有3个选择:

我们肯定会选择操作数最小的,所以m1=1。那么怎么推广这个选择策略呢?试考虑图3-2所示的计算过程。
每一次计算mi时都面临3个选择:

现在我们脑海里面就应该有一幅图片,生动地描述了动态规划是如何一步一步地按照既定的顺序从小规模的子问题开始逐渐处理的(即,从第一行到最后一行,每行按照最左到最右的顺序访问,如例3-3所示)。计算过程是按照行标i从1到len(s1)逐渐进行。当矩阵m初始化之后,我们利用嵌套的for循环计算每个子问题的最优解,直到m中的所有值都已经计算完毕。这个过程通常不用递归,而是会将之前计算过的结果存储起来。最终的最优解即为mlen(s1)的值。

图3-2:计算mi
例3-3:使用动态规划计算最小编辑距离(Python)
def minEditDistance(s1, s2):
"""计算将s1转换到s2的最小编辑距离"""
len1 = len(s1)
len2 = len(s2)

创建一个二维结构
满足mi = 0, 0≤i≤len1, 0≤j≤len2
m = [None] * (len1 + 1)
for i in range(len1 + 1):

m[i] = [0] * (len2 + 1)

横向、纵向设置初始化操作次数
for i in range(1, len1 + 1):

m[i][0] = i

for j in range(1, len2 + 1):

m[0][j] = j

计算最优解
for i in range(1, len1 + 1):

for j in range(1, len2 + 1):
  cost = 1
if s1[i - 1] == s2[j - 1]: cost = 0
replaceCost = m[i - 1][j - 1] + cost
removeCost = m[i - 1][j] + 1
insertCost = m[i][j - 1] + 1
m[i][j] = min(replaceCost, removeCost, insertCost)

return mlen1
表3-5给出了矩阵m的最终值。
表3-5:所有子问题的解

例如m3=1,因为字符串“GCT”和“CT”的最小编辑距离只有1,仅仅需要删掉GCT的第一个字符即可。这段代码仅仅计算了最小编辑距离,如果需要记录操作顺序,那么就需要另外一个矩阵prev来存储。previ记录了在计算mi时所选择的3个操作中的哪一个。要恢复操作,我们可以从mlen(s1)开始,使用previ的值,一步一步地向后追溯,直到m0为止。修改过的代码见例3-4。
例3-4:使用动态规划计算最小编辑距离,并且记录操作顺序
REPLACE = 0
REMOVE = 1
INSERT = 2
def minEditDistance(s1, s2):
"""计算将s1转换到s2的最小编辑距离,并且记录操作顺序 """
len1 = len(s1)
len2 = len(s2)

创建一个二维结构
满足mi = 0, 0≤i≤len1, 0≤j≤len2
m = [None] * (len1 + 1)
op = [None] * (len1 + 1)
for i in range(len1 + 1):

  m[i] = [0] * (len2 + 1)
  op[i] = [-1] * (len2 + 1)

横向、纵向设置初始化代价
for j in range(1, len2 + 1):

  m[0][j] = j

for i in range(1, len1 + 1):

  m[i][0] = i

计算最优解
for i in range(1, len1 + 1):

for j in range(1, len2 + 1):
  cost = 1
  if s1[i - 1] == s2[j - 1]: cost = 0
  replaceCost   = m[i - 1][j - 1] + cost
  removeCost    = m[i - 1][j] + 1
  insertCost    = m[i][j - 1] + 1
  costs         = [replaceCost, removeCost, insertCost]
  m[i][j]       = min(costs)
  op[i][j]      = costs.index(m[i][j])

ops = []
i = len1
j = len2
while i != 0 or j != 0:

if op[i][j] == REMOVE or j == 0:
  ops.append('remove {}-th char {} of {}'.format(i,s1[i-1],s1))
  i = i - 1
elif op[i][j] == INSERT or i == 0:
  ops.append('insert {}-th char {} of {}'.format(j,s2[j-1],s2))
  j = j - 1
else:
  if m[i - 1][j - 1] < m[i][j]:
    fmt='replace {}-th char of {} ({}) with {}'
    ops.append(fmt.format(s1, i, s1[i - 1], s2[j - 1]))
i, j = i - 1, j - 1

return mlen1, ops

时间: 2024-09-16 19:12:41

《算法技术手册》一3.6.3 动态规划的相关文章

《算法技术手册》一导读

前言 修订一本书向来都是一项艰巨的任务.我们既希望保留第1版(于2009年出版)中的精华,也希望弥补其中的一些不足并增加一些新的篇幅.在第2版中,我们延续了第1版中列出的原则,包括: 使用实际代码而非伪代码来描述算法. 将算法独立于解决的问题之外. 恰到好处地介绍数学知识. 以经验主导支撑数学分析. 在更新修订过程中,我们精简了文字描述,简化了一些布局,从而有助于补充新的算法和其他内容.我们相信,从概括的角度介绍计算机科学的一个重要领域,会对实用软件系统有着深远影响. 第2版的变动 在修订过程中

《算法技术手册》一2.1 问题样本的规模

2.1 问题样本的规模 问题样本是解决问题的程序所使用的特定输入数据集.在大部分问题中,随着这一数据集规模的增长,程序的执行时间也在不断增加.同时,过度地对样本数据进行编码(可能使用了压缩技术),可能会不必要地降低程序的执行效率.寻找一种最优的样本编码方式是极其困难的,因为问题发生在复杂的现实世界,而且还需要进行合理的翻译才能被程序求解. 在评估算法时,我们会尽量假定问题样本的编码并不是影响算法效率的决定性因素.问题样本的表现方式应当仅仅依赖于待执行操作的类型.设计高效的算法通常从选择一个合适的

《算法技术手册》一3.5.4 解决方案

3.5.4 解决方案 如果手动计算凸包,你应该可以很轻松地处理好各种极端情况.但是如果需要用计算机语言来描叙每一个步骤,我们可能会觉得比较困难.Graham扫描算法的关键点在于计算和最低点的极角大小.一旦计算并且排序之后,算法只需要遍历所有的点,不断地构建凸包并且根据新发现的信息调整结构即可.代码见例3-1. 例3-1:Graham扫描算法的实现 public class NativeGrahamScan implements IConvexHull { public IPoint[] comp

《算法技术手册》一1.3 高明做法

1.3 高明做法 本书介绍的大量算法都是在现有代码基础上对高效解法不懈追求的结果.我们努力地将这些算法实现为可用的代码,并尽量给出一些能够解决现实问题的算法.例如,对于凸包问题,就有许多不同的方法可以使用.在简述这些方法后,我们会在后续章节给出相应的示例.

《算法技术手册》一2.4.7 性能不明显的计算

2.4.7 性能不明显的计算 在很多情况下,仅仅通过算法的描述(如加法和乘法)就可以分辨出算法的性能是线性级还是平方级的.例如,平方级的主要特征是嵌入的循环结构.但是,这样的直接分析对某些算法却无法使用.例2-5给出了GCD算法,该算法是由欧几里德设计,用于计算两个整数的最大公约数. 例2-5:欧几里得GCD 算法 public static void gcd (int a[], int b[], int gcd[]) { if (isZero (a)) { assign (gcd, a); r

《算法技术手册》一1.3.1 贪心算法

1.3.1 贪心算法 以下的贪心算法展示了如何找到凸包上的每个点: 1. 删除P中的最低点low--low必须在凸包上. 2. 垂直画一条穿过点low的直线,将剩余的n-1个点分别和点low连线,以垂直直线右侧的点的夹角为正值降序排列,夹角的范围是从90皛-90啊n-2是最右侧的点,而P0是最左侧的点.图1-3中显示了垂直线以及每个点与其的夹角. 3. 以{Pn-2, low, P0}这个顺序组成的点集为基础,在剩余的点中选择可以组成凸包的点--从P1开始,将每个点尝试加至这个点集的尾部,如果

《算法技术手册》一2.2 函数的增长率

2.2 函数的增长率 我们将算法执行时间的增长率描述为一个与输入问题样本规模相关的函数.使用这种方法描述算法性能会比较抽象,因为它忽略了大量的细节问题.所以,在使用这种方法时,需要对抽象背后的细节有一个清醒的认识.程序都必须运行在某个平台上,在这里,广义的平台定义包括: 运行程序的计算机,包括CPU.数据缓存.浮点运算单元(FPU)以及其他芯片特性. 程序编写所使用的编程语言.编译器/解释器以及用于生成代码的优化设置. 操作系统. 其他后台进程. 改变上述组成平台的任何条件都只会对程序的执行时间

《算法技术手册》一1.3.2 分治算法

1.3.2 分治算法 我们也可以将点按x坐标从左到右排序(如果x坐标相同,就按照y坐标排序),就能将这个问题分成两个稍微小一点的子问题.首先可以从点p0到pn-1,按照从左到右.顺时针的顺序计算出一个上半部分凸包,然后用同样的方法从pn-1到p0,按照从右到左.同样是顺时针的顺序计算出下半部分凸包.凸包扫描算法(将在第9章中介绍)可以计算出这些半凸包(见图1-4),然后将结果合并在一起生成最终的凸包. 图1-4:合并上.下部分凸包组成完整凸包

《算法技术手册》一3.5 算法举例

3.5 算法举例 我们将通过Graham扫描算法来介绍本书的算法模板.该算法可以用于计算二维空间上给定点集的凸包(第1章已经介绍过这个问题,并在图1-3中予以说明).