[算法系列之七]Manacher算法之最大回文子串

回文串定义:“回文串”是一个正读和反读都一样的字符串,比如“level”或者“noon”等等就是回文串。
回文子串,顾名思义,即字符串中满足回文性质的子串。

经常有一些题目围绕回文子串进行讨论,比如  HDOJ_3068_最长回文,求最长回文子串的长度。朴素算法是依次以每一个字符为中心向两侧进行扩展,

显然这个复杂度是 O(N^2)的,关于字符串的题目常用的算法有 KMP、后缀数组、 AC 自动机,这道题目利用扩展 KMP可以解答,其时间复杂度也很快 O(N*logN)。

但是,今天笔者介绍一个专门针对回文子串的算法,其时间复杂度为 O(n),这就是 manacher 算法。

大家都知道,求回文串时需要判断其奇偶性,也就是求 aba 和 abba 的算法略有差距。然而,这个算法做了一个简单的处理,很巧妙地把奇数长度回文串与偶数长度回文串统一考
虑,也就是在每个相邻的字符之间插入一个分隔符,串的首尾也要加,当然这个分隔符不能再原串中出现,一般可以用‘#’或者‘$’等字符。例如:
原串:abaab
新串:#a#b#a#a#b#
这样一来,原来的奇数长度回文串还是奇数长度,偶数长度的也变成以‘#’为中心的奇数回文串了。
接下来就是算法的中心思想,用一个辅助数组 P 记录以每个字符为中心的最长回文半
径,也就是 P[i]记录以 Str[i]字符为中心的最长回文串半径。 P[i]最小为 1,此时回文串为 Str[i]本身。
我们可以对上述例子写出其 P 数组,如下 
新串:  #   a   #   b   #   a   #   a   #   b   #
P[]  :     1    2   1   4   1   2   5   2   1   2   1
我们可以证明 P[i]-1 就是以 Str[i]为中心的回文串在原串当中的长度。
证明:
1、显然 L=2*P[i]-1 即为新串中以 Str[i]为中心最长回文串长度。
2、以 Str[i]为中心的回文串一定是以#开头和结尾的,例如“#b#b#”或“#b#a#b#”所以 L 减去最前或者最后的‘#’字符就是原串中长度的二倍,即原串长度为(L-1)/2,化简
的 P[i]-1。得证。

依次从前往后求得 P 数组就可以了,这里用到了 DP(动态规划)的思想,也就是求 P[i]的时候,前面的 P[]值已经得到了,我们利用回文串的特殊性质可以进行一个大大的优化。

核心代码:

// MaxId为i字符之前最大回文串向右延伸的最大位置
    // id为MaxId对应的最大回文串的中心位置
    for(int i = 1;i < len;i++){
        //初步定i位置字符为中心的半径
        if(MaxId > i){
            p[i] = min(MaxId - i,p[2*id - i]);
        }
        else{
            p[i] = 1;
        }
        //继续确定i位置字符为中心的半径 这地方用到'$'
        while(str[i-p[i]] == str[i+p[i]]){
            p[i]++;
        }
        //更新MaxId,id
        if(p[i]+i > MaxId){
            MaxId = p[i] + i;
            id = i;
        }
    }

为了防止求 P[i]向两边扩展时可能数组越界,我们需要在数组最前面和最后面加一个特殊字符,令 P[0]= ‘$’最后位置默认为‘\0’不需要特殊处理。此外,我们用 MaxId 变量
记录在求 i 之前的回文串中延伸至最右端的位置,同时用 id 记录取这个 MaxId 对应回文串的中心位置。
通过下面这句话,算法避免了很多没必要的重复匹配。

if(MaxId>i)
{
p[i]=min(p[2*id-i],MaxId-i);
}

那么这句话是怎么得来的呢,其实就是利用了回文串的对称性,如下图,

j=2*id-i 即为 i 关于 id 的对称点,根据对称性,P[ j]的回文串也是可以对称到 i 这边的,但是如果 P[ j]的回文串对称过来以后超过 MaxId 的话,超出部分就不能对称过来了,如下
图,所以这里 P[i]为的下限为两者中的较小者,p[i]=Min(p[2*id-i],MaxId-i) 。

算法的有效比较次数为 MaxId 次,所以说这个算法的时间复杂度为 O(n)。

这是我具体实现的代码:

#include <string.h>
#include <iostream>
#include <algorithm>
using namespace std;
//数据预处理
char* Init(char* s){
    int len = strlen(s);
    char* str = new char(2*len+4);
    str[0] = '$';
    int index = 1;
    for(int i = 0;i < len;i++){
        str[index++] = '#';
        str[index++] = s[i];
    }
    str[index++] = '#';
    str[index] = '\0';
    return str;
}

string MaxPalindromeNumber(char* s){
    char *str = Init(s);
    int maxId = 0,center = 1;
    int len = strlen(str);
    int *p = new int[len+1];

    // MaxId为i字符之前最大回文串向右延伸的最大位置
    // id为MaxId对应的最大回文串的中心位置
    for(int i = 1;i < len;i++){
        //初步定i位置字符为中心的半径
        if(maxId > i){
            p[i] = min(maxId - i,p[2*center - i]);
        }
        else{
            p[i] = 1;
        }
        //继续确定i位置字符为中心的半径 这地方用到'$'
        while(str[i-p[i]] == str[i+p[i]]){
            p[i]++;
        }
        //更新MaxId,id
        if(p[i]+i > maxId){
            maxId = p[i] + i;
            center = i;
        }
    }
    // 最大长度
    int maxLen = 0;
    center = 1;
    for(int i = 1;i < len;i++){
        if(str[i] != '#' && p[i] - 1 > maxLen){
            maxLen = p[i] - 1;
            center = i;
        }
    }
    //提取最大回文串
    char* maxStr = new char[maxLen+1];
    int index = 0;
    for(int i = center - maxLen;i <= center + maxLen;i++){
        if(str[i] != '#'){
            maxStr[index++] = str[i];
        }
    }
    maxStr[index] = '\0';
    return maxStr;
}

int main(){
	char* str="skjflkdsjfkldsababasdlkfjsdwieowowwpw";
	cout<<MaxPalindromeNumber(str);
	return 0;
}

时间: 2024-09-17 03:46:46

[算法系列之七]Manacher算法之最大回文子串的相关文章

hihocoder 算法-我的hihocoder这个最长回文子串为什么报wrong answer?

问题描述 我的hihocoder这个最长回文子串为什么报wrong answer? import java.util.Scanner; public class Main { public static void main(String[] args) { Scanner scanner = new Scanner(System.in); int n = scanner.nextInt(); for(int i = 0;i String str = scanner.next(); System.

lintcode最长回文子串(Manacher算法)

题目来自lintcode, 链接:http://www.lintcode.com/zh-cn/problem/longest-palindromic-substring/ v最长回文子串  给出一个字符串(假设长度最长为1000),求出它的最长回文子串,你可以假定只有一个满足条件的最长回文串. v样例 给出字符串 "abcdzdcab",它的最长回文子串为 "cdzdc". v挑战 O(n2) 时间复杂度的算法是可以接受的,如果你能用 O(n) 的算法那自然更好.

java算法-java求教,算法竞赛入门经典 3.4 最长回文子串

问题描述 java求教,算法竞赛入门经典 3.4 最长回文子串 java新手求教,关键是怎么保存s[i]在buf中的位置,谢谢 解决方案 string longestPalindromeDP(string s) { int n = s.length(); int longestBegin = 0; int maxLen = 1; bool table[1000][1000] = {false}; for (int i = 0; i < n; i++) { table[i][i] = true;

java算法-Longest Palindromic Substring 最长回文子串问题?JAVA

问题描述 Longest Palindromic Substring 最长回文子串问题?JAVA public class Solution { public String longestPalindrome(String s) { String ret = ""; for (int i = 0; i < s.length(); i++) { for (int j = 0; i - j >= 0 && i + j < s.length(); j++)

Longest Palindromic Substring:最长回文子串

题目链接 Given a string S, find the longest palindromic substring in S. You may assume that the maximum length of S is 1000, and there exists one unique longest palindromic substring. 求字符串的最长回文子串 算法1:暴力解法,枚举所有子串,对每个子串判断是否为回文,复杂度为O(n^3) 算法2:删除暴力解法中有很多重复的判

最长公共子序列|最长公共子串|最长重复子串|最长不重复子串|最长回文子串|最长递增子序列|最大子数组和

参考:http://www.ahathinking.com/archives/124.html 最长公共子序列 1.动态规划解决过程 1)描述一个最长公共子序列 如果序列比较短,可以采用蛮力法枚举出X的所有子序列,然后检查是否是Y的子序列,并记录所发现的最长子序列.如果序列比较长,这种方法需要指数级时间,不切实际. LCS的最优子结构定理:设X={x1,x2,--,xm}和Y={y1,y2,--,yn}为两个序列,并设Z={z1.z2.--,zk}为X和Y的任意一个LCS,则:       (1

九度题目1528:最长回文子串

题目1528:最长回文子串 时间限制:1 秒 内存限制:128 兆 特殊判题:否 提交:781 解决:239 题目描述: 回文串就是一个正读和反读都一样的字符串,比如"level"或者"noon"等等就是回文串. 回文子串,顾名思义,即字符串中满足回文性质的子串. 给出一个只由小写英文字符a,b,c...x,y,z组成的字符串,请输出其中最长的回文子串的长度. 输入: 输入包含多个测试用例,每组测试用例输入一行由小写英文字符a,b,c...x,y,z组成的字符串,字

算法:uva 11404 Palindromic Subsequence(LCS回文串,最小字典序)

题目大意 给一个字符串,输出它的最长回文串,如果有多个结果,输出字典序最小的. 思 路 我们都知道把一个字符串逆序后和原字符串进最长公共子序列,可以计算出它的最长回文串长度. 但是这题不仅要输出回文串,而且还要求是字典序最小的,所以挺难搞的. 设str1是正序字符串, str2是逆序后的字符串 f[i][j].len 表示str1的前i位,str2的前j位,最长公共子串的长度 f[i] [j].str 表示str1的前i位,str2的前j位,最长公共子串的最小字典序的字符串 状态转移和正常的LC

NYOJ 132(最长回文子串)

#include<stdio.h> #include<string.h> #include<ctype.h> #define MAXN 5001 char buf[MAXN],s[MAXN]; int p[MAXN]; int main() { int T,i,j;int len,m,max,x,y; scanf("%d%*c",&T); while(T--) { //fgets(buf,sizeof(buf),stdin); scanf(&