求字符串中最长无重复字符的子串

题目:求一个字符串中最长的没有重复字符的子串。

方法一:穷举法,使用2重外循环遍历所有的区间,用2重内循环检验子串是否符合“无重复字符”这一要求。其中外层循环i、j 遍历所有的下标,m、n是内层循环,检查区间[i,j]是否符合要求。空间复杂度是O(1),时间复杂度O(N^4)。

//O(N^4)的时间复杂度
int max_unique_substring1(char * str)
{
    int maxlen = 0;
    int begin = 0;
    int n = strlen(str);
    for(int i=0; i<n; ++i)
        for(int j=1; j<n; ++j)
        {
            int flag = 0;
            for(int m=i; m<=j; ++m)
            {
                for(int n=m+1; n<j; ++n)
                {
                    if(str[n] == str[m])
                    {
                        flag = 1;
                        break;
                    }
                }
                if(flag == 1) break;
            }
            if(flag==0 && j-i+1>maxlen)
            {
                maxlen = j-i+1;
                begin = i;
            }
        }
    printf("%.*s\n", maxlen, &str[begin]);
    return maxlen;
}

方法二:对方法一的检验子串是否“无重复字符”进行改进,使用hash表记录字符是否出现过。

//O(N^2)的时间复杂度
int max_unique_substring2(char * str)
{
    int i,j;
    int begin;
    int maxlen = 0;
    int hash[256];
    int n = strlen(str);
    for(i=0; i<n; ++i)
    {
        memset(hash,0,sizeof(hash));
        hash[str[i]] = 1;
        for(j=i+1; j<n; ++j)
        {
            if(hash[str[j]] == 0)
                hash[str[j]] = 1;
            else
                break;
        }
        if(j-i > maxlen)
        {
            maxlen = j-i;
            begin = i;
        }
    }
    printf("%.*s\n", maxlen, &str[begin]);
    return maxlen;
}

方法三:对字符串“axbdebpqawuva”构造下表:

表中,字符串有3个‘a’,有2个‘b’,其余为单一字符。next[]记录了下一个与之重复的字符的位置,如str[0]=str[8]=str[12]=‘a’,这时next[0]=8,next[8]=12,next[12]=13,其余同理。值得注意的是,对于没有重复字符的,next[]存储字符结束符‘\0’的下标,即13。
这里,first[i]表示i之后,第一次出现重复字符的那个位置。例如,str[0]之后,第一次出现的重复字符是str[5]=‘b’,当然,从str[1],str[2]开始也是一样。而从str[3]开始,要到str[12]才出现重复字符‘a’。可以证明,从str[i]起的最长符合要求的长度为first[i]-i,区间为[i,first[i]-1]由此得解。上述最长串是当i=3时,first[i]-i=12-3=9。结果最长无重复子串为“debpqawuv”。

//O(N)的时间复杂度
int max_unique_substring3(char * str)
{
    int maxlen = 0;
    int begin = 0;
    int n = strlen(str);
    int * next = (int*)malloc(sizeof(int)*n); //next[i]记录了下一个与str[i]重复的字符的位置
    int * first = (int*)malloc(sizeof(int)*(n+1)); //first[i]记录str[i]后面最近的一个重复点
    int hash[256];
    memset(hash,n,sizeof(hash));

    first[n] = n;
    for(int i=n-1; i>=0; i--)
    {
        next[i] = hash[str[i]];
        hash[str[i]] = i;
        if (next[i] < first[i+1])
            first[i] = next[i];
        else
            first[i] = first[i+1]; //生成first[]表,复杂度是O(N)的
    }
    for(int i=0; i<n; i++)
    {
        if (first[i]-i > maxlen)
        {
            maxlen = first[i]-i;
            begin = i;
        }
    }
    free(first);
    free(next);
    printf("%.*s\n", maxlen, &str[begin]);
    return maxlen;
}

另一种实现:visit[]记录每次字符出现的位置,当出现重复字符时,通过两次重复字符的位置得到新的子串的长度,但是,每次只通过重复字符的位置得到新的子串的长度是不对的,还需要考虑上一次子串的开始位置。

//O(N)的时间复杂度
int max_unique_substring3(char * str)
{
    int visit[256];
    memset(visit, -1, sizeof(visit));
    int n = strlen(str);
    int maxlen = 0;
    visit[str[0]] = 0;
    int curlen = 1;
    int last_start = 0;
    int begin;
    for(int i=1; i<n; ++i)
    {
        if(visit[str[i]] == -1)
        {
            ++curlen;
            visit[str[i]] = i; // 记录字符出现的位置
         }
        else
        {
            if(last_start <= visit[str[i]])
            {
                curlen = i - visit[str[i]];
                last_start = visit[str[i]] + 1; //跟新下一次开始的位置
                   visit[str[i]] = i; // 更新最近重复位置
              }
            else
            {
                ++curlen;
            }
        }
        if(curlen > maxlen)
        {
            maxlen = curlen;
            begin = i + 1 - maxlen;
        }
    }
    printf("%.*s\n", maxlen, &str[begin]);
    return maxlen;
}

方法四:使用后缀数组

对这个字符串构造后缀数组,在每个后缀数组中,寻找没有重复字符的最长前缀,最长的前缀就是要找的子串。

//得到字符串最长的无重复的前缀长度
int longestlen(char * p)
{
    int hash[256];
    int len = 0;
    memset(hash,0,sizeof(hash));
    while (*p && !hash[*p])
    {
        hash[*p] = 1;
        ++ len;
        ++ p;
    }
    return len;
}

//使用后缀数组解法
int max_unique_substring4(char * str)
{
    int maxlen = -1;
    int begin = 0;
    char *a[999];
    int n = 0;
    while(*str != '\0')
    {
        a[n++] = str++;
    }
    for (int i=0; i<n; i++)
    {
        int temlen = longestlen(a[i]);
        if (temlen > maxlen)
        {
            maxlen = temlen;
            begin = i;
        }
    }
    printf("%.*s\n", maxlen, a[begin]);
    return maxlen;
}

 

 

作者:阿凡卢

出处:http://www.cnblogs.com/luxiaoxun/

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

http://www.cnblogs.com/luxiaoxun/archive/2012/10/02/2710471.html

时间: 2025-01-02 16:46:42

求字符串中最长无重复字符的子串的相关文章

JavaScript实现找出字符串中第一个不重复的字符_javascript技巧

此算法仅供参考,小菜基本不懂高深的算法,只能用最朴实的思想去表达. //找出字符串中第一个不重复的字符 // firstUniqueChar("vdctdvc"); --> t function firstUniqueChar(str){ var str = str || "", i = 0, k = "", _char = "", charMap = {}, result = {name: "",i

JavaScript实现查找字符串中第一个不重复的字符

  此算法仅供参考,小菜基本不懂高深的算法,只能用最朴实的思想去表达. 代码如下: //找出字符串中第一个不重复的字符 // firstUniqueChar("vdctdvc"); --> t function firstUniqueChar(str){ var str = str || "", i = 0, k = "", _char = "", charMap = {}, result = {name: "

link能不能自动求出一段话中最长的重复的两句话?

问题描述 link能不能自动求出一段话中最长的重复的两句话? link能不能自动求出一段话中最长的重复的两句话? 解决方案 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; namespace ConsoleApplication2 { class Program { static void Main(string[

JavaScript实现查找字符串中第一个不重复的字符_javascript技巧

此算法仅供参考,小菜基本不懂高深的算法,只能用最朴实的思想去表达. 复制代码 代码如下:  //找出字符串中第一个不重复的字符  // firstUniqueChar("vdctdvc"); --> t  function firstUniqueChar(str){    var str = str || "",        i = 0,        k = "",        _char = "",       

JS查找字符串中出现次数最多的字符_javascript技巧

在一个字符串中,如 'zhaochucichuzuiduodezifu',我们要找出出现最多的字符.本文章将详细说明方法思路. 先介绍两个string对象中的两个方法:indexOf()和charAt()方法 indexOf()方法介绍 返回某个指定的字符串值在字符串中首次出现的位置 charAt()方法介绍 返回某个指定位置的字符 先做一个小测试,找到字符串'woainixiaoli'中的每一个'i'出现的位置. <script> var arr = 'woainixiaoli'; var

返回给定字符串中最长连续数字串

/* 不用任何库函数,系统函数, 完成函数 int maxContinuNum(const char* inputstr,char *outputstr); 返回给定字符串中最长连续数字串,让outputstr指向该串,然后值是其长度. 例如sss12345ss1245sfdf123456789返回,9,outputstr指向123456789. */ #include <iostream> using namespace std; int maxContunuNum(const char*

JavaScript实现计算字符串中出现次数最多的字符和出现的次数

 这篇文章主要介绍了JavaScript实现计算字符串中出现次数最多的字符和出现的次数,本文直接给出实现代码,需要的朋友可以参考下     "计算出字符串中出现次数最多的字符是什么,出现了多少次?" 看到这个需求,我想大多数人应该首先想到的是转换成数组,再做处理,当然是可以解决问题的,然后这里提供一个巧妙的算法设计,无需转数组,可以很快解决问题,代码如下:   代码如下: var str = "adadfdfseffserfefsefseeffffftsdg"; v

[华为上机练习题]7.删除字符串中出现次数最少的字符

题目 描述: 实现删除字符串中出现次数最少的字符,若多个字符出现次数一样,则都删除.输出删除这些单词后的字符串,字符串中其它字符保持原来的顺序. 题目类别: 字符串 难度: 中级 运行时间限制: 10Sec 内存限制: 128MByte 阶段: 入职前练习 输入: 字符串只包含小写英文字母, 不考虑非法输入,输入的字符串长度小于等于20个字节. 输出: 删除字符串中出现次数最少的字符后的字符串. 样例输入: abcdd 样例输出: dd 代码 /*------------------------

字符串中最长并至少出现2次的子串

问题描述 字符串中最长并至少出现2次的子串 作为依依的好朋友,技术男沛沛在依依生日时送给他一个超长字符串 S .沛沛要依依在其中找出一个最长的字符串 T ,使得 T 在 S 中至少出现了两次,而他想说的秘密就藏在 T 中.由于字符串实在是太长了,依依总是找不到合适的 T .于是依依请你帮他找到这个 T 的长度. [输入格式]一行.一个字符串,即题目中说的S . [输出格式]一行.一个整数,表示最长的 T 的长度. [样例输入]ababa [样例输出]3 「数据范围」对于 30% 的数据,S长度