CareerCup之1.3字符串去重

【题目】

原文:

1.3 Design an algorithm and write code to remove the duplicate characters in a string without using any additional buffer. NOTE: One or two additional variables are fine. An

extra copy of the array is not.

FOLLOW UP

Write the test cases for this method.

译文:

设计算法并写出代码移除字符串中重复的字符,不能使用额外的缓存空间。注意: 可以使用额外的一个或两个变量,但不允许额外再开一个数组拷贝。

【分析】

这道题目其实是要你就地(in place)将字符串中重复字符移除。你可以向面试官问清楚, 不能使用额外的一份数组拷贝是指根本就不允许开一个数组,还是说可以开一个固定大小, 与问题规模(即字符串长度)无关的数组。

根据面试官的回答,制定相应的解题策略。

【思路一】

如果根本就不允许你再开一个数组,只能用额外的一到两个变量。那么,最先想到的方法就是暴力求解法了。

你可以依次访问这个数组的每个元素,每访问一个,就将该元素与前面的元素进行比较,如果相同就去掉,如果不相同就添加到前面序列中。

时间复杂度为O(n^2)

相应代码为代码一

【思路二】

如果根本就不允许你再开一个数组,只能用额外的一到两个变量。第二种方法就是先排序,再去重。

排序之后重复元素必定是相邻的,这样去重就简单多了。

排序时间复杂度最快为快速排序为O(nlogn)

去重时间复杂度为O(n)

最终为O(nlogn)

相应代码为代码二

【思路三】

1 如果可以开一个固定大小,与问题规模(即字符串长度)无关的数组,那么可以用一个数组来 表征每个字符的出现(假设是ASCII字符,则数组大小为256),这样的话只需要遍历一遍字符 串即可,时间复杂度O(n)。

相应代码为代码三

2 如果字符集更小一些,比如只是a-z,即字符串里只包含小写字母,那么使用一个int变量中 的每一位来表征每个字符的出现,用位运算来实现。也可以在O(n)的时间里移除重复字符,而且还不需要额 外开一个数组。

相应代码为代码四

【代码一】

/*********************************
*   日期:2014-5-6
*   作者:SJF0115
*   题目: 字符串中字符去重
*   来源:CareerCup
**********************************/
#include <iostream>
#include <algorithm>
#include <string.h>
using namespace std;

//删除一个字符串中重复字符
void RemoveDuplicates(char str[]){
    int i,j;
    if(str == NULL){
        return;
    }
    int len = strlen(str);
    //去重
    int index = 0;
    for(i = 0;i < len;i++){
        //str[i]为待考察的元素 与前面元素比较看是否重复
        for(j = 0;j < i;j++){
            //有重复的元素
            if(str[i] == str[j]){
                break;
            }
        }
        //str[i] 前面没有与之重复的元素
        if(j >= i){
            str[index++] = str[i];
        }
    }
    str[index] = '\0';
}

int main() {
    char str[] = "abababa";
    RemoveDuplicates(str);
    cout<<str<<endl;
    return 0;
}

【代码二】

//删除一个字符串中重复字符
void RemoveDuplicates(char str[]){
    if(str == NULL){
        return;
    }
    int len = strlen(str);
    //排序
    sort(str,str+len);
    int index = 1;
    //去重
    for(int i = 1;i < len;i++){
        if(str[i] != str[i-1]){
            str[index++] = str[i];
        }
    }
    str[index] = '\0';
}

【代码三】

//删除一个字符串中重复字符
void RemoveDuplicates(char str[]){
    bool vis[256];
    //初始化
    memset(vis,false,sizeof(vis));
    int len = strlen(str);
    int index = 0;
    for(int i = 0;i < len;i++){
        if(!vis[str[i]]){
            str[index++] = str[i];
            vis[str[i]] = true;
        }
    }
    str[index] = '\0';
}

【代码四】

void RemoveDuplicates(char str[]){
    int len = strlen(str);
    if(len < 2) return;
    int check = 0;
    int index = 0;
    //去重
    for(int i=0; i<len; ++i){
        int v = (int)(str[i]-'a');
        if((check & (1<<v))==0){
            str[index++] = str[i];
            check |= (1<<v);
        }
    }
    str[index] = '\0';
}
时间: 2024-10-30 03:35:11

CareerCup之1.3字符串去重的相关文章

Java 8新特性:字符串去重

本文首发与InfoQ. 8月19日,Oracle发布了JDK 8u20,JDK 8u20包含很多新特性,比如Java编译器更新.支持在运行时通过API来修改MinHeapFreeRatio和MaxHeapFreeRatio参数.新的GC调优指南文档.不过在众多新特性中,最令人期待的还属字符串去重(String Deduplication ).如何减少内存占用一直是一个永恒的话题,而在Java应用中,经常会看到String对象会占用应用30%的内存,它是Java中最常用的对象之一.新的字符串去重特

关于java字符串去重的问题

问题描述 关于java字符串去重的问题 今天碰到个java字符串去重的问题,尝试着用另一种方法TreeSet去做一下,出来的结果确实去重了,但是会按abcd的顺序排列,而不是给定的字符串顺序.问一下怎么纠正? public void Method_2(String str) { // 原始输入 System.out.println("原始的字符串:" + str); long startTime = System.nanoTime(); // 将输入转为字符串数组 String[] a

Java8新特性之字符串去重介绍_java

8月19日,Oracle发布了JDK 8u20,JDK 8u20包含很多新特性,比如Java编译器更新.支持在运行时通过API来修改MinHeapFreeRatio和MaxHeapFreeRatio参数.新的GC调优指南文档.不过在众多新特性中,最令人期待的还属字符串去重(String Deduplication ).如何减少内存占用一直是一个永恒的话题,而在Java应用中,经常会看到String对象会占用应用30%的内存,它是Java中最常用的对象之一.新的字符串去重特性可以帮助减少应用中St

Java中字符串去重的特性介绍_java

字符串在任何应用中都占用了大量的内存.尤其数包含独立UTF-16字符的char[]数组对JVM内存的消耗贡献最多--因为每个字符占用2位. 内存的30%被字符串消耗其实是很常见的,不仅是因为字符串是与我们互动的最好的格式,而且是由于流行的HTTP API使用了大量的字符串.使用Java 8 Update 20,我们现在可以接触到一个新特性,叫做字符串去重,该特性需要G1垃圾回收器,该垃圾回收器默认是被关闭的. 字符串去重利用了字符串内部实际是char数组,并且是final的特性,所以JVM可以任

CareerCup之1.8 字符串移位包含问题

[题目] 原文: 1.8 Assume you have a method isSubstring which checks if one word is a substring of another. Given two strings, s1 and s2, write code to check if s2 is a rotation of s1 using only one call to isSubstring ( i.e., "waterbottle" is a rotat

CareerCup之1.1字符串中字符判重

[题目] Chapter 1 | Arrays and Strings 原文: 1.1 Implement an algorithm to determine if a string has all unique characters. What if you can not use additional data structures? 译文: 实现一个算法来判断一个字符串中的字符是否唯一(即没有重复).不能使用额外的数据结构. (即只使用基本的数据结构) [分析] [思路一]首先,我们要搞清

js字符串操作总结(必看篇)_javascript技巧

字符方法 <!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <title>字符方法</title> </head> <body> <script type="text/javascript"> /* charAt方法和charCodeAt方法都接收一个参数,基于0的

javascript多行字符串的简单实现方式_javascript技巧

平时一般使用 字符串+,或者[].join('')的方式 同事推荐了这样的形式 ExceptionDivHtml="<div class='gameItems'>\ <div class='kreds_top_L'>\ <span style='padding:0 10px;'><b>Current Balance:</b><font> </font> Credits</span>\ </div

《python 与数据挖掘 》一 2.4 数据结构

本节书摘来自华章出版社<python 与数据挖掘 >一书中的第2章,第2.4节,作者张良均 杨海宏 何子健 杨 征,更多章节内容可以访问"华章计算机"公众号查看. 2.4 数据结构 Python中的绝大部分数据结构可以被最终分解为三种类型:标量(Scaler),序列(Sequence),映射(Mapping).这表明了数据存储时所需的基本单位,其重要性如同欧式几何公理之于欧式空间.在第2.2节中,我们已经详细叙述了"标量",如整数.浮点数等数据类型.这里