[LeetCode] Minimum Genetic Mutation 最小基因变化

A gene string can be represented by an 8-character long string, with choices from "A", "C", "G", "T".

Suppose we need to investigate about a mutation (mutation from "start" to "end"), where ONE mutation is defined as ONE single character changed in the gene string.

For example, "AACCGGTT" -> "AACCGGTA" is 1 mutation.

Also, there is a given gene "bank", which records all the valid gene mutations. A gene must be in the bank to make it a valid gene string.

Now, given 3 things - start, end, bank, your task is to determine what is the minimum number of mutations needed to mutate from "start" to "end". If there is no such a mutation, return -1.

Note:

  1. Starting point is assumed to be valid, so it might not be included in the bank.
  2. If multiple mutations are needed, all mutations during in the sequence must be valid.
  3. You may assume start and end string is not the same. 

Example 1:

start: "AACCGGTT"
end:   "AACCGGTA"
bank: ["AACCGGTA"]
return: 1

Example 2:

start: "AACCGGTT"
end:   "AAACGGTA"
bank: ["AACCGGTA", "AACCGCTA", "AAACGGTA"]
return: 2

Example 3:

start: "AAAAACCC"
end:   "AACCCCCC"
bank: ["AAAACCCC", "AAACCCCC", "AACCCCCC"]
return: 3

这道题跟之前的Word Ladder完全是一道题啊,换个故事就直接来啊,越来不走心了啊。不过博主做的时候并没有想起来是之前一样的题,而是先按照脑海里第一个浮现出的思路做的,发现也通过OJ了。博主使用的一种BFS的搜索,先建立bank数组的距离场,这里距离就是两个字符串之间不同字符的个数。然后以start字符串为起点,向周围距离为1的点扩散,采用BFS搜索,每扩散一层,level自加1,当扩散到end字符串时,返回当前level即可。注意我们要把start字符串也加入bank中,而且此时我们也知道start的坐标位置,bank的最后一个位置,然后在简历距离场的时候,调用一个count子函数,用来统计输入的两个字符串之间不同字符的个数,注意dist[i][j]和dist[j][i]是相同,所以我们只用算一次就行了。然后我们进行BFS搜索,用一个visited集合来保存遍历过的字符串,注意检测距离的时候,dist[i][j]和dist[j][i]只要有一个是1,就可以了,参见代码如下:

解法一:

class Solution {

public:
    int minMutation(string start, string end, vector<string>& bank) {
        if (bank.empty()) return -1;
        bank.push_back(start);
        int res = 0, n = bank.size();
        queue<int> q{{n - 1}};
        vector<vector<int>> dist(n, vector<int>(n, 0));
        for (int i = 0; i < n; ++i) {
            for (int j = i + 1; j < n; ++j) {
                dist[i][j] = count(bank[i], bank[j]);
            }
        }
        unordered_set<int> visited;
        while (!q.empty()) {
            int len = q.size();
            ++res;
            for (int i = 0; i < len; ++i) {
                int t = q.front(); q.pop();
                visited.insert(t);
                for (int j = 0; j < n; ++j) {
                    if ((dist[t][j] != 1 && dist[j][t] != 1) || visited.count(j)) continue;
                    if (bank[j] == end) return res;
                    q.push(j);
                }
            }
        }
        return -1;
    }
    int count(string word1, string word2) {
        int cnt = 0, n = word1.size();
        for (int i = 0; i < n; ++i) {
            if (word1[i] != word2[i]) ++cnt;
        }
        return cnt;
    }
};

下面这种解法跟之前的那道Word Ladder是一样的,也是用的BFS搜索。跟上面的解法不同之处在于,对于遍历到的字符串,我们不再有距离场,而是对于每个字符,我们都尝试将其换为一个新的字符,每次只换一个,这样会得到一个新的字符串,如果这个字符串在bank中存在,说明这样变换是合法的,加入visited集合和queue中等待下一次遍历,记得在下次置换字符的时候要将之前的还原。我们在queue中取字符串出来遍历的时候,先检测其是否和end相等,相等的话返回level,参见代码如下:

解法二:

class Solution {

public:
    int minMutation(string start, string end, vector<string>& bank) {
        if (bank.empty()) return -1;
        vector<char> gens{'A','C','G','T'};
        unordered_set<string> s{bank.begin(), bank.end()};
        unordered_set<string> visited;
        queue<string> q{{start}};
        int level = 0;
        while (!q.empty()) {
            int len = q.size();
            for (int i = 0; i < len; ++i) {
                string t = q.front(); q.pop();
                if (t == end) return level;
                for (int j = 0; j < t.size(); ++j) {
                    char old = t[j];
                    for (char c : gens) {
                        t[j] = c;
                        if (s.count(t) && !visited.count(t)) {
                            visited.insert(t);
                            q.push(t);
                        }
                    }
                    t[j] = old;
                }
            }
            ++level;
        }
        return -1;
    }
};

博主一直想找种递归的解法,于是在论坛上找到了这个帖子,是Java版的递归写法,博主将其改写成C++版本,但是无法通过OJ,百思不得其解啊,明明一模一样啊,连变量名都起的一样,为啥Java版的就是对的,博主的这个改写版就不对呢,各位看官大神们帮忙解答一下呀~

// Why this not passing OJ ? Exactly the same as this Java version: https://discuss.leetcode.com/topic/101351/dfs-java

class Solution {
public:
    int minMutation(string start, string end, vector<string>& bank) {
        vector<bool> explored(bank.size(), false);
        if (bank.empty()) return -1;
        return minMutation(explored, start, end,  bank);
    }
    bool minMutation(vector<bool>& explored , string start, string end, vector<string>& bank) {
        if (start == end) return 0;
        int step = bank.size() + 1;
        for (int i = 0; i < bank.size(); ++i) {
            if (diffOne(start, bank[i]) && explored[i]) {
                explored[i] = true;
                int temp = minMutation(explored, bank[i], end, bank);
                if (temp != -1) {
                    step = min(step, temp);
                }
                explored[i] = false;
            }
        }
        return step == bank.size() + 1 ? -1 : 1 + step;
    }
    bool diffOne(string& s1, string& s2) {
        int count = 0;
        for (int i = 0; i < s1.size(); ++i) {
            if (s1[i] != s2[i]) ++count;
            if (count >= 2) return false;
        }
        return count == 1;
    }
};

参考资料:

https://discuss.leetcode.com/topic/101351/dfs-java

https://discuss.leetcode.com/topic/65780/java-solution-using-bfs

本文转自博客园Grandyang的博客,原文链接:[LeetCode] Minimum Genetic Mutation 最小基因变化

,如需转载请自行联系原博主。

时间: 2024-07-30 09:00:40

[LeetCode] Minimum Genetic Mutation 最小基因变化的相关文章

[LeetCode] Minimum ASCII Delete Sum for Two Strings 两个字符串的最小ASCII删除和

Given two strings s1, s2, find the lowest ASCII sum of deleted characters to make two strings equal. Example 1: Input: s1 = "sea", s2 = "eat" Output: 231 Explanation: Deleting "s" from "sea" adds the ASCII value of

LeetCode All in One 题目讲解汇总(持续更新中...)

终于将LeetCode的免费题刷完了,真是漫长的第一遍啊,估计很多题都忘的差不多了,这次开个题目汇总贴,并附上每道题目的解题连接,方便之后查阅吧~ 如果各位看官们,大神们发现了任何错误,或是代码无法通过OJ,或是有更好的解法,或是有任何疑问,意见和建议的话,请一定要在对应的帖子下面评论区留言告知博主啊,多谢多谢,祝大家刷得愉快,刷得精彩,刷出美好未来- 博主制作了一款iOS的应用"Leetcode Meet Me",里面有Leetcode上所有的题目,并且贴上了博主的解法,随时随地都能

大数据解码人类基因,精准医疗不再遥远!

很多人都思考过这样一个问题:假如生命只剩下三天,应该怎样去过? 从生命价值角度考虑,这只是一种"假设";但从生命本身来看,我们之所以这样假设,是因为人类对自己的生命充满了未知,谁都无法预测自己的生.老.病.死.而在信息技术推动下,人类基因其实可以告诉我们很多关乎生命的秘密. 从生命诞生的那天开始,每个人都有自己的基因,如果我们对这些潜在的基因数据进行分析,就能够精准的诊断出病源,比如:有人是癌症潜在患者,还有人是心.脑血管疾病易发人群--需要明确的是,知道这个结果并不重要,重要的是我们

日本科学家造超级病毒 基因变异人类无法防御

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;      据外国媒体报道,日本东京大学兼美国威斯康星州麦迪逊大学教授河冈义裕,为了分析H1N1流感病毒的基因变化,将这种超级病毒改造成能够绕过人类免疫系统的新 变种.报道称,一旦这种致命病毒"逃出"实验室,人类将 毫无抵抗力,恐酿成大灾难. 据称,河冈义裕是日本东京大学兼美国威斯康星州麦迪逊大学教授,为了分析2009年导致流感暴发的H1N1型病毒

科学家发现导致皮肤老化基因及8大主因

据英国<每日邮报>报道,科学家近日宣布发现了和皮肤老化有关的基因,这一发现或许让青春容颜永驻的梦想实现又近了一步. 科学家们通过人类基因组计划获得的数据,发现了1500个和皮肤老化有关的基因.研究人员同时找到了导致皮肤老化的8大主因. 贾伊-提斯曼领导的科研小组在人类已知的2万到2万5千个基因中,找到了大约1500个同皮肤老化有关的基因.贾伊-提斯曼说:"人类基因组计划使得我们能够通过研究人类变老时的数百个基因变化,来研究人类变老的秘密."他表示,人类的皮肤老化有八种不同的

linux常用命令加实例大全

目  录引言    1一.安装和登录    2(一)    login    2(二)    shutdown    2(三)    halt    3(四)    reboot    3(五)    install    4(六)    mount    4(七)    umount    6(八)    chsh    6(九)    exit    7(十)    last    7(十一)    动手练习    7二.文件处理    9(一)    file    9(二)    mkd

计算机专业常用英语

计算机专业常用英语 1.  file    n. 文件:v. 保存文件 2.  command    n. 命令,指令 3.  use    v. 使用,用途 4.  program    n. 程序 5.  line    n. (数据,程序)行,线路 6.  if    conj. 如果 7.  display    vt. 显示,显示器 8.  set    v. 设置,n. 集合 9.  key    n. 键,关键字,关键码 10.  list    n. 列表,显示,v. 打印 11

常见插值方法介绍

"Inverse Distance to a Power(反距离加权插值法)". "Kriging(克里金插值法)". "Minimum Curvature(最小曲率)". "Modified Shepard's Method(改进谢别德法)". "Natural Neighbor(自然邻点插值法)". "Nearest Neighbor(最近邻点插值法)". "Polynom

癌症研究中大数据能做的5件事

1.帮助指导使用已通过的癌症药物 虽然临床试验为医生们提供了许多药物如何发挥作用的有用信息,但是大概只有2%的癌症患者参与了临床试验. 事实上,每天都有成千上万的患者接受诊断和治疗.这意味着其实我们可以从中获得大量的重要数据,来帮助医生与病人在面对不同治疗方案及其可能的结果时做出更好的选择. 美国临床肿瘤学会ASCO发起建立一个数据库:CancerLinQ,旨在获取这些数据.它能将数据提供给医生们, 为他们提供实时的治疗建议.美国基因泰克公司(Genentech)的科学家和医生们都对能帮助ASC