稳定婚姻问题和Gale-Shapley算法(转)

 什么是算法?每当有人问作者这样的问题时,他总会引用这个例子:假如你是一个媒人,有若干个单身男子登门求助,还有同样多的单身女子也前来征婚。如果你已经知道这些女孩儿在每个男孩儿心目中的排名,以及男孩儿们在每个女孩儿心中的排名,你应该怎样为他们牵线配对呢?

  最好的配对方案当然是,每个人的另一半正好都是自己的“第一选择”。这虽然很完美,但绝大多数情况下都不可能实现。比方说,男1号最喜欢的是女1号,而女1号的最爱不是男1号,这两个人的最佳选择就不可能被同时满足。如果好几个男孩儿最喜欢的都是同一个女孩儿,这几个男孩儿的首选也不会同时得到满足。当这种最为理想的配对方案无法实现时,怎样的配对方案才能令人满意呢?

  其实,找的对象太完美不见得是好事儿,和谐才是婚姻的关键。如果男1号和女1号各有各的对象,但男1号觉得,比起自己现在的,女1号更好一些;女1号也发现,在自己心目中,男1号的排名比现男友更靠前。这样一来,这两人就可能抛弃各自现在的对象——如果出现了这种情况,我们就说婚姻搭配是不稳定的。作为一个红娘,你深知,对象介绍得不好没关系,就怕婚姻关系不稳定。给客户牵线配对时,虽然不能让每个人都得到最满意的,但搭配必须得稳定。换句话说,对于每一个人,在他心目中比他当前伴侣更好的异性,都不会认为他也是一个更好的选择。现在,我们的问题是:稳定的婚姻搭配总是存在吗?应该怎样寻找?

  一次失败的尝试

  为了便于分析,我们下面做一些约定。我们用字母A、B、C对男性进行编号,用数字1、2、3对女性进行编号。我们把所有男性从上到下列在左侧,括号里的数字表示每个人心目中对所有女性的排名;再把所有女性列在右侧,用括号里的字母表示她们对男性的偏好。图1所示的就是2男2女的一种情形,每个男的都更喜欢女1号,但女1号更喜欢男B,女2号更喜欢男A。若按A-1、B-2进行搭配,则男B和女1都更喜欢对方一些,这样的婚姻搭配就是不稳定的。但若换一种搭配方案(如图2),这样的搭配就是稳定的了。

图1 一个不稳定的婚姻搭配图

  可能很多人会立即想到一种寻找稳定婚姻搭配的策略:不断修补当前搭配方案。如果两个人互相都觉得对方比自己当前的伴侣更好,就让这两个人成为一对,剩下被甩的那两个人组成一对。

图2 一个稳定的婚姻搭配

  如果还有想要私奔的男女对,就继续按照他们的愿望对换情侣,直到最终消除所有的不稳定组合。容易看出,应用这种“修补策略”所得到的最终结果一定满足稳定性,但这种策略的问题在于,它不一定存在“最终结果”。事实上,按照上述方法反复调整搭配方案,最终可能会陷入一个死循环,因此该策略甚至不能保证得出一个确定的方案来,如图3所示。

图3 应用“修补策略”可能会产生死循环

  Gale-Shapley算法

  1962年,美国数学家David Gale和Lloyd Shapley发明了一种寻找稳定婚姻的策略。不管男女各有多少人,也不管他们的偏好如何,应用这种策略后总能得到一个稳定的搭配。换句话说,他们证明了稳定的婚姻搭配总是存在的。有趣的是,这种策略反映了现实生活中的很多真实情况。

  在这种策略中,男孩儿将一轮一轮地去追求他中意的女子,女子可以选择接受或者拒绝他的追求者。第一轮,每个男孩儿都选择自己名单上排在首位的女孩儿,并向她表白。此时,一个女孩儿可能面对的情况有三种:没有人跟她表白,只有一个人跟她表白,有不止一个人跟她表白。在第一种情况下,这个女孩儿什么都不用做,只需要继续等待;在第二种情况下,接受那个人的表白,答应暂时和他做情侣;在第三种情况下,从所有追求者中选择自己最中意的那一位,答应和他暂时做情侣,并拒绝所有其他追求者。

  第一轮结束后,有些男孩儿已经有女朋友了,有些男孩儿仍然是单身。在第二轮追女行动中,每个单身男孩儿都从所有还没拒绝过他的女孩儿中选出自己最中意的那一个,并向她表白,不管她现在是否是单身。和第一轮一样,女孩儿们需要从表白者中选择最中意的一位,拒绝其他追求者。注意,如果这个女孩儿已经有男朋友了,当她遇到了更好的追求者时,她必须拒绝掉现在的男友,投向新的追求者的怀抱。这样,一些单身男孩儿将会得到女友,那些已经有了女友的人也可能重新变成光棍。在以后的每一轮中,单身男孩儿继续追求列表中的下一个女孩儿,女孩儿则从包括现男友在内的所有追求者中选择最好的一个,并对其他人说不。这样一轮一轮地进行下去,直到某个时候所有人都不再单身,下一轮将不会有任何新的表白发生,整个过程自动结束。此时的婚姻搭配就一定是稳定的了。

  这个策略会不会像之前的修补法一样,出现永远也无法终止的情况呢?不会。下面我们将说明,随着轮数的增加,总有一个时候所有人都能配对。由于在每一轮中,至少会有一个男孩儿向某个女孩儿告白,因此总的告白次数将随着轮数的增加而增加。倘若整个流程一直没有因所有人都配上对了而结束,最终必然会出现某个男孩儿追遍了所有女孩儿的情况。而一个女孩儿只要被人追过一次,以后就不可能再单身了。既然所有女孩儿都被这个男孩儿追过,就说明所有女孩儿现在都不是单身,也就是说此时所有人都已配对。

图4 应用上述策略,三轮之后将得出稳定的婚姻搭配

  接下来,我们还需要证明,这样得出的配对方案确实是稳定的。首先注意到,随着轮数的增加,一个男孩儿追求的对象总是越来越糟,而一个女孩儿的男友只可能变得越来越好。假设男A和女1各自有各自的对象,但比起现在的对象,男A更喜欢女1。因此,男A之前肯定已经跟女1表白过。既然女1最后没有跟男A在一起,说明女1拒绝了男A,也就是说她有了比男A更好的男孩儿。这就证明了,两个人虽然不是一对,但都觉得对方比自己现在的伴侣好,这样的情况绝不可能发生。

  我们把用来解决某种问题的一个策略,或者说一个方案,或者说一个处理过程,或者说一系列操作规则,或者更贴切地说,一套计算方法,叫做“算法”。上面这个用来寻找稳定婚姻的策略就叫做“Gale-Shapley算法”,有些人也管它叫“延迟认可算法”。

  Gale-Shapley算法的意义和应用

  每个算法都有它的实际意义,能给我们带来很多启发。Gale-Shapley算法最大的意义就在于,作为一个为这些男女牵线的媒人,你并不需要亲自计算稳定婚姻匹配,甚至根本不需要了解每个人的偏好,只需要按照这个算法组织一个男女配对活动就可以了。你需要做的仅仅是把算法流程当作游戏规则告诉大家,游戏结束后会自动得到一个大家都满意的婚姻匹配。整个算法可以简单地描述为:每个人都去做自己想做的事情。对于男性来说,从最喜欢的女孩儿开始追起是顺理成章的事;对于女性来说,不断选择最好的男孩儿也正好符合她的利益。因此,大家会自动遵守游戏规则,不用担心有人虚报自己的偏好。

  历史上,这样的“配对游戏”还真有过实际应用,并且更有意思的是,这个算法的应用居然比算法本身的提出还早10年。早在1952年,美国就开始用这种办法给医学院的学生安排工作,这被称之为“全国住院医师配对项目”。配对的基本流程就是,各医院从尚未拒绝这一职位的医学院学生中选出最佳人选并发送聘用通知,当学生收到来自各医院的聘用通知后,系统会根据他所填写的意愿表自动将其分配到意愿最高的职位,并拒绝掉其他的职位。如此反复,直到每个学生都分配到了工作。那时人们并不知道这样的流程可以保证工作分配的稳定性,只是凭直觉认为这是很合理的。直到10年之后,Gale和Shapley才系统地研究了这个流程,提出了稳定婚姻问题,并证明了这个算法的正确性。

  这个算法还有很多有趣的性质。比如说,大家可能会想,这种男追女女拒男的方案对男性更有利还是对女性更有利呢?答案是,这种方案对男性更有利。事实上,稳定婚姻搭配往往不止一种,然而上述算法的结果可以保证,每一位男性得到的伴侣都是所有可能的稳定婚姻搭配方案中最理想的,同时每一位女性得到的伴侣都是所有可能的稳定婚姻搭配方案中最差的。受篇幅限制,我们略去证明的过程。

  这个算法会有一些潜在的问题。刚才我们已经说了,对于每位女性来说,得到的结果都是所有可能的稳定搭配中最差的一种。此时,倘若有某位女性知道所有其他人的偏好列表,经过精心计算,她有可能发现,故意拒绝掉本不该拒绝的人(暂时保留一个较差的人在身边),或许有机会等来更好的结果。因而,在实际生活中应用这种算法,不得不考虑一些可能的欺诈与博弈。

  这个算法还有一些局限。例如,它无法处理2n个人不分男女的稳定搭配问题。一个简单的应用场景便是宿舍分配问题:假设每个宿舍住两个人,已知2n个学生中每一个学生对其余2n-1个学生的偏好评价,如何寻找一个稳定的宿舍分配?此时,Gale-Shapley算法就不再有用武之地了。而事实上,宿舍分配问题中很可能根本就不存在稳定的搭配。例如,有A、B、C、D四个人,其中A把B排在第一,B把C排在第一,C把A排在第一,而且他们三人都把D排在最后。容易看出,此时一定不存在稳定的宿舍分配方案。倘若A、D同宿舍,B、C同宿舍,那么C会认为A是更好的室友(因为C把A排在了第一),同时A会认为C是更好的室友(因为他把D排在了最后)。同理,B、D同宿舍或者C、D同宿舍也都是不行的,因而稳定的宿舍分配是不存在的。此时,重新定义宿舍分配的优劣性便是一个更为基本的问题。

  稳定婚姻问题还有很多其他的变种,有些问题甚至是NP完全问题,至今仍然没有(也不大可能有)一种有效的算法。在图论、算法和博弈论中,这都是非常有趣的话题。

http://kb.cnblogs.com/page/511691/

 

时间: 2024-07-29 09:50:53

稳定婚姻问题和Gale-Shapley算法(转)的相关文章

七夕,诺奖得主用算法教你如何脱单

七夕来袭,又到了情侣们大秀恩爱,单身狗们咬牙切齿的季节.本着人道主义关怀,先给大家唱一曲单身狗之歌-- 雌雄双兔傍地走,你还是条单身狗: 两个黄鹂鸣翠柳,你还是条单身狗: 路见不平一声吼,你还是条单身狗: 问君能有几多愁,你还是条单身狗. 听完是不是很想组个复仇者联盟,早上去卖花,晚上去卖套,凌晨去卖药? 还是你认为社会资源就这么多,拆散一对是一对,于是整晚都在大街上溜达,看哪一对不顺眼就冲上去扇姑娘一巴掌然后问她"不是说你爱我吗?" 还是你打算宅在家里重播非诚勿扰,幻想自己站在台上和

《趣题学算法》目录—导读

版权 趣题学算法 • 著 徐子珊 责任编辑 张 涛 • 人民邮电出版社出版发行 北京市丰台区成寿寺路11号 邮编 100164 电子邮件 315@ptpress.com.cn 网址 http://www.ptpress.com.cn • 读者服务热线:(010)81055410 反盗版热线:(010)81055315 内容提要 趣题学算法 本书共分10章.第0章讲解了算法的概念及体例说明.第1-7章分别就计数问题.信息查找问题.组合优化问题.图中搜索问题和数论问题展开,讨论了算法的构思和设计,详

改进企业网站优化方式 追随百度新算法

随着互联网的卓越发展,百度的算法更新的越来越频繁,企业网站做优化竞争越来越大,难度也更是逐渐的增大.在站长想法中企业站可能只需要更新内容,随便做做外链,关键词排名并可稳定不变,但在百度算法更新后,企业站大多数被K的云消烟散,企业站即使关键词竞争小,但是也要改变企业站优化方式,要及时的追随着百度的新算法.小编用实例给大家分享下. 第一:关键词密度布局.企业网站大多数是有一个主关键词,2-3个次关键词,对于主关键词需要在网站首页.title.友情链接.描述中进行布局.布局的方法如下,首页:公司简介版

百度新算法是否有意打击SEO行业

不知道为何在百度新算法的影响下,一批个人SEO博客和SEO论坛惨遭降权和K站,于是很多人猜测:百度是否在有意打击SEO行业,说实话一开始石头也是这个想法.因为笔者自己的个人博客也莫名其妙的被降权了,几个关键词一直以来都是在第一页,几个月以来还算比较稳定.但是这次百度新算法更新后,排名一夜回到了解放前,不仅如此今天刚刚认真看了几个SEO论坛,发现也难逃噩运.首先可以肯定的是新算法中对重点行业站的打击力度是不同的,例如:医疗行业.企业站.个人SEO博客等等.先不要盲目的过于武断,看下数据: 图一:个

深入排序算法的多语言实现

 1 排序的基本概念 排序: 所谓排序,就是要整理文件中的记录,使之按关键字递增(或递减)次序排列起来.其确切定义如下: 输入:n个记录R1,R2,-,Rn,其相应的关键字分别为K1,K2,-,Kn. 输出:Ril,Ri2,-,Rin,使得Ki1≤Ki2≤-≤Kin.(或Ki1≥Ki2≥-≥Kin). 排序的稳定性:当待排序记录的关键字均不相同时,排序结果是惟一的,否则排序结果不唯一.在待排序的文件中,若存在多个关键字相同的记录,经过排序后这些具有相同关键字的记录之间的相对次序保持不变,该排序方

各种排序算法的分析及java实现

排序一直以来都是让我很头疼的事,以前上<数据结构>打酱油去了,整个学期下来才勉强能写出个冒泡排序.由于下半年要准备工作了,也知道排序算法的重要性(据说是面试必问的知识点),所以又花了点时间重新研究了一下. 排序大的分类可以分为两种:内排序和外排序.在排序过程中,全部记录存放在内存,则称为内排序,如果排序过程中需要使用外存,则称为外排序.下面讲的排序都是属于内排序. 内排序有可以分为以下几类: (1).插入排序:直接插入排序.二分法插入排序.希尔排序. (2).选择排序:简单选择排序.堆排序.

八大排序算法的Python实现

本文主要介绍了常见的8大排序算法基本概念以及其Python实现方式,如果你是Java程序员,也可以看看之前我们介绍的Java程序员必须掌握的8大排序算法. 1.插入排序 描述 插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得到一个新的.个数加一的有序数据,算法适用于少量数据的排序,时间复杂度为 O(n^2).是稳定的排序方法.插入算法把要排序的数组分成两部分:第一部分包含了这个数组的所有元素,但将最后一个元素除外(让数组多一个空间才有插 入的位置),而第二部分就只包含这一个元

javascript:算法笔记

入门级算法-线性查找-时间复杂度O(n)--相当于算法界中的HelloWorld //线性搜索(入门HelloWorld) //A为数组,x为要搜索的值 function linearSearch(A, x) { for (var i = 0; i < A.length; i++) { if (A[i] == x) { return i; } } return -1; }  二分查找(又称折半查找) - 适用于已排好序的线性结构 - 时间复杂度O(logN) //二分搜索 //A为已按"升

Java主宰全球的10大算法

在开放性论坛Reddit.com上有篇帖子介绍了算法对我们现在生活的重要性,以及哪些算法对现代文明所做贡献最大.如果对算法有所了解,读这篇文章时你可能会问"作者知道算法为何物吗?",或是"Facebook的'信息流'(News Feed)算是一种算法吗?",如果"信息流"是算法,那就可以把所有事物都归结为一种算法.才疏学浅,结合那篇帖子,接下来我试着解释一下算法是什么,又是哪10个算法正在主导我们的世界. 什么是算法? 简而言之,任何定义明确的计