2.7部分有向无圈图模型
前面已经在有向图的框架下建立了贝叶斯网络模型,在无向图的框架下建立了马尔可夫网络模型。本节将在部分有向图的框架下建立链图模型。链图其实就是部分有向无圈图PDAG,它的特点是能够被分解为一些不相交的有序链分支G1,G2,…,GL。每个链分支Gi都是无向子图,其中任意两个节点之间的边一定是无向的。连接两个不同链分支Gi和Gj(i≠j)的边一定是有向的。
像贝叶斯网络和马尔可夫网络一样,链图的结构也可以用来定义概率分布的因子分解。从直观上,一个链图的因子分解把分布表示为每个链分支在其父节点给定时的乘积。这种表示也称链图模型。
不妨设一个链图G的链分支为G1,G2,…,GL。用Pa(Gi)表示Gi中所有节点的父节点集。G的端正图(moral graph)定义为一个无向图,记作M[G],其中对于每个Gi,在Pa(Gi)中的任意节点对都用无向边连接起来,并将Gi中的所有有向边转化为无向边。例如,图2.9a是一个链图,图2.9b是其端正图。把一个链图变成相应端正图的过程称为端正化(moralization)。
如果X是一个部分有向图G的节点子集,且X∈X,Boundary(X)X,那么称X为向上闭包子集。X的上闭包(upward closure)定义为X的最小向上闭子集Y。X的向上闭子图(upwardly closed subgraph)定义为Y的导出子图G[Y],记作G+[X]。例如,图2.10a和图2.10b分别是图2.9a的向上闭子图G+[C]和G+[C,D,I]。
如果X、Y、Z是一个部分有向图的三个互不相交的节点子集,且在无向图M[G+[X∪Y∪Z]]中,X和Y被Z分离,则称在给定Z时,X和Y是c分离的。c分离既是无向图中分离概念的推广,也是有向图中d分离概念的推广。例如,在图2.10a中,C和E在给定A和D时是c分离的,因为在图2.11a所示的无向图M[G+[C,D,E]]中,C和E在给定A和D时是分离的。然而,由于C和E之间存在经过A和B的一条路径,所以在只给定D的条件下,C和E不是c分离的。另一方面,C和E在给定D、A、I的条件下也不是c分离的,因为在图2.11b所示的无向图M[G+[C,D,E,I]]中,它们之间有一条边相连。
在无向图中,任何节点都没有后代节点。在有向图中,从一个节点出发经过任意有向路径能够到达的节点称为其后代节点。在链图中,不仅可以定义后代节点的概念,而且其中任何节点的后代必定在“下级”链分支中。此外,链图也有三种独立性:成对独立性、局部独立性和全局独立性。
链图的成对独立性是指:对任意两个非相邻节点X和Y:
X⊥Y(NonDes(X)-{X,Y})(2.81)
链图的局部独立性是指:对任意节点X,有
X⊥NonDes(X)-Boundary(X)Boundary(X)(2.82)
链图的全局独立性是指:对任意三个互不相交的节点子集X、Y、Z,如果X和Y被Z c分离,那么
X⊥YZ(2.83)
给定一个链图G的链分支G1,G2,…,GL,其概率分布定义为如下分解形式:
PPDAG(X1,…,XN)=∏Ll=1P(GiPa(Gi))(2.84)
其中P(GiPa(Gi))又可以看作一个条件随机场,可通过一系列因子ψi(Di)(i=1,…,l)定义,满足每个Di在正则图M[K+[G]]中都是极大团,且DiGi∪Pa(Gi),而条件随机场是下一节讨论的主要内容。