1.5 社团结构的网络
近年来对众多实际网络的研究发现,它们存在一个共同的特征,称之为网络中的社团结构。它是指网络中的节点可以分成组,组内节点间的连接比较稠密,组间节点的连接比较稀疏[25],见图1-5。社团结构在实际系统中有着重要的意义:在社会网络中,社团可能代表具有类似兴趣爱好的人群;在引文网[26]中,不同社团可能代表了不同的研究领域;在食物链网中,社团可能反映了生态系统中的子系统;在万维网中,不同社团反映网络的主题分类。
图1-5 一个小型的具有社团结构性质的网络
总之,分析大型网络中的社团结构有很大的潜在价值,因为属于同一社团结构的点往往具有某些相同的属性,这便于人们发现隐藏在网络中个体连接背后的信息。因此,对网络中社团结构的研究是了解整个网络结构和功能的重要途径,网络社团结构的划分与度量成为新的热点。
关于网络中的社团结构,目前还没有被广泛认可的唯一的定义,较为常用的是基于相对连接频数的定义:网络中的节点可以分成组,组内连接稠密而组间连接稀疏。这一定义中提到的“稠密”和“稀疏”都没有明确的判断标准,所以在探索网络社团结构的过程中不便使用。因此人们试图给出一些定量化的定义,如提出了强社团和弱社团的定义。强社团的定义为:子图H中任何一个节点与H内部节点连接的度大于其与H外部节点连接的度。弱社团的定义为:子图H中所有节点与H内部节点的度之和大于H中所有节点与H外部节点连接的度之和。此外,还有比强社团更为严格的社团定义——LS集[27]。LS集是一个由节点构成的集合,它的任何真子集与该集合内部的连边都比与该集合外部的连边多。另一类定义则是以连通性为标准定义的社团,称之为派系[28]。派系是指由3个或3个以上的节点组成的全连通子图,即任何两点之间都直接相连。这是要求最强的一种定义,它可以通过弱化连接条件进行拓展,形成n-派系。例如,2-派系是指子图中的任意两个节点不必直接相连,但最多通过一个中介点就能够连通;3-派系是指子图中的任意两个节点,最多通过两个中介点就能连通。随着n值的增加,n-派系的要求越来越弱。这种定义允许社团间存在重叠性[29]。所谓重叠性是指单个节点并非仅仅属于一个社团,而是可以同时属于多个社团。社团与社团由这些有重叠归属的节点相连。有重叠的社团结构问题有很好的研究价值,因为在实际系统中,个体往往同时具有多个群体的属性。
上述社团的定义来自文献[27],除这个定义外,还有多种其他定义方式,文献[6]进行了更为详细的介绍。