度分布(Degree Distribution)
:在一个图中任意一个顶点的度取值为k的概率,即
,很容易
网络直径(Network Diameter)
- 直径:即图中任意两个结点间最大的距离
平均路径:针对连通图或强连通图而言,
针对无向图而言
- 就是为了表明一个结点i的邻居连通程度的系数
,其中e是结点i邻居之间边的条数,k为结点i的度
- 显然聚类系数的取值介于[0,1]
- 一个图的平均聚类系数
连通度
- 即最大连通分量的大小
Random Graph Model
- 两个变量:
即给定n个顶点,每条边存在概率为p的无向图。通过确定n以及p不能确定一个唯一的图,这很简单啦
即给定n个顶点以及m条边,这些边均匀随机地选择依附的顶点
- 度分布
(即计算图中有多少比例的结点度是k):
- 它服从二项分布

- 上式中第一部分是从n-1个结点中取出k的结点的所有组合方法数量(二项式系数),再乘以这些结点与当前结点相连的概率,以及其余结点与当前结点不相连的概率。其实就是二项分布的标准形式。细想其实比较好理解,因为P(k)是指任意一个顶点度为k的概率,所以只要分析一个点就好了
- 从二项分布的参数可以看出,只要图的顶点数够多,其顶点度的分布也就越稳定,方差带来的影响也相应减小,因为
是收敛的

- 聚类系数
(图中每个结点期望的聚类系数):
- 回忆一下,聚类系数计算公式是
,其中e是结点i邻居之间边的条数,k为结点i的度
- 那么我们先求
,很显然
,原因不说也应该知道。。
- 然后我们惊喜地发现:
- 回忆一下,聚类系数计算公式是

- 所以,如果我们按照一定的连通度生成节点数越来越大的图,聚类系数就会趋于0
- Expansion
:若对于任意一个结点子集,分割出这个子集损失的边数量大于系数
- Expansion
edges leaving S的意思实际上就是图中S与V\S连接着的边集

- 如何理解
?其实就是一个扩张系数。我们从结点集中分割出一个子集,从这个子集连接着另一个补集的边可以确定下一次扩张新加入的点。这样只要是一个连通图,任意点集经过若干次扩张一定可以可以将点集变为所有结点的集合。每次扩张都可以算出一个比例,
就对应所有扩张中最小的比例值。那么借由
,就可以计算出由一对结点延伸出的最长路径
- 所以,图的直径,或者说最长路径一定是对数级的,至于下面这个公式是怎么推出来的,我不知道。。

- 所以,Gnp的路径长度为
- 模型的问题:
- 度分布与真实网络不同
- 现实中最大连通分量规模(p(n-1)与规模大小的函数)不会呈阶段型(当p(n-1)>1时具有最大连通分量)
- 没有社群结构,因为聚类系数太低
Small World Model
- 是否存在具有高聚类系数同时直径较短的图?

- 若最短路径大小为
,但聚类系数太低;若网络具有社团结构,那样直径又会太大
- 模型要点:
- 首先建立一个低维数栅格模型(圆环状),使其具有很高的聚类系数
- 随后进行重连线的操作,即随机去除模型中的边并与远处的点进行连接。对于每个边,它具有p的概率将另一个节点设为图中任何一个随机结点

- 只需稍稍增加概率p,若干捷径就会打通,图的直径就会迅速变小,但聚类系数基本不受影响


- 克罗内克图(Kronecker graph)就是对初始邻接矩阵K_1不断与自己进行克罗内克內积得到的图。


- 随机克罗内克图(Stochastic Kronecker Graph)
- 第一步:创建N_1 x N_1的可能性矩阵O_1
- 第二步:计算O_1进行k次克罗内克內积的结果O_k
- 第三步:对于O中任意的任意元素p_uv,以可能性p_uv决定矩阵K_k中是否存在该条边

- 快速克罗内克图生成算法:每次投入一条边,递归地决定投入在什么位置。如果重复则重新插入

- 跟真实世界最接近的模型
