这里引入两个我们必须了解的排序算法。分别是谷歌PageRank和百度的超链分析。这两个算法是SEO从业者必须要了解的算法。
谷歌PageRank:
PageRank算法的基本想法是在有向图上定义一个随机游走模型,即一阶马尔可夫链,描述随机游走者沿着有向图随机访问各个结点的行为。在一定条件下,极限情况访问每个结点的概率收敛到平稳分布,这时各个结点的平稳概率值就是其PageRank值,表示结点的重要度。PageRank 是递归定义的,PageRank 的计算可以通过迭代算法进行。
两个重要假设
数量假设:在Web图模型中,如果一个页面节点接收到的其他网页指向的入链数量越多,那么这个页面越重要。
质量假设:指向页面A的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重。所以越是质量高的页面指向页面A,则页面A越重要。
二、pagerank算法
公式定义
PR(a)表示当前节点a的PR值
PR(Ti)表示其他各个节点(能够指向a)的PR值
L(Ti)表示其他各个节点(能够指向a)的出链数
i代表当前时刻或迭代次数
这里不用详细去了解具体算法。我们只需要知道排序是受算法影响。用Google创始人的话讲,是页面A对页面B的支持投票,Google根据这个投票数来判断页面的重要性,但Google除了看投票数(链接数)以外,对投票者(链接的页面)也进行分析。「重要性」高的页面所投的票的评价会更高,因为接受这个投票页面会被理解为「重要的物品」。
百度的超链分析: