1.页面内容质量

1.1 飓风算法 3.0 ——针对页面内容质量问题

百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,在2018年9月13日公布飓风算法升级为2.0版本,在2019年8月对飓风算法进行升级,上线飓风算法3.0。
飓风算法主要针对以下页面内容质量问题:

1.1.1 恶劣采集行为:

(1)存在大量从其他站点、智能小程序或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
问题示例1:文章有明显采集痕迹
[百度算法]飓风算法 3.0 针对页面内容质量问题 - 图1

(2)存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
问题示例2:文章内容逻辑性差,阅读体验差
[百度算法]飓风算法 3.0 针对页面内容质量问题 - 图2

(3)站点或智能小程序内存在大量采集内容,自身内容生产力极差。

1.1.2 跨领域采集问题:

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。
跨领域采集主要包括下面两类问题:
第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。
问题示例:美食类智能小程序发布足球相关内容
[百度算法]飓风算法 3.0 针对页面内容质量问题 - 图3

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。
问题示例:智能小程序内容涉及多个领域
[百度算法]飓风算法 3.0 针对页面内容质量问题 - 图4

1.1.3 站群问题:

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。
问题示例:多个智能小程序复用同一模板,内容质量低、相似度高
[百度算法]飓风算法 3.0 针对页面内容质量问题 - 图5

关于飓风算法的更多信息请参考:

2019.8.22 【官方说法】飓风算法3.0解读
2019.8.8 飓风算法3.0即将上线,控制跨领域采集及站群问题
2018.9.20 【官方说法】飓风算法2.0解读
2018.9.13 百度搜索将推出飓风算法2.0,严厉打击恶劣采集行为
2017.7.4 百度推出飓风算法,严厉打击恶劣采集