笔者过去曾做过几年的站长,对搜索引擎优化有一些粗浅的研究,也曾依靠百度获取了数十万日 IP 的流量。最近发现厂内许多 Web 站点还存在许多较初级的面向搜索引擎的问题,感觉过往的经验还有一点价值,做一些的分享。
- 本文的阅读对象主要是对 SEO 感兴趣的 运营、产品 或 研发同学 ;
- 如果对 HTML 语法 和 域名注册、网站运维 的有一点了解,更好了 ;
- 阅读时长约 15 分钟。
一、搜索引擎的工作原理
简而言之,搜索引擎的目标,是帮助用户检索到满足他们需求的内容,解决用户的问题。搜索引擎的工作过程,大体上可以分成三个阶段。
1.1 爬行和抓取
搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面 HTML 代码,存入数据库。
1.2 预处理
索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序。
1.3 排名
用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。
二、搜索引擎优化
我们从 域名和服务器 、 网站搭建、网站运营、作弊和惩罚 四个维度,快速的聊聊影响网页在搜索引擎排名的因素,以及提升他们的方法。为突出重点,这里将 必须遵守的规则标记为⭐⭐,强烈建议遵守的规则标记为⭐,未标星则为普通的推荐的级别。
三、域名和服务器
3.1 域名
3.1.1 域名背书
- 如果网站的域名是一个知名站点的子域名,类似*.qq.com,则搜索引擎的信任加分
- 如果网站的域名近期曾做过质量和权重较高的网站(参看 5.2.2),则搜索引擎的信任加分
3.1.2 域名简短
越短用户越容易记忆,用户体验越好,加分。
3.1.3 语义化域名
- 你叫拉勾?那么最好的域名是 lagou.com;
- 你是招聘类网站?那么 zhaopin.com 和 51job 都不错,但是前者比后者更好。
3.1.4 主流域名
- 最好使用. com、.cn 等主流后缀;
- 其次. net 等次主流;
- 或者 .la 等对中文用户友好的非主流域名;
- 当然,最低限度地,域名须在中国境内可备案。推荐我司 dnspod.cn ,注册时会告知当前后缀在国内是否可备案。
3.1.5 不要使用被惩罚过的域名⭐
- 域名曾经涉黄涉黑;
- 曾经因为 SEO 作弊被惩罚过;
- 曾经做过质量非常低下的垃圾站。
……
3.2 服务器
3.2.1 畅通⭐⭐
国内各地区畅通可访问,检测工具:http://tool.chinaz.com/sitespeed
3.2.2 稳定⭐⭐
确保网站在所有地区可持续稳定运行,即便极少的情况下出现了不可访问,须快速恢复。推荐使用腾讯云的云服务器:https://cloud.tencent.com/product/cvm
3.2.3 快⭐
通过各种方式,尽可能的缩短 ” 从用户在浏览器输入网址回车 “到”浏览器呈现完整内容 “的时长,实现” 秒开“,包括但不限于以下方式:
- 网站启用 GZIP,减小网页体积;
- 优化网页和网页中的元素(如图片、JS 代码)等的体积和载入时长,单个网页承载内容不要过多;
- 使用 CDN,注意:须使用节点稳定的 CDN 服务提供商,否则若无法稳定访问反而会极大影响收录和排序,推荐腾讯云的 CDN 服务;
- 使用腾讯云的对象存储,存储图片等附件;
- 使用可靠稳定的域名智能解析服务器,如 DNSPod;
- 提高 服务器带宽和性能(参考当前和预估未来一段时间的访问数据,访问峰谷带宽开支、资源开支);
- 优化代码和数据库的性能;
- 使用缓存技术;
- 静态化网页;
- 多与研发和运维聊聊,还有哪些方式可以加速页面的访问?
四、网站搭建
4.1 用户体验⭐
通过网站的产品策划、功能、交互、视觉设计,尽一切可能,建设一个对用户友好的网站,提升网站在用户心目中的可信度。引导用户访问满足用户需求、解决用户问题,且用户体验良好的网页,是搜索引擎的目标。我们需要和它的目标一致。
这里《百度搜索引擎优化指南》也提供了一些建议,供参考:
- 页面美观、整洁,有自己的风格;
- 让可以很容易的了解到网站的背景;
- 详细的网站介绍、联系方式,让用户可以方便的联系;
- 用户评论、顾客反馈等信息,让原有的用户影响新用户;
- 在网站设计中注重强化网站的品牌,让用户更了解、进而信任你的网站;
4.2 网站结构
4.2.1 树状结构
树状结构为主,扁平化、适当的减少栏目分类层级,参考:腾讯网 - 腾讯科技 - 区块链 / 人工智能…. ,即是典型的三级分类结构。
4.2.2 网状结构
网状结构为辅,各页面间 依据 “内容相关性” 和 其它一些诸如 “热门、编辑推荐 ” 等维度指标,合理、自然的交叉链接,参考:腾讯科技 - 内容详情页 - 页面底部 和 右侧 的 相关资讯的推荐
4.2.3 二级域名还是子目录
- 通常来说,子目录的内容可更快继承站点的权重,而二级域名的可扩展性和独立性要高一些
- 内容差异大、相关度相对较低,独立性和可扩展性要求高,推荐使用二级域名。如 :https://sports.qq.com/
- 内容差异性较低,相关度较高,独立性和扩展性要求不高,推荐使用子目录。如:https://sports.qq.com/nba
4.2.4 使用面包屑导航
使用类似 首页 > 频道名称 > 栏目名称 > 详情页标题 的面包屑导航,帮助搜索引擎和用户明确页面层级和位置
4.3 网站内容
4.3.1 确保内容搜索引擎可识别⭐⭐
- 不要把 “期望被搜索引擎识别的内容” 放到 JS、图片、FLASH 等非文本类的内容载体中;
- 如果你的网站是前后端分离的架构,请使用类似 SSR 的技术,使得内容被搜索引擎可识别;
- 如果网站中存在图片,请使用 alt 标签告诉搜索引擎图片是什么;
- 不要使用 frame 或 iframe 框架 显示 “期望被搜索引擎识别的内容”。
4.3.2 确保内容的价值⭐
确保与竞品相比,提供了更高或至少同一水准的满足用户需求的内容(与搜索引擎同归同途)
4.3.3 确保每 1 个网页都可通过 1 个唯一的 URL 访问⭐
- 不同的页面,不要使用相同 URL,比如近些年较流行的 “单页面框架” ;⭐⭐
- 一个网页不要可通过多个 URL 访问,会让搜索引擎搞不清哪一个才是网页的主要 URL⭐
4.3.4 确保已被收录的 url 链接可被访问⭐
- 如网址变更,请及时 301 跳转,跳转至内容的新的 URL,
- 如网页已被删除无法访问,请在站长管理平台中(见 7.4)作为死链提交删除
4.3.5 URL 中包含目标关键词
良好的的 url 结构,可帮助用户和搜索引擎快速判断网页的内容,和内容所在网站的结构层次。分 2 种情况
- 关键词包含在域名中,如,前述的 zhaopin.com ,核心关键词为 “招聘”
- 关键词包含在网页的 url 路径中,举例,目标关键词为 “张三的简历”,则推荐如下的 url 结构 zhaopin.com/jianli/zhangsan/
4.3.6 写好 title⭐
- 页面标题的写法有多种方式,切记勿对堆砌关键词,须自然、对用户友好(面向用户,适当考虑搜索引擎)
- 可以参考百度百科的写法,也是百度推荐的写法,如:百度百科的首页:网站名称一句话简介(简介可包含目标关键词);百度百科的内页:内页标题网站名称
- 良好的页面 title,不仅会影响搜索引擎对你的网页的识别和索引,也会影响用户在搜索结果中的点击行为,进而持续影响搜索排序。
- 不同网页的 title 不要相同;
4.3.7 写好 description
- meta 标签中的 description 的内容也会作为搜索引擎的较主要的内容识别参考标准之一,类似 title,须面向用户自然友好的撰写,适当包含目标关键词;
同 title,description 的内容,一般来说同样会在搜索结果中呈现,也是作为用户识别网页内容的参考之一,影响用户在搜索结果中的点击行为,进而持续影响搜索排序;
- 不同网页的 description 不要相同,相对而言,宁可为空。
4.3.8 内容与关键词的关联⭐
- 关键词分为 核心关键词 和 长尾关键词。
- 核心关键词 指 网站的核心的 1-3 个关键词,通常来说,核心关键词的检索量是巨大的,例如,汽车之家的 核心关键词 可认为是 “汽车” 。在核心关键词的优化工作中,取得绝佳的搜索引擎自然排名,是搜索引擎优化工作的最核心工作之一,它不仅能带来可观的流量,更是品牌的极大提升和体现。网站的首页通常承载着实现核心关键词优化目标的实现;
- 长尾关键词,指围绕目标关键词和产品的目标用户广泛分布的较小搜索量,但数量巨大的关键词,例如,汽车之家的某一条长尾关键词可能是:理想 one 2021 款价格。长尾关键词的单个搜索量可能远低于目标关键词,但因基数数量巨大,实际带来的流量通常远胜单一的目标关键词所带来的流量。网站的内容详情页通常承载着长尾关键词的优化目标的实现;
- 关键词的分布。页面中,面向用户的适当、自然的关键词的内容分布,有助于搜索引擎将您的页面和目标关键词建立起关联;
- 传统上建议目标关键词密度为 2% - 8% 之间,我个人不建议教条于此区间数值,保持面向用户、自然、合理, 适当兼顾目标关键词的呈现就好。页面关键词密度检测工具:http://tool.chinaz.com/tools/density.aspx
- 4.3.1 所述的图片的 alt 标签,也建议自然、合理的围绕页面的 目标关键词 产生关联,因为用户同样会在搜索引擎的图片搜索中使用这些 “核心关键词” 和 “ 长尾关键词 ”。
- 可适当在网页的
-
标签,以及 、 等标签中,自然的包含关键词。这相当于告知 用户 和 搜索引擎,这些词语,是相对其它内容更重要的。勿滥用,也因为在漫长的搜索引擎进化史中,发现此类方法被滥用较多,也早已不在像多年前那么的重要了。
- 获得关键词搜索数据的工具:百度指数:index.baidu.com ; 长尾关键词的挖掘工具:https://ci.aizhan.com/ ;https://data.chinaz.com/
4.3.9 不要复制其它网站的内容
- 内容的生产,尽可能原创 或 二次加工后,提供更高的价值。不要直接复制其它网站已存在的内容。如大量此行为,可能会让搜索引擎认为你的网站内容的价值不大。
4.4 网站改版
针对网站改版这种大规模的调整网站的行为,通常分 2 类
4.4.1 只是更换域名,绝大部分内容无变化⭐
- 全站 301 跳转至新的域名
- 使用各大站长管理平台(见 7.3)的 ” 网站改版 “功能,按提示操作,告知搜索引擎你的改动。
4.4.2 网站重构,内容绝大部发生变化
此时搜索引擎会认为域名重新建设了一个全新的网站,原有权重绝大部分会失效。但依据个人经验:
- 若重构后,网站的所属行业或领域、目标用户变化不大,权重依然会继承不少,新的内容也会较快收录,排名较全新域名会加分不少;
- 对可保留的,仅是更换了 url 路径的,推荐做 301 跳转,部分页面的权重和排名依然会保留。从用户体验的角度,显然这也是更友好的做法。
五、网站运营
5.1 内容运营
- 在漫长持久的运营过程中,持续围绕 4.3 的建议,自然,频度分布合理的输出内容。
- 不要一次产生大量的内容,又间隔很久不产生内容
5.2 链接策略⭐
外链策略是搜索引擎的外部运营建设的一个最核心的策略。“网页的外部链接” 约等于 “ 搜索引擎认为的其它用户 / 网站,对于该网页的价值的投票 ” 。当然,随着搜索引擎技术的提升和进步,单一的外部链接的策略的重要程度这些年已经降低,搜索引擎有更多的方法和策略来判断网页的价值。但是,这依然是一个基础。
5.2.1 获取高权重网站的投票
- 质量、可信度更高的网站,对你的投票(即链接),更好。比如新浪的首页,指向你,这是极大的价值的;
- 相关度更高的网站,,对你的投票(即链接),更好。比如你要做开源软件,那么 CSDN 或者 GitHub 的首页能够链接指向你的网站,这是极大的价值的;
5.2.2 怎样判断网站的质量或权重
有很多数据可以侧面判断一个网站的质量 和 用户心目中的口碑、可信度,举例:
- 网站品牌的百度指数。有多少人每天搜 “腾讯” 两个字,侧面判断 tencent.com 的质量和用户可信度。详细解释见 7.3;
- 对网站本身的用户价值和用户体验的判断,体现了网站的长期价值;
- 网站的其它服务的活跃度,例如 app 下载数据、社区活跃度;
- 网站的 “百度权重”。详细解释见 7.3;
- 网站的 alexa 全球排名。详细解释见 7.3;
- 网站在一些业内其它排行榜的排名:如,https://top.chinaz.com/ ;
- 网站的运营时间,通常 “关于我们” 里可查看
- 域名的注册时间时长。https://dns.tech/ 可查询
5.2.3 外链的位置
- 自然的被外部网站推荐、或者被用户推荐的链接的价值,高于在友情链接等处被推荐的链接;
- 高权重的页面(如网站的首页)推荐链接的价值,高于低权重页面的价值(如专门的友情链接页)
5.2.4 链接的锚文字
锚文字,即链接所使用的文字。也是前述简史中,robin 提交的 “超链文件检索系统” 的核心内容,可见对于百度的搜索引擎排名因素是十分重要的。同理前述,随着搜索引擎技术的提升,此类单一因素的决定性、重要程度已经下降很多,但依然需要十分的重要。
5.2.5 图片链接还是文字链接
相对而言推荐文字链接,如果是图片链接,图片的 alt 标签可使用上述 “锚文字” 的策略
5.2.6 重视你的导出链接
在现实生活中,你替一个新人背书,新人将来很出色,对你的信誉而言是加分,新人是个骗子,对你的信誉是减分。导出链接同理:
- 不要链接质量低下的网站
- 谨慎链接到新的网站
- 可以链接到较高质量的相关度较高网站
5.2.7 怎样获取大量外部高质量的链接
- 功能设计,社会化分享等功能,引导用户分享推荐你的网站;
- 策划活动,引导用户分享推荐你的网站;
- 同类型同质量或略高质量的网站的友情链接;
- BD、资源置换等各种运营策略;
5.3 信任度和品牌
通过上述运营策略和用户体验不断的改进,用户口碑和信任度不断的增强,建议持续增强网站品牌的用户心智,持续提升网站品牌词的百度指数,有助于提升百度对于网站的整体信任度。
六、作弊与惩罚
任何利用和放大搜索引擎的策略缺陷,利用恶意手段获取与网页质量不符的排名,引起用搜索结果质量和用户搜索体验下降的行为,都会被搜索引擎当做作弊行为。
搜索引擎作弊 / 黑帽策略 和 搜索引擎之间恶略 的战争,就像 小偷和警察 ,不瑞雪行为 和 瑞雪大侠,百度近几年推出了许多公开的算法升级,大多用来打击作弊 或 低质网站。
6.1 常见作弊行为
- 构造目录发布低质内容;
- 通过刷点击,提升网站搜索排序的作弊行为;
- 通过网页标题作弊欺骗用户并获得点击的行为;
- 在页中、页尾堆积关键词;
- 通过网页劫持或跳转,欺骗搜索引擎;
- 通过算法,批量生成的无效内容,欺骗搜索引擎;
- 出售或购买链接。
6.2 易被打击的低质内容
- 采集;
- 伪原创;
- 批量生成的低质内容;
- 用户体验差:网页大量弹窗;
- 用户体验差:诱导下载。
6.3 惩罚与改正
- 对用户体验及搜索结果质量影响不大的,去除作弊部分获得的权值;
- 对用户体验及搜索结果质量影响严重的,去除作弊部分获得的权值并降低网站的权重,直至从搜索结果中彻底清理掉;
- 若被惩罚,改正后,搜索引擎会定期自动对作弊网站进行检测,大部分修正了作弊行为的网站,会在一定的观察期满后自动解除惩罚。
七、常见工具推荐
7.1 网站统计
友盟统计 (cnzz 统计):
https://cnzz.com
谷歌统计:
https://developers.google.cn/analytics
7.2 网站数据分析
网站速度测试:
https://tool.chinaz.com/sitespeed
ping 测试:
https://ping.chinaz.com/
aleax 全球排名:
https://alexa.chinaz.com/
国内网站排名:
https://top.chinaz.com/
域名 whois 查询:
https://dns.tech/
7.3 SEO 工具
关键词挖掘:
https://data.chinaz.com/related
关键词排名:
https://ntool.chinaz.com/keywords/
死链查询:
https://ntool.chinaz.com/tools/links
关键词密度检测:
https://tool.chinaz.com/tools/density.aspx
反向链接查询:
https://outlink.chinaz.com/
友情链接检测:
https://link.chinaz.com/
Robots 检测:
https://stool.chinaz.com/robots
百度官方的搜索引擎优化指南:
https://zhangliseo.com/seoguide/baidu2.0/
7.4 各搜索引擎的站长平台
百度站长资源平台:
https://ziyuan.baidu.com
搜狗站长平台:
https://zhanzhang.baidu.com
360 站长平台:
https://zhanzhang.so.com
谷歌站长平台:
https://www.google.cn/webmasters/
bing 站长平台:
https://www.bing.com/webmasters/about
诚然,今天的时代,搜索引擎的入口地位有所下降了,搜索算法的进步使得网站通过 SEO 获取” 免费的流量 “的难度在提升,但搜索引擎仍然是” 获取信息“ 的最重要的入口之一。SEO 也依然是 Web 网站的标配 。
因篇幅所限、时间仓促、知识的局限性等原因,此篇内容难免有疏漏、深度不够,一些知识点提及较浅,如:关键词的策略、 ” 百度站长平台 “ 的一些重要的功能点的介绍、移动端的网页的搜索引擎优化等 。待后续笔者在抽出时间持续完善本文。
感谢阅读,欢迎评论交流 :)