“SEO的英文是Search Engine Optimization, 中文翻译为“搜索引擎优化”。”
地址格式
protocol://hostname/path/filename?querystring#fragment

新人指引

https://developers.google.com/search/docs/beginner/get-started

抓取

爬虫抓取
网站所有者提交 站点地图

编入索引

发现网页后,Google 会尝试了解该网页的内容。此过程称为“编入索引”。Google 会分析该网页的内容、为网页上嵌入的图片和视频文件编制目录,并通过其他方式尝试了解网页。这些信息存储在 Google 索引中,而 Google 索引是一个存储在很多很多计算机中的巨大数据库。
如何改善网页索引编制效果:

  • 创建简短且有意义的网页标题
  • 使用传达网页主题的网页标题。
  • 使用文字(而非图片)传达内容。尽管 Google 能够理解一些图片和视频,但相比图片和视频,文字更易于理解。请至少使用替代文本和其他属性为视频图片添加适当的注解。 ```html

  1. <a name="eoC7x"></a>
  2. ### 呈现(和排名)
  3. **要改善您的网页呈现和排名效果,请注意以下事项**:
  4. - 提高网页加载速度,并使其适合移动设备访问。
  5. - 在网页上发布实用的内容并保持更新。
  6. - 遵循[Google 网站站长指南](https://developers.google.com/search/docs/advanced/guidelines/webmaster-guidelines),这有助于确保提供良好的用户体验。
  7. - 详细了解[搜索引擎优化 (SEO) 新手指南](https://developers.google.com/search/docs/beginner/seo-starter-guide)中的提示和最佳做法。
  8. - 您可以[点击此处了解详情](https://www.google.com/search/howsearchworks/),包括[我们为确保提供优质搜索结果而制定的质量评分者指南](https://static.googleusercontent.com/media/www.google.com/en//insidesearch/howsearchworks/assets/searchqualityevaluatorguidelines.pdf)。
  9. <a name="O4DUZ"></a>
  10. ## googlebot
  11. 若想阻止某个网页出现在 Google 搜索结果中,您可以在该网页的 HTML 代码中添加 noindex 元标记,或在 HTTP 响应中返回 noindex 标头。当 Googlebot 下次抓取该网页并发现该标记或标头时,就会完全阻止该网页出现在 Google 搜索结果中,不论是否有其他网站链接到该网页。
  12. ```html
  13. <!-- 禁止 所有的搜索引擎 编入索引 -->
  14. <meta name="robots" content="noindex">
  15. <!-- 禁止 google 编入索引 -->
  16. <meta name="googlebot" content="noindex">
  17. <p>
  18. 或者修改 http 响应头
  19. HTTP/1.1 200 OK
  20. (…)
  21. X-Robots-Tag: noindex
  22. (…)
  23. </p>

I18N

  1. <meta data-n-head="true" data-hid="description" name="description" content="xxx"/>
  2. <meta data-n-head="true" data-hid="keyWords" name="keyWords" content="xxx"/>
  3. <link data-n-head="true" rel="alternate"
  4. href="https://ar.hibobi.com" hreflang="ar"/>
  5. <link data-n-head="true" rel="alternate"
  6. href="https://us.hibobi.com" hreflang="en-US"/>
  7. <link data-n-head="true" rel="canonical" href="https://ar-dev.hibobi.com"/>
  8. <link data-n-head="true" rel="alternate" media="only screen and (max-width: 750px)" href="https://ar-m-dev.hibobi.com"/>
  9. <link data-n-head="true" rel="alternate" media="handheld" href="https://ar-m-dev.hibobi.com"/>

什么是 canonical URL 标签?

canonical URL标签也叫规范网址,出现在你网页代码的里。
canonical URL标签的代码长下面这个样子。

  1. <link data-n-head="true" rel="canonical" href="https://ar-dev.hibobi.com"/>

为什么要使用 canonical URL 标签?
以我们常见的产品页面的URL为例,大部分外贸独立站可能是下面这个样子。
https://www.yourdomain.com/products/
一旦你的产品多了有了分页就会自动生成一个新的URL。
https://www.yourdomain.com/products/page/2/

如果不做canonical URL标签优化,就搜索引擎机器人来看,上面两个URL的页面内容是一样的,所以机器人不知道到底要把哪个URL编入搜索结果里,也不知道哪个页面才是重要的。

无形间的重复内容,大大降低了页面在搜索引擎的重要性,页面权重也全都分散了。

虽然谷歌官方的说法是重复内容不直接影响SEO,但我可以很负责的告诉大家,大量的重复内容会分散你网站本该有的排名。有很多种办法可以处理重复内容,但最有效的还是用canonical URL标签把网址规范化。

否则谷歌会分不清楚你网站重复内容的页面哪个重要,哪个不重要。

而canonical URL标签的目的就是告诉谷歌把你重要的页面和其它页面区别对待,在搜索结果中只显示唯一的URL,规范URL的结构,让其它重复内容的URL指向最主要的那个URL。

链接权重传递到主页面

意义就是这个网页的规范化网址应该是:
http://www.example.com/product.php?item=swedish-fish
下面这些URL都可以加上这段代码:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
这些URL的真正规范化网址就都成为:
http://www.example.com/product.php?item=swedish-fish
简单说,这个标签相当是一个页面内的301转向。区别在于用户并不被转向,还是停留在不变网址上,而搜索引擎会把它当作是301转向处理,也就是说把页面链接的权重都集中到代码中指明的规范化网址上。
Canonical标签的一个优点是方便,可以直接写在页面html代码中,不用服务器端设置转向之类。某些情况下,部分站长可能无法设置转向,但html代码总是能控制的。

什么是网址规范化问题?

网址规范化一直是困扰站长以及搜索引擎的一个问题。据估计,网上有10%-30%的URL是内容相同但URL不一样的不规范化网址。
这就造成几个问题。比如:

  • 对站长来说,多个URL存在分散了页面权重,不利于排名。
  • 对搜索引擎来说,浪费资源,浪费带宽。
  • 搜索引擎发现多个网址内容相同时,不会惩罚,而会尽可能找出那个应该是规范化的网址。但程序毕竟只是程序,可能出错,挑出来的可能不是站长想要的那个规范化网址。
  • 网站上网址规范化问题太严重的话,也可能影响收录。一个权重不很高的域名,能收录的总页面数字是有限的。搜索引擎把资源花在收录不规范的网址上,留下给真正不同内容的资源就减少了。