什么是https

由于HTTP天生”明文”的特点,整个传输过程中完全透明,任何人都能够在链路中截取、修改或者伪造请求/响应报文,数据不具有可信性,因此就诞生了HTTPS协议。使用HTTPS协议时所有HTTP请求和响应在发送到网络之前,都需要进行加密。HTTPS协议等于HTTP协议加上SSL/TLS协议。至于二者之间的区别,HTTP协议有点类似于“裸奔”,他们数据传输是通过明文的形式做传输,即使约定了加密方式,但是第一次传输的时候还是明文;鉴于此,HTTPS使用的是非对称加密,为秘钥的传输外层再做一层保护,非对称加密的一组秘钥对中,包含一个公钥和一个私钥。明文既可以用公钥加密,用私钥解密;也可以用私钥加密,用公钥解密。
image.png

SSL/TLS协议

SSL(Secure Socket Layer,安全套接字层):1994年为Netscape所研发,SSL协议位于TCP/IP协议与各种应用层协议之间,为数据通讯提供安全支持。
TLS(Transport Layer Security,传输层安全):其前身是SSL,它最初的几个版本(SSL 1.0、SSL 2.0、SSL 3.0)由网景公司开发,1999年从3.1开始被IETF标准化并改名,发展至今已经有TLS 1.0、TLS 1.1、TLS 1.2三个版本。SSL3.0和TLS1.0由于存在安全漏洞,已经很少被使用到。TLS 1.3改动会比较大,目前还在草案阶段,目前使用最广泛的是TLS 1.1、TLS 1.2。

HTTPS的实现原理

HTTPS 协议之所以是安全的是因为 HTTPS 协议会对传输的数据进行加密,而加密过程是使用了非对称加密实现。但其实,HTTPS 在内容传输的加密上使用的是对称加密,在证书验证阶段才使用了非对称加密。
HTTPS - 图2
① 证书验证阶段

  1. 浏览器发起 HTTPS 请求
  2. 服务端返回 HTTPS 证书
  3. 客户端验证证书是否合法,如果不合法则提示告警

② 数据传输阶段

  1. 当证书验证合法后,在本地生成随机数
  2. 通过公钥加密随机数,并把加密后的随机数传输到服务端
  3. 服务端通过私钥对随机数进行解密
  4. 服务端通过客户端传入的随机数构造对称加密算法,对返回结果内容进行加密后传输

    面试常见考点

    1、为什么数据传输是用对称加密?
    答:首先,非对称加密的加解密效率是非常低的,而 http 的应用场景中通常端与端之间存在大量的交互,非对称加密的效率是无法接受的;另外,在 HTTPS 的场景中只有服务端保存了私钥,一对公私钥只能实现单向的加解密,所以 HTTPS 中内容传输加密采取的是对称加密,而不是非对称加密。
    2、HTTPS 为什么安全?
    答:因为 HTTPS 保证了传输安全,防止传输过程被监听、防止数据被窃取,可以确认网站的真实性。
    3、HTTPS 的传输过程是怎样的?
    答:客户端发起 HTTPS 请求,服务端返回证书(自己存证书的私钥,返回公钥),客户端对证书进行验证,验证通过后本地生成用于改造对称加密算法的随机数,通过证书中的公钥对随机数进行加密传输到服务端,服务端接收后通过私钥解密得到随机数,之后的数据交互通过对称加密算法进行加解密。
    4、为什么需要证书?为什么需要 CA 认证机构颁发证书?
    答:防止中间人攻击,同时可以为网站提供身份证明。HTTP 协议被认为不安全是因为传输过程容易被监听者勾线监听、伪造服务器,而 HTTPS 协议主要解决的便是网络传输的安全性问题。首先我们假设不存在认证机构,任何人都可以制作证书,这带来的安全风险便是经典的 “中间人攻击” 问题。
    “中间人攻击” 的具体过程如下:
    HTTPS - 图3
    中间人攻击的过程原理:
    1.本地请求被劫持(如DNS劫持等),所有请求均发送到中间人的服务器
    2.中间人服务器返回中间人自己的证书
    3.客户端创建随机数,通过中间人证书的公钥对随机数加密后传送给中间人,然后凭随机数构造对称加密对传输内容进行加密传输
    4.中间人因为拥有客户端的随机数,可以通过对称加密算法进行内容解密
    5.中间人以客户端的请求内容再向正规网站发起请求
    6.因为中间人与服务器的通信过程是合法的,正规网站通过建立的安全通道返回加密后的数据
    7.中间人凭借与正规网站建立的对称加密算法对内容进行解密
    8.中间人通过与客户端建立的对称加密算法对正规内容返回的数据进行加密传输
    9.客户端通过与中间人建立的对称加密算法对返回结果数据进行解密
    由于缺少对证书的验证,所以客户端虽然发起的是 HTTPS 请求,但客户端完全不知道自己的网络已被拦截,传输内容被中间人全部窃取。
    5、既然证书是公开的,如果要发起中间人攻击,我在官网上下载一份证书作为我的服务器证书,那客户端肯定会认同这个证书是合法的,如何避免这种证书冒用的情况?
    其实这就是非加密对称中公私钥的用处,虽然中间人可以得到证书,但私钥是无法获取的,一份公钥是不可能推算出其对应的私钥,中间人即使拿到证书也无法伪装成合法服务端,因为无法对客户端传入的加密数据进行解密。
    6、使用 HTTPS 会被抓包吗?
    答:会被抓包,HTTPS 只防止用户在不知情的情况下通信被监听,如果用户主动授信,是可以构建 “中间人” 网络,代理软件可以对传输内容进行解密。
    7、本地随机数被窃取怎么办?
    证书验证是采用非对称加密实现,但是传输过程是采用对称加密,而其中对称加密算法中重要的随机数是由本地生成并且存储于本地的,HTTPS 如何保证随机数不会被窃取?
    答:其实HTTPS并不包含对随机数的安全保证,HTTPS只保证传输过程安全,而随机数存储于本地,本地的安全属于另一安全范畴,应对的措施有安装杀毒软件、反木马、浏览器升级修复漏洞等。
    8、证书包含什么信息?
    答:颁发机构信息+公钥+公司信息+域名+有效期+指纹+…
    9、证书的合法性依据是什么?
    答:首先,权威机构是要有认证的,不是随便一个机构都有资格颁发证书,不然也不叫做权威机构。
    另外,证书的可信性基于信任制,权威机构需要对其颁发的证书进行信用背书,只要是权威机构生成的证书,我们就认为是合法的。所以权威机构会对申请者的信息进行审核,不同等级的权威机构对审核的要求也不一样,于是证书也分为免费的、便宜的和贵的。
    10、浏览器如何验证证书的合法性?
    答:浏览器发起HTTPS请求时,服务器会返回网站的SSL证书,浏览器需要对证书做以下验证:
    (1)验证域名、有效期等信息是否正确。证书上都有包含这些信息,比较容易完成验证;
    (2)判断证书来源是否合法。每份签发证书都可以根据验证链查找到对应的根证书,操作系统、浏览器会在本地存储权威机构的根证书,利用本地根证书可以对对应机构签发证书完成来源验证;
    3)判断证书是否被篡改。需要与CA服务器进行校验;
    (4)判断证书是否已吊销。通过CRLCertificate Revocation List 证书注销列表)和OCSP(Online Certificate Status Protocol在线证书状态协议)实现,其中OCSP可用于第3步中以减少与CA服务器的交互,提高验证效率
    以上4步都满足的情况下浏览器才认为证书是合法的。
    11、只有认证机构可以生成证书吗?
    如果需要浏览器不提示安全风险,那只能使用认证机构签发的证书。但浏览器通常只是提示安全风险,并不限制网站不能访问,所以从技术上谁都可以生成证书,只要有证书就可以完成网站的HTTPS传输。例如早期的12306采用的便是手动安装私有证书的形式实现HTTPS访问。