笔记地址 https://blog.csdn.net/qq_35751014/category_9722459.html

一、Java IO概述

1、Netty介绍和应用场景

1.1、Netty介绍

  1. Netty是由JBOSS提供的一个Java开源框架,现为Github上的独立项目
  2. Netty是一个异步的、基于事件驱动的网络应用框架,用以快速开发高性能、高可靠性的网络IO程序
  3. Netty主要针对在TCP协议下,面向Clients端的高并发应用,或者Peer-to-Peer场景下的大量数据持续传输的应用。
  4. Netty本质是一个NIO框架,适用于服务器通讯相关的多种应用场景
  5. 要透彻理解Netty , 需要先学习 NIO , 这样我们才能阅读 Netty 的源码。

    1.2、Netty的应用场景

  • 互联网行业
    • 分布式系统中,各个节点之间需要远程服务调用,高性能的RPC框架必不可少,Netty作为异步高性能的通信框架,往往作为基础通信组件被这些RPC框架使用
    • 典型的应用有:阿里分布式服务框架DubboRPC框架使用Dubbo协议进行节点间通信,Dubbo协议进行节点间通信,Dubbo协议默认使用Netty作为基础通信组件,用于实现各进程节点之间的内部通信Netty - 图2
  • 游戏行业
    • 无论是手游服务端还是大型的网络游戏,Java 语言得到了越来越广泛的应用
    • Netty 作为高性能的基础通信组件,提供了 TCP/UDPHTTP 协议栈,方便定制和开发私有协议栈,账号登录服务器
    • 地图服务器之间可以方便的通过 Netty 进行高性能的通信
  • 大数据领域

    • 经典的 Hadoop的高性能通信和序列化组件AvroRPC 框架,默认采用 Netty 进行跨界点通信
    • 它的 Netty Service 基于 Netty 框架二次封装实现。
      Netty - 图3

      2、Java IO模型介绍

      2.1、I/O模型基本说明

  • I/O 模型简单的理解:就是用什么样的通道进行数据的发送和接收,很大程度上决定了程序通信的性能

  • Java共支持3种网络编程模型IO模式:BIO、NIO、AIO
  • Java BIO : 同步并阻塞(传统阻塞型),服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销
    Netty - 图4
  • Java NIO同步非阻塞,服务器实现模式为一个线程处理多个请求(连接),即客户端发送的连接请求都会注册到多路复用器上,多路复用器轮询到连接有I/O请求就进行处理
    Netty - 图5
  • Java AIO(NIO.2)异步非阻塞AIO 引入异步通道的概念,采用了 Proactor 模式,简化了程序编写,有效的请求才启动线程,它的特点是先由操作系统完成后才通知服务端程序启动线程去处理,一般适用于连接数较多且连接时间较长的应用

    2.2、I/O模型使用场景分析

  • BIO方式适用于连接数目比较小且固定的架构,这种方式对服务器资源要求比较高,并发局限于应用中,JDK1.4以前的唯一选择,但程序简单易理解。

  • NIO方式适用于连接数目多且连接比较短(轻操作)的架构,比如聊天服务器,弹幕系统,服务器间通讯等。编程比较复杂,JDK1.4开始支持。
  • AIO方式使用于连接数目多且连接比较长(重操作)的架构,比如相册服务器,充分调用OS参与并发操作,编程比较复杂,JDK7开始支持。

    3、BIO 工作机制

    Netty - 图6

    3.1、BIO编程简单流程(Socket编程)

  • 服务器端启动一个ServerSocket

  • 客户端启动Socket对服务器进行通信,默认情况下服务器端需要对每个客户 建立一个线程与之通讯
  • 客户端发出请求后, 先咨询服务器是否有线程响应,如果没有则会等待,或者被拒绝
  • 如果有响应,客户端线程会等待请求结束后,在继续执行

    3.2、BIO 应用实例

    实例说明

  • 使用BIO模型编写一个服务器端,监听6666端口,当有客户端连接时,就启动一个线程与之通讯。

  • 要求使用线程池机制改善,可以连接多个客户端.
  • 服务器端可以接收客户端发送的数据(通过cmdtelnet 方式即可)。

    实例代码

    1. public class BIOServer {
    2. public static void main(String[] args) throws IOException {
    3. //1、创建一个线程池
    4. //2、如果有客户端连接,就创建一个线程,与之通讯(单独写一个方法)
    5. ExecutorService executorService = Executors.newCachedThreadPool();
    6. //创建ServerSocket
    7. ServerSocket serverSocket = new ServerSocket(6666);
    8. System.out.println("服务器启动了");
    9. while (true) {
    10. System.out.println("线程信息:id= "+ Thread.currentThread().getId() + "; 线程名字:" + Thread.currentThread().getName());
    11. //监听,等待客户端连接
    12. System.out.println("等待连接");
    13. final Socket socket = serverSocket.accept();
    14. System.out.println("连接到一个客户端");
    15. //创建一个线程,与之通讯
    16. executorService.execute(() -> {
    17. //重写Runnable方法,与客户端进行通讯
    18. handler(socket);
    19. });
    20. }
    21. }
    22. //编写一个Handler方法,和客户端通讯
    23. public static void handler(Socket socket) {
    24. try {
    25. System.out.println("线程信息:id= "+ Thread.currentThread().getId() + "; 线程名字:" + Thread.currentThread().getName());
    26. byte[] bytes = new byte[1024];
    27. //通过socket获取输入流
    28. InputStream inputStream = socket.getInputStream();
    29. //循环的读取客户端发送的数据
    30. while (true){
    31. System.out.println("线程信息:id= "+ Thread.currentThread().getId() + "; 线程名字:" + Thread.currentThread().getName());
    32. System.out.println("read....");
    33. int read = inputStream.read(bytes);
    34. if (read != -1){
    35. System.out.println(new String(bytes, 0, read));//输出客户端发送的数据
    36. } else {
    37. break;
    38. }
    39. }
    40. } catch (IOException e) {
    41. e.printStackTrace();
    42. } finally {
    43. System.out.println("关闭和client的连接");
    44. try {
    45. socket.close();
    46. } catch (IOException e) {
    47. e.printStackTrace();
    48. }
    49. }
    50. }
    51. }

    服务端主线程会阻塞在 serverSocket.accept() 这个方法处,当有新的客户端发起请求时,主线程通过线程池调用新线程与其通信,每个通信线程会阻塞在 socket.getInputStream() 这个方法处。这就是阻塞这两个字的含义所在

BIO 问题分析

  • 每个请求都需要创建独立的线程,与对应的客户端进行数据 Read,业务处理,数据 Write
  • 当并发数较大时,需要创建大量线程来处理连接,系统资源占用较大。
  • 连接建立后,如果当前线程暂时没有数据可读,则线程就阻塞在 Read 操作上,造成线程资源浪费

    4、NIO编程

    4.1、NIO基本介绍

  • Java NIO 全称 java non-blocking IO,是指 JDK 提供的新 API。从 JDK1.4 开始,Java 提供了一系列改进的输入/输出的新特性,被统称为 NIO(即 New IO),是同步非阻塞

  • NIO 相关类都被放在 java.nio 包及子包下,并且对原 java.io 包中的很多类进行改写。
    Netty - 图7
  • NIO 有三大核心部分:Channel(通道)Buffer(缓冲区), Selector(选择器)
  • NIO是 面向冲区 ,或者面向 编程的。数据读取到一个它稍后处理的缓冲区,需要时可在缓冲区中前后移动,这就增加了处理过程中的灵活性,使用它可以提供非阻塞式的高伸缩性网络
  • Java NIO的非阻塞模式,使一个线程从某通道发送请求或者读取数据,但是它仅能得到目前可用的数据,如果目前没有数据可用时,就什么都不会获取,而不是保持线程阻塞,所以直至数据变的可以读取之前,该线程可以继续做其他的事情。 非阻塞写也是如此,一个线程请求写入一些数据到某通道,但不需要等待它完全写入,这个线程同时可以去做别的事情。
  • 通俗理解:NIO是可以做到用一个线程来处理多个操作的。假设有10000个请求过来,根据实际情况,可以分配50或者100个线程来处理。不像之前的阻塞IO那样,非得分配10000个。
  • HTTP2.0使用了多路复用的技术,做到同一个连接并发处理多个请求,而且并发请求的数量比HTTP1.1大了好几个数量级。

    4.2、NIO 和 BIO 的比较

  • BIO 以流的方式处理数据,而 NIO 以块的方式处理数据,块 I/O 的效率比流 I/O 高很多

  • BIO 是阻塞的,NIO 则是非阻塞的
  • BIO基于字节流和字符流进行操作,而 NIO 基于 Channel(通道)和 Buffer(缓冲区)进行操作,数据总是从通道读取到缓冲区中,或者从缓冲区写入到通道中。Selector(选择器)用于监听多个通道的事件(比如:连接请求,数据到达等),因此使用单个线程就可以监听多个客户端通道

    二、NIO详解

    关键词:Buffer、Channel、SelectionKey、Selector、事件
    Buffer:

  • 缓存数组,就是一个内存块,底层用数组实现

  • Channel进行数据的读写。
  • 数据的读取写入是通过Buffer, 这个和BIO 一样, 而BIO 中要么是输入流,或者是输出流, 不能双向,但是NIOBuffer 是可以读也可以写, 需要 flip 方法切换。

Channel:

  • 通信通道,每个客户端连接都会建立一个Channel通道
  • 我的理解是:客户端直接与Channel进行通信,当客户端发送消息时,消息就流通到Channel里面,本地程序需要将Channel里面的数据存放在Buffer里面,才可以查看;当本地需要发送消息时,先把消息存在Buffer里面,再将Buffer里面的数据放入Channel,数据就流通到了客户端
  • 总而言之:Buffer就是本地程序与Channel数据交换的一个中间媒介。

Netty - 图8
SelectionKey、Selector:

  • NIO之所以是非阻塞的,关键在于它一个线程可以同时处理多个客户端的通信。而Selector就是它一个线程如何处理多个客户端通信的关键,一个Selector就对应一个线程

  • 首先在创建与客户端连接的Channel时,应该调用 Channel.register()方法,将Channel注册到一个Selector上面。调用该方法后,会返回一个SelectionKey对象,该对象与Channel是一一对应的。而Selector则通过管理SelectionKey的集合间接的去管理各个Channel。示例图如下:

Netty - 图9

  • Selector具体是如何管理这么多个通信的呢?这就引出了事件

事件、以及NIO的工作流程介绍

  • 事件:当将Channel绑定到Selector上面时,必须同时为该Channel声明一个监听该Channel的事件(由Channel和该Channel的事件一起组成了SelectionKey),并将SelectionKey加入到Selector的Set集合中去
  • 当有客户端建立连接或者进行通信,会在对应的各个Channel中产生不同的事件。
  • Selector会一直监听所有的事件,当他监听到某个SelectionKey中有事件产生时,会将所有产生事件的SelectionKey统一加入到一个集合中去
  • 而我们则需要获取到这个集合,首先对集合中的各个SelectionKey进行判断,判断它产生的是什么事件,再根据不同的事件进行不同的处理。
  • 在操作这个SelectionKey集合的时候,其实我们就是在一个线程里面对几个不同客户端的连接进行操作。具体的关系图如下:

    Netty - 图10

    1、缓冲区(Buffer)

    1.1、基本介绍

    缓冲区(Buffer):缓冲区本质上是一个可以读写数据的内存块,可以理解成是一个容器对象(含数组),该对象提供了一组方法,可以更轻松地使用内存块,缓冲区对象内置了一些机制,能够跟踪和记录缓冲区的状态变化情况。Channel提供从文件、网络读取数据的渠道,但是读取或写入的数据都必须经由Buffer。
    Netty - 图11

    1.2、Buffer类介绍

    Netty - 图12

  • 基类是Buffer抽象类

  • 基类派生出基于基本数据类型的7个xxxBuffer 抽象类,没有boolean相关的buffer类。
  • 除了ByteBuffer外,每个基本数据的抽象类 xxxBuffer 类下面都派生出转向 ByteBuffer 的类 ByteBufferXxxAsBufferL 和 ByteBufferAsXxxBufferB实现类;以及 DirectXxxBufferU 和 DirectXxxBufferS 和 HeapXxxBuffer==(具体实例对象类)==这五个类。
  • 就只有抽象类CharBuffer 派生出了第六个类StringCharBuffer。
  • ByteBuffer只派生出了 HeapByteBuffer 和 MappedByteBufferR 两个类
  • 类图如下:

Netty - 图13

1.2.1、Buffer类主要属性

属性 描述
Capacity 容量,即可以容纳的最大数据量;在缓冲区创建时被设定并且不能改变
Limit 表示缓冲区的当前终点,不能对缓冲区超过极限的位置进行读写操作。且极限是可以修改的
Position 位置,下一个要被读或写的元素的索引,每次读写缓冲区数据时都会改变改值,为下次读写作准备
Mark 标记 ,一般不会主动修改,在flip()被调用后,mark就作废了