一、基本介绍

  1. 零拷贝是网络编程的关键,很多性能优化都离不开。
  2. 在 Java 程序中,常用的零拷贝有 mmap(内存映射)和 sendFile。那么,他们在 OS 里,到底是怎么样的一个的设计?我们分析 mmap 和 sendFile 这两个零拷贝。
  3. 另外我们看下 NIO 中如何使用零拷贝。

    二、传统IO数据读写

    Java 传统 IO 和网络编程的一段代码 ```java File file = new File(“test.txt”); RandomAccessFile raf = new RandomAccessFile(file, “rw”);

byte[] arr = new byte[(int) file.length()]; raf.read(arr);

Socket socket = new ServerSocket(8080).accept(); socket.getOutputStream().write(arr);

  1. <a name="n8A74"></a>
  2. # 三、传统的IO模型
  3. ![image.png](https://cdn.nlark.com/yuque/0/2021/png/1460038/1637678626716-fe6a0431-b129-4ca8-a08d-a6aeeadc89b5.png#clientId=u20f51b57-7c82-4&crop=0&crop=0&crop=1&crop=1&from=paste&height=283&id=ufa31f316&margin=%5Bobject%20Object%5D&name=image.png&originHeight=566&originWidth=1178&originalType=binary&ratio=1&rotation=0&showTitle=false&size=155297&status=done&style=none&taskId=uefc8b8a4-28be-4d6f-a0ca-4f262932851&title=&width=589)<br />**DMA**:direct memory access 直接内存拷贝(不使用 CPU)
  4. > 先从 hard drive(硬盘) 通过DMA拷贝到 kernel buffer(内核),经过CPU拷贝到 user buffer(用户数据在这里进行修改),经过 CPU拷贝到 socket buffer,最后经过 DMA拷贝到protocal engline(协议栈)。
  5. 上诉过程,经过四次拷贝,三次状态切换 DMA copy --> cpu copy --> DMA copy
  6. <a name="ORhmB"></a>
  7. # 四、mmap优化
  8. 1. mmap 通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据(可以在这里该用户数据)。这样,在进行网络传输时,就可以减少内核空间到用户空间的拷贝次数。如下图
  9. 1. mmap 示意图
  10. ![image.png](https://cdn.nlark.com/yuque/0/2021/png/1460038/1637679288538-006bbd0b-8dde-4c92-bfd7-93d3de327991.png#clientId=u20f51b57-7c82-4&crop=0&crop=0&crop=1&crop=1&from=paste&height=303&id=u4e28aa91&margin=%5Bobject%20Object%5D&name=image.png&originHeight=606&originWidth=1394&originalType=binary&ratio=1&rotation=0&showTitle=false&size=332328&status=done&style=none&taskId=u087b843a-e0f6-4f4e-8edf-20c48d1d094&title=&width=697)
  11. > 先从 hard drive(硬盘) 通过DMA拷贝到 kernel buffer(内核),经过 CPU拷贝到 socket buffer,最后经过 DMA拷贝到protocal engline(协议栈)。
  12. 由于 mmap可以让 kernel buffer和user buffer 共享数据,所以少了一次拷贝,但是状态的切换还是三次
  13. <a name="IyCLU"></a>
  14. # 五、sendFile 优化
  15. 1. Linux2.1 版本提供了 sendFile 函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到 SocketBuffer,同时,由于和用户态完全无关,就减少了一次上下文切换
  16. 1. 示意图和小结
  17. ![image.png](https://cdn.nlark.com/yuque/0/2021/png/1460038/1637679702632-b33b3f6c-9346-4dd1-800e-5444064cbc3e.png#clientId=u20f51b57-7c82-4&crop=0&crop=0&crop=1&crop=1&from=paste&height=363&id=u7622afeb&margin=%5Bobject%20Object%5D&name=image.png&originHeight=726&originWidth=1154&originalType=binary&ratio=1&rotation=0&showTitle=false&size=337177&status=done&style=none&taskId=u48003f84-7c8c-45cc-b130-42c86544803&title=&width=577)
  18. > 注意:所谓零拷贝是指没有CPU拷贝,但是这里依旧有CPU拷贝
  19. 3. Linux在2.4 版本中,做了一些修改,避免了从内核缓冲区拷贝到 Socketbuffer 的操作,直接拷贝到协议栈,从而再一次减少了数据拷贝。具体如下图和小结:
  20. ![image.png](https://cdn.nlark.com/yuque/0/2021/png/1460038/1637679887130-39ca95d7-77b5-4a31-99b2-bd75770ec8dd.png#clientId=u20f51b57-7c82-4&crop=0&crop=0&crop=1&crop=1&from=paste&height=327&id=ubbd6422d&margin=%5Bobject%20Object%5D&name=image.png&originHeight=654&originWidth=1110&originalType=binary&ratio=1&rotation=0&showTitle=false&size=259277&status=done&style=none&taskId=ud509e84d-ed89-4501-9952-93f54c54347&title=&width=555)
  21. > 这里其实有一次 cpu 拷贝 kernel buffer -> socket buffer 但是,拷贝的信息很少,比如 lenght、offset 消耗低,可以忽略
  22. <a name="oDb7U"></a>
  23. # 六、小总结
  24. <a name="Py7j4"></a>
  25. ## 1、零拷贝的理解
  26. 1. 我们说零拷贝,是从操作系统的角度来说的。因为内核缓冲区之间,没有数据是重复的(只有 kernel buffer 有一份数据)。
  27. 1. 零拷贝不仅仅带来更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的 CPU 缓存伪共享以及无 CPU 校验和计算。
  28. <a name="qQ9Tz"></a>
  29. ## 2、mmap 和 sendFile 的区别
  30. 1. mmap 适合小数据量读写,sendFile 适合大文件传输。
  31. 1. mmap 需要 4 次上下文切换,3 次数据拷贝;sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。
  32. 1. sendFile 可以利用 DMA 方式,减少 CPU 拷贝,mmap 则不能(必须从内核拷贝到 Socket缓冲区)。
  33. <a name="HTmdN"></a>
  34. # 七、零拷贝案例
  35. 案例要求:
  36. 1. 使用传统的 IO 方法传递一个大文件。
  37. 1. 使用 NIO 零拷贝方式传递(transferTo)一个大文件。
  38. 1. 看看两种传递方式耗时时间分别是多少。
  39. <a name="R5Dmi"></a>
  40. ## 1、传统写法
  41. <a name="QaMbK"></a>
  42. ### 服务端
  43. ```java
  44. public class OldIoServer {
  45. public static void main(String[] args) throws IOException {
  46. ServerSocket serverSocket = new ServerSocket(7001);
  47. while (true) {
  48. try {
  49. Socket socket = serverSocket.accept();
  50. BufferedInputStream bufferedInputStream = new BufferedInputStream(socket.getInputStream());
  51. BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(new FileOutputStream("test01.txt"));
  52. byte[] bytes = new byte[1024 * 1024 * 100];
  53. int len;
  54. while ((len = bufferedInputStream.read(bytes)) != -1) {
  55. System.out.println("输出");
  56. bufferedOutputStream.write(bytes, 0, len);
  57. }
  58. bufferedInputStream.close();
  59. bufferedOutputStream.close();
  60. socket.close();
  61. } catch (Exception ex) {
  62. ex.printStackTrace();
  63. }
  64. }
  65. }
  66. }

客户端

  1. public class OldIoClient {
  2. public static void main(String[] args) throws IOException {
  3. Socket socket = new Socket("127.0.0.1", 7001);
  4. BufferedInputStream bufferedInputStream = new BufferedInputStream(new FileInputStream("/Users/superking/Desktop/test1.txt"));
  5. BufferedOutputStream bufferOutPutStream = new BufferedOutputStream(socket.getOutputStream());
  6. byte[] bytes = new byte[1024 * 1024 * 100];
  7. long readCount;
  8. long total = 0;
  9. long startTime = System.currentTimeMillis();
  10. while ((readCount = bufferedInputStream.read(bytes)) >= 0) {
  11. total += readCount;
  12. System.out.println("传输中。。。");
  13. bufferOutPutStream.write(bytes);
  14. }
  15. System.out.println("发送总字节数 " + total + ",耗时:" + (System.currentTimeMillis() - startTime));
  16. bufferOutPutStream.close();
  17. socket.close();
  18. bufferedInputStream.close();
  19. }
  20. }

2、使用 NIO 零拷贝

服务端

  1. public class NewIoServer {
  2. public static void main(String[] args) throws IOException {
  3. ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
  4. ServerSocket serverSocket = serverSocketChannel.socket();
  5. serverSocket.bind(new InetSocketAddress(7001));
  6. ByteBuffer byteBuffer = ByteBuffer.allocate(4096);
  7. BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(new FileOutputStream("test01.txt"));
  8. while (true) {
  9. try {
  10. int readCount = 0;
  11. SocketChannel socketChannel = serverSocketChannel.accept();
  12. while ((readCount = socketChannel.read(byteBuffer)) != -1) {
  13. bufferedOutputStream.write(byteBuffer.array(), 0, readCount);
  14. byteBuffer.rewind(); // 倒带 position = 0, mark 作废
  15. }
  16. } catch (IOException e) {
  17. e.printStackTrace();
  18. }
  19. }
  20. }
  21. }

客户端

  1. public class NewIoClient {
  2. public static void main(String[] args) throws IOException {
  3. SocketChannel socketChannel = SocketChannel.open();
  4. socketChannel.connect(new InetSocketAddress("127.0.0.1", 7001));
  5. FileChannel fileChannel = new FileInputStream("/Users/superking/Desktop/test1.txt").getChannel();
  6. long startTime = System.currentTimeMillis();
  7. // 在linux下的 transferTo 方法就可以完成传输
  8. // 在windows 下 一次调用 transferTo 只能发送 8m,需要分段传输文件
  9. // transferTo底层使用了零拷贝
  10. long count = fileChannel.transferTo(0, fileChannel.size(), socketChannel);
  11. System.out.println("发送总字节数=" + count + ",耗时:" + (System.currentTimeMillis() - startTime));
  12. fileChannel.close();
  13. }
  14. }

3、结论

零拷贝的速度明显快于传统IO。