.NET异步编程知多少

1. 引言

最近在学习Abp框架,发现Abp框架的很多Api都提供了同步异步两种写法。异步编程说起来,大家可能都会说异步编程性能好。但好在哪里,引入了什么问题,以及如何使用,想必也未必能答的上来。
自己对异步编程也不是很了解,今天就以学习的目的,来梳理下同步异步编程的基础知识,然后再来介绍下如何使用async/await进行异步编程。下图是一张大纲,具体可查看脑图分享链接
.NET 异步编程 - 图1
脑图摘要

2. 同步异步编程

同步编程是对于单线程来说的,就像我们编写的控制台程序,以main方法为入口,顺序执行我们编写的代码。
异步编程是对于多线程来说的,通过创建不同线程来实现多个任务的并行执行。

3. 线程

.Net 1.0就发布了System.Threading,其中提供了许多类型(比如Thread、ThreadStart等)可以显示的创建线程。
说到Thread,我们需要了解以下几个概念:

3.1. 什么是主线程

每一个Windows进程都恰好包含一个用作程序入口点的主线程。进程的入口点创建的第一个线程被称为主线程。.Net执行程序(控制台、Windows Form、Wpf等)使用Main()方法作为程序入口点。当调用该方法时,主线程被创建。

3.2. 什么是工作者线程

由主线程创建的线程,可以称为工作者线程,用来去执行某项具体的任务。
.NET 异步编程 - 图2

3.3. 什么是前台线程

默认情况下,使用Thread.Start()方法创建的线程都是前台线程。前台线程能阻止应用程序的终结,只有所有的前台线程执行完毕,CLR才能关闭应用程序(即卸载承载的应用程序域)。前台线程也属于工作者线程。

3.4. 什么是后台线程

后台线程不会影响应用程序的终结,当所有前台线程执行完毕后,后台线程无论是否执行完毕,都会被终结。一般后台线程用来做些无关紧要的任务(比如邮箱每隔一段时间就去检查下邮件,天气应用每隔一段时间去更新天气)。后台线程也属于工作者线程。
说了这么多概念不如来段代码:

  1. //主线程入口
  2. static void Main(string[] args)
  3. {
  4. Console.WriteLine("主线程开始!");
  5. //创建前台工作线程
  6. Thread t1 = new Thread(Task1);
  7. t1.Start();
  8. //创建后台工作线程
  9. Thread t2= new Thread(new ParameterizedThreadStart(Task2));
  10. t2.IsBackground = true;//设置为后台线程
  11. t2.Start("传参");
  12. }
  13. private static void Task1()
  14. {
  15. Thread.Sleep(1000);//模拟耗时操作,睡眠1s
  16. Console.WriteLine("前台线程被调用!");
  17. }
  18. private static void Task2(object data)
  19. {
  20. Thread.Sleep(2000);//模拟耗时操作,睡眠2s
  21. Console.WriteLine("后台线程被调用!" + data);
  22. }

.NET 异步编程 - 图3
执行发现,【后台线程被调用】将不会显示。因为当所有的前台线程执行完毕后,应用程序就关闭了,不会等待所有的后台线程执行完毕,所以不会显示。

4. ThreadPool(线程池)

线程池是为突然大量爆发的线程设计的,通过有限的几个固定线程为大量的操作服务,减少了创建和销毁线程所需的时间,从而提高效率,这也是线程池的主要好处。
ThreadPool适用于并发运行若干个任务且运行时间不长且互不干扰的场景。
还有一点需要注意,通过线程池创建的任务是后台任务。
举个例子:

  1. //主线程入口
  2. static void Main(string[] args)
  3. {
  4. Console.WriteLine("主线程开始!");
  5. //创建要执行的任务
  6. WaitCallback workItem = state => Console.WriteLine("当前线程Id为:" + Thread.CurrentThread.ManagedThreadId);
  7. //重复调用10次
  8. for (int i = 0; i < 10; i++)
  9. {
  10. ThreadPool.QueueUserWorkItem(workItem);
  11. }
  12. Console.ReadLine();
  13. }

.NET 异步编程 - 图4
执行结果

从图中可以看出,程序并没有每次执行任务都创建新的线程,而是循环利用线程池中维护的线程。
如果去掉最后一句Consoler.ReadLine(),会发现程序仅输出【主线程开始!】就直接退出,从而确定ThreadPool创建的线程都是后台线程。

5. System.Threading.Tasks

.Net 4.0引入了System.Threading.Tasks,简化了我们进行异步编程的方式,而不用直接与线程和线程池打交道。
System.Threading.Tasks中的类型被称为任务并行库(TPL)。TPL使用CLR线程池(说明使用TPL创建的线程都是后台线程)自动将应用程序的工作动态分配到可用的CPU中。

5.1. Parallel(数据并行)

数据并行是指使用Parallel.For()或Parallel.ForEach()方法以并行方式对数组或集合中的数据进行迭代。
看怎么用:

  1. ParallelLoopResult result = Parallel.For(0, 10000, i => {
  2. Console.WriteLine("{0}, task: {1} , thread: {2}", i, Task.CurrentId, Thread.CurrentThread.ManagedThreadId);
  3. });

5.2. PLINQ(并行LINQ查询)

为并行运行而设计的LINQ查询为PLINQ。System.Linq命名空间的ParallelEnumerable中包含了一些扩展方法来支持PINQ查询。
使用举例:

  1. int[] modThreeIsZero = (from num in source.AsParallel()
  2. where num % 3 == 0
  3. orderby num descending
  4. select num).ToArray();

5.3. Task

Task,字面义,任务。使用Task类可以轻松地在次线程中调用方法。

  1. static void Main(string[] args)
  2. {
  3. Console.WriteLine("主线程ID:" + Thread.CurrentThread.ManagedThreadId);
  4. Task.Factory.StartNew(() => Console.WriteLine("Task对应线程ID:" + Thread.CurrentThread.ManagedThreadId));
  5. Console.ReadLine();
  6. }

.NET 异步编程 - 图5

可以看见,使用Task我们不必理会具体线程的创建。
我们也可以使用.NET 4.5引入的Task.Run静态方法来启动一个线程。

  1. static void Main(string[] args)
  2. {
  3. Console.WriteLine("主线程ID:" + Thread.CurrentThread.ManagedThreadId);
  4. Task.Run(() => Console.WriteLine("Task对应线程ID:" + Thread.CurrentThread.ManagedThreadId));
  5. Console.ReadLine();
  6. }

Task类提供了Wait()方法,用来等待线程task执行完毕。

5.4. Task

Task是Task的泛型版本,可以接收一个返回值。

  1. static void Main(string[] args)
  2. {
  3. Console.WriteLine("主线程ID:" + Thread.CurrentThread.ManagedThreadId);
  4. Task<string> task = Task.Run(() =>
  5. {
  6. return Thread.CurrentThread.ManagedThreadId.ToString();
  7. });
  8. Console.WriteLine("创建Task对应的线程ID:" + task.Result);
  9. Console.ReadLine();
  10. }

.NET 异步编程 - 图6
Task提供了很多方法,帮助我们进行异步任务。了解更多,可参考MSDN

5.5. async/await 特性

C# async关键字用来指定某个方法、Lambda表达式或匿名方法自动以异步的方式来调用。
咱们先来看一个具体的示例吧。

  1. private static void Main(string[] args)
  2. {
  3. Console.WriteLine("主线程启动,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  4. var task = GetLengthAsync();
  5. Console.WriteLine("回到主线程,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  6. Console.WriteLine("线程[" + Thread.CurrentThread.ManagedThreadId + "]睡眠5s:");
  7. Thread.Sleep(5000); //将主线程睡眠5s
  8. var timer = new Stopwatch();
  9. timer.Start(); //开始计算时间
  10. Console.WriteLine("task的返回值是" + task.Result);
  11. timer.Stop(); //结束点,另外stopwatch还有Reset方法,可以重置。
  12. Console.WriteLine("等待了:" + timer.Elapsed.TotalSeconds + "秒"); //显示时间
  13. Console.WriteLine("主线程结束,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  14. }
  15. private static async Task<int> GetLengthAsync()
  16. {
  17. Console.WriteLine("GetLengthAsync()开始执行,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  18. var str = await GetStringAsync();
  19. Console.WriteLine("GetLengthAsync()执行完毕,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  20. return str.Length;
  21. }
  22. private static Task<string> GetStringAsync()
  23. {
  24. Console.WriteLine("GetStringAsync()开始执行,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  25. return Task.Run(() =>
  26. {
  27. Console.WriteLine("异步任务开始执行,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  28. Console.WriteLine("线程[" + Thread.CurrentThread.ManagedThreadId + "]睡眠10s:");
  29. Thread.Sleep(10000); //将异步任务线程睡眠10s
  30. Console.WriteLine("GetStringAsync()执行完毕,当前线程为:" + Thread.CurrentThread.ManagedThreadId);
  31. return "GetStringAsync()执行完毕";
  32. });
  33. }

.NET 异步编程 - 图7
执行结果
是不是对执行结果感到惊讶?惊讶是对的,且听我们下面娓娓道来。

  1. 被async标记的方法,意味着可以在方法内部使用await,这样该方法将会在一个await point(等待点)处被挂起,并且在等待的实例完成后该方法被异步唤醒。【注意:await point(等待点)处被挂起,并不是说在代码中使用await SomeMethodAsync()处就挂起,而是在进入SomeMethodAsync()真正执行异步任务时被挂起,切记,切记!!!】
  2. async标记的方法,返回值类型为voidTaskTask<T>
  3. 被async标记的方法,方法的执行结果或者任何异常都将直接反映在返回类型中。
  4. 不是被async标记的方法,就会被异步执行,刚开始都是同步开始执行。换句话说,方法被async标记不会影响方法是同步还是异步的方式完成运行。事实上,async使得方法能被分解成几个部分,一部分同步运行,一些部分可以异步的运行(而这些部分正是使用await显示编码的部分),从而使得该方法可以异步的完成。
  5. await关键字告诉编译器在async标记的方法中插入一个可能的挂起/唤醒点。 逻辑上,这意味着当你写await someMethod();时,编译器将生成代码来检查someMethod()代表的操作是否已经完成。如果已经完成,则从await标记的唤醒点处继续开始同步执行;如果没有完成,将为等待的someMethod()生成一个continue委托,当someMethod()代表的操作完成的时候调用continue委托。这个continue委托将控制权重新返回到async方法对应的await唤醒点处。
    返回到await唤醒点处后,不管等待的someMethod()是否已经经完成,任何结果都可从Task中提取,或者如果someMethod()操作失败,发生的任何异常随Task一起返回或返回给SynchronizationContext

从第4点可以解释为什么上面的demo当调用GetLengthAsync();方法时,输出GetLengthAsync()开始执行,当前线程为:1
从第1点可以解释调用await GetStringAsync();后,为什么程序会继续同步执行输出GetStringAsync()开始执行,当前线程为:1
当执行到Task.Run的时候,就回到了主线程,从而输出回到主线程,当前线程为:1,这说明Task.Run就是我们所说的await point(等待点)。紧接着代码将主线程睡眠5s,这时异步任务可不会歇啊,所以会输出异步任务开始执行,当前线程为:3
紧接着为了模拟异步任务耗时,我们在异步任务中调用Thread.Sleep(10000)将异步任务睡眠10s。
同样异步任务睡眠的时候,不会影响到我们的同步任务,主线程睡眠5s后,要去输出task.Result,这时异步任务还没有执行完毕,所以主线程会等待,直到结果返回,当异步任务完成后会输出GetStringAsync()执行完毕,当前线程为:3
从第5点可以解释,await等待异步任务完成后,GetLengthAsync()方法被异步唤醒,从而异步执行后续代码而输出GetLengthAsync()执行完毕,当前线程为:3
代码中我们用StopWatch来计算大致等待了多久,从结果看等待了5.0004334秒,符合预期(异步线程睡眠了10s,主线程睡眠了5s,两个线程是并行运行的,所以大致耗时应该为10s - 5s = 5s)。
那为什么执行到task.Result时,主线程会等待呢,你可能会说异步任务没有完成。
那异步任务没有完成不应该影响主线程的继续执行啊,那主线程究竟是被谁挂起进行等待的呢?
首先Task和Task是awaitable的,这里就要理解下awaitable这个概念,详参await anything,这里就不再赘述(讲清楚估计得另开一篇)。
这里就暂且把awaitable理解为可等待的,就是说如果这个task没执行完毕,在去取结果的时候它就会等待。
我们直接来看一下看下源码吧:.NET 异步编程 - 图8
.NET 异步编程 - 图9
从代码中我们可以清楚看见,在去取task的返回值时,程序回去判断对应的任务是否执行完毕(IsCompleted),若没有则继续等待,也就是在InternalWait方法中执行等待,而InternalWait方法中指定等待的方式为TaskWaitBehavior.Synchronous也就是同步等待,所以就会挂起主线程。
其实task.Wait()也是类似的逻辑,会同步阻塞主线程去等待异步线程执行完毕。
那我们就可以这样理解task.Result,task.Result相当于执行task.Wait();后再去取值task.Result;

6. 总结

本文主要梳理了以下几点:

  1. 默认创建的Thread是前台线程,创建的Task为后台线程。
  2. ThreadPool创建的线程都是后台线程。
  3. 任务并行库(TPL)使用的是线程池技术。
  4. 调用async标记的方法,刚开始是同步执行的,只有当执行到await标记的方法中的异步任务时,才会挂起。

异步编程的水很深,标题起大了,有很多知识点没有讲全讲到。
文章中所写是个人理解,难免有纰漏之处,请大家以怀疑的精神阅读此文,也恳请大家多多指教!!!

参考自: Async/Await FAQ await anything Async/Await异步编程中的最佳做法