一:异步

1. 到底解放了谁?

从基础的同步说起

要说解放了谁,一定得有几个参与者,举个例子:当你的主线程读取一个应用程序之外的资源时,它有可能是一个文件,又有可能是一个外部服务,当用同步方式读取外部服务时,首先主线程会从用户模式进入到内核模式,在内核模式中windows会将你的请求数据交给对应的网络驱动程序,继后会让这个线程进入休眠状态,当网络驱动程序和外部服务一阵痉挛之后,网络驱动程序会将获取到的结果交给当初休眠的线程,windows唤醒休眠线程继而执行后续的C#代码,画个简图理解一下,不一定全对。
同步异步多线程三者关系 - 图1
这里就存在着一个非常大的问题,步骤4-步骤7之间,你的主线程一直都是休眠状态,比如在GUI编程中,有一个重要的原则就是解放你的UI线程(主线程),所以解决这个问题就迫在眉睫。

异步方式下的处理方案

说到这里,大家应该知道了异步方式就是为了解放主线程,又可以叫调用线程,没错,接下来看一下同样的场景在异步中如何处理的。
同步异步多线程三者关系 - 图2
从图中可以看到,步骤三中将thread数据交给网络驱动程序之后,该thread就直接返回不管了,当后续网络驱动程序获取数据后,将数据丢给CLR线程池中的IO线程再由它触发你的回调函数。

总结

异步相比同步效率高就高在解放了调用线程,在驱动程序和远程服务RoundTrip期间,调用线程还可以执行其他工作,放在GUI上就是主线程可以继续响应用户的超敏操作。 由于没有空转的线程,CPU可以得到最满载的运转,更少的线程就有更少的线程栈空间,更少的GC回收时间和上下文切换。

2. 代码演示

还是那句话,光说可不行,你得上一点代码看看,有了上面的理论基础,这里我就模拟爬取下博客园首页的所有文章的用户头像。

同步代码

  1. public static void Main(string[] args)
  2. {
  3. SingleThreadDownloadImages();
  4. Console.WriteLine("主线程继续执行其他的咯~~~");
  5. Console.Read();
  6. }
  7. public static void SingleThreadDownloadImages()
  8. {
  9. using (var client = new HttpClient())
  10. {
  11. //调用线程 空转等待。。。
  12. var content = client.GetStringAsync("http://cnblogs.com").Result;
  13. var html = new HtmlDocument();
  14. html.LoadHtml(content);
  15. var imgsrcList = html.DocumentNode.QuerySelectorAll("img.pfs").Select(m => m.Attributes["src"].Value)
  16. .ToList();
  17. Console.WriteLine($"准备下载:{imgsrcList.Count}个...");
  18. for (int i = 0; i < imgsrcList.Count; i++)
  19. {
  20. //调用线程 空转等待。。。
  21. var stream = client.GetStreamAsync(imgsrcList[i]).Result;
  22. Image.FromStream(stream).Save($@"C:\2\{i}.jpg");
  23. }
  24. }
  25. Console.WriteLine("SingleThreadDownloadImages 执行结束");
  26. }
  27. ------ output ------
  28. 准备下载:19个...
  29. SingleThreadDownloadImages 执行结束
  30. 主线程继续执行其他的咯~~~

异步代码

  1. public static void Main(string[] args)
  2. {
  3. AsyncDownloadImages();
  4. Console.WriteLine("主线程继续执行其他的咯~~~");
  5. Console.Read();
  6. }
  7. public static async void AsyncDownloadImages()
  8. {
  9. using (var client = new HttpClient())
  10. {
  11. var content = await client.GetStringAsync("http://cnblogs.com");
  12. var html = new HtmlDocument();
  13. html.LoadHtml(content);
  14. var imgsrcList = html.DocumentNode.QuerySelectorAll("img.pfs").Select(m => m.Attributes["src"].Value)
  15. .ToList();
  16. Console.WriteLine($"准备下载:{imgsrcList.Count}个...");
  17. for (int i = 0; i < imgsrcList.Count; i++)
  18. {
  19. var stream = await client.GetStreamAsync(imgsrcList[i]);
  20. Image.FromStream(stream).Save($@"C:\2\{i}.jpg");
  21. }
  22. Console.WriteLine("AsyncDownloadImages 执行结束");
  23. }
  24. }
  25. ------ output ------
  26. 主线程继续执行其他的咯~~~
  27. 准备下载:19个...
  28. AsyncDownloadImages 执行结束

从结果可以看出,异步在获取图片期间,主线程还可以做其他事情,这就是异步最大的特点。

3. windbg 提取是否真为线程池io线程

其实在图2中我口口声声的说是线程池中的IO线程回调了你的函数,大家先要明白一个概念,线程池中有两种类别的线程,一个是工作线程,一个是IO线程,而工作线程常常就是我们通过代码进行操控,IO线程通常由底层CLR接管,常常用于处理外部资源的操作,如下ThreadPool的GetMaxThreads方法。

  1. public static void GetMaxThreads(out int workerThreads, out int completionPortThreads);

有了这个基础,再将 AsyncDownloadImages方法修改如下,抓取一下dump文件

  1. var content = await client.GetStringAsync("http://cnblogs.com");
  2. Console.WriteLine($"已获取到:{content.Length}个字符");
  3. Console.ReadLine();

~*e !clrstack 查看所有托管线程的调用堆栈

  1. 0:000> ~*e !clrstack
  2. OS Thread Id: 0x62d8 (13)
  3. Child SP IP Call Site
  4. 000000da9b1fd1e8 00007ff9fc7bb4f4 [GCFrame: 000000da9b1fd1e8]
  5. 000000da9b1fd308 00007ff9fc7bb4f4 [GCFrame: 000000da9b1fd308]
  6. 000000da9b1fd368 00007ff9fc7bb4f4 [HelperMethodFrame_1OBJ: 000000da9b1fd368] System.Threading.Monitor.Enter(System.Object)
  7. 000000da9b1fd460 00007ff9e42f8aff System.IO.TextReader+SyncTextReader.ReadLine()
  8. 000000da9b1fd4c0 00007ff9e40f0d98 System.Console.ReadLine()
  9. 000000da9b1fd4f0 00007ff985c81559 ConsoleApp2.Program+d__3.MoveNext() [C:\dream\Csharp\ConsoleApp1\ConsoleApp2\Program.cs @ 93]
  10. 000000da9b1fd690 00007ff9e388cef2 System.Threading.ExecutionContext.RunInternal(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object, Boolean)
  11. 000000da9b1fd760 00007ff9e388cd75 System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object, Boolean)
  12. 000000da9b1fd790 00007ff9e38fbe2f System.Runtime.CompilerServices.AsyncMethodBuilderCore+MoveNextRunner.Run()
  13. 000000da9b1fd7e0 00007ff9e3901343 System.Threading.Tasks.AwaitTaskContinuation.RunOrScheduleAction(System.Action, Boolean, System.Threading.Tasks.Task ByRef)
  14. 000000da9b1fd830 00007ff9e3865f40 System.Threading.Tasks.Task.FinishContinuations()
  15. 000000da9b1fd8c0 00007ff9e3865a88 System.Threading.Tasks.Task`1[[System.__Canon, mscorlib]].TrySetResult(System.__Canon)
  16. 000000da9b1fd900 00007ff9e3865a05 System.Threading.Tasks.TaskCompletionSource`1[[System.__Canon, mscorlib]].TrySetResult(System.__Canon)
  17. 000000da9b1fd940 00007ff9c88311a3 System.Net.Http.HttpClient+c__DisplayClass31_0`1[[System.__Canon, mscorlib]].b__1(System.Threading.Tasks.Task`1)
  18. 000000da9b1fd990 00007ff9e38f9d47 System.Threading.Tasks.Task.Execute()
  19. 000000da9b1fd9d0 00007ff9e388cef2 System.Threading.ExecutionContext.RunInternal(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object, Boolean)
  20. 000000da9b1fdaa0 00007ff9e388cd75 System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object, Boolean)
  21. 000000da9b1fdad0 00007ff9e38fa001 System.Threading.Tasks.Task.ExecuteWithThreadLocal(System.Threading.Tasks.Task ByRef)
  22. 000000da9b1fdb80 00007ff9e38f96e1 System.Threading.Tasks.Task.ExecuteEntry(Boolean)

!threads 查看编号13的线程类型

  1. 0:013> !threads
  2. ThreadCount: 8
  3. UnstartedThread: 0
  4. BackgroundThread: 5
  5. PendingThread: 0
  6. DeadThread: 2
  7. Hosted Runtime: no
  8. Lock
  9. ID OSID ThreadOBJ State GC Mode GC Alloc Context Domain Count Apt Exception
  10. 0 1 5754 000001e2be060f80 2a020 Preemptive 000001E2BFD19868:000001E2BFD19FD0 000001e2be053bb0 1 MTA
  11. 6 2 65e0 000001e2be08bd00 2b220 Preemptive 0000000000000000:0000000000000000 000001e2be053bb0 0 MTA (Finalizer)
  12. 9 3 25c 000001e2d8435ef0 102a220 Preemptive 0000000000000000:0000000000000000 000001e2be053bb0 0 MTA (Threadpool Worker)
  13. XXXX 4 0 000001e2d845ea30 1039820 Preemptive 0000000000000000:0000000000000000 000001e2be053bb0 0 Ukn (Threadpool Worker)
  14. 12 6 23fc 000001e2d8469ea0 202b220 Preemptive 000001E2BFD1E188:000001E2BFD1FFD0 000001e2be053bb0 1 MTA
  15. 13 7 62d8 000001e2d8475e20 a029220 Preemptive 000001E2BFD9D588:000001E2BFD9F250 000001e2be053bb0 0 MTA (Threadpool Completion Port)
  16. XXXX 8 0 000001e2d847a0b0 8039820 Preemptive 0000000000000000:0000000000000000 000001e2be053bb0 0 Ukn (Threadpool Completion Port)
  17. 14 9 6e4 000001e2d847de70 8029220 Preemptive 000001E2BFD80D88:000001E2BFD81F10 000001e2be053bb0 0 MTA (Threadpool Completion Port)

其中的 13 7 62d8 000001e2d8475e20 a029220 Preemptive 000001E2BFD9D588:000001E2BFD9F250 000001e2be053bb0 0 MTA (Threadpool Completion Port) 可以明显的看到是 Threadpool Completion Port,没有骗你吧,😄。

二:多线程

相比单线程,多线程用更多的CPU和更多的线程资源换取更快的计算时间,是一种经典的空间换时间策略,代码就不上了,相信多线程大家都快用烂了。

三:总结

1. 多线程比单线程高效的原因就是利用了CPU的多核计算把一个大的任务分而治之从而加速任务计算。

2. 异步比同步高效的原因是前者释放了调用线程,让调用线程可以做更多的事情而不至于被windows强制休眠浪费线程资源。

原文地址:https://mp.weixin.qq.com/s/t8T5IrSze_sKrukbE0qqnQ