4.1 等待事件或条件

假设你正在一辆在夜间运行的火车上,在夜间如何在正确的站点下车呢?有一种方法是整晚都要醒着,每停一站都能知道,这样就不会错过你要到达的站点,但会很疲倦。另外,可以看一下时间表,估计一下火车到达目的地的时间,然后在一个稍早的时间点上设置闹铃,然后安心的睡会。这个方法听起来也很不错,也没有错过你要下车的站点,但是当火车晚点时,就要被过早的叫醒了。当然,闹钟的电池也可能会没电了,并导致你睡过站。理想的方式是,无论是早或晚,只要当火车到站的时候,有人或其他东西能把你叫醒就好了。

这和线程有什么关系呢?当一个线程等待另一个线程完成时,可以持续的检查共享数据标志(用于做保护工作的互斥量),直到另一线程完成工作时对这个标识进行重置。不过,这种方式会消耗线程的执行时间检查标识,并且当互斥量上锁后,其他线程就没有办法获取锁,就会持续等待。因为对等待线程资源的限制,并且在任务完成时阻碍对标识的设置。类似于保持清醒状态和列车驾驶员聊了一晚上:驾驶员不得不缓慢驾驶,因为你分散了他的注意力,所以火车需要更长的时间,才能到站。同样,等待的线程会等待更长的时间,也会消耗更多的系统资源。

另外,在等待线程在检查间隙,使用std::this_thread::sleep_for()进行周期性的间歇(详见4.3节):

  1. bool flag;
  2. std::mutex m;
  3. void wait_for_flag()
  4. {
  5. std::unique_lock<std::mutex> lk(m);
  6. while(!flag)
  7. {
  8. lk.unlock(); // 1 解锁互斥量
  9. std::this_thread::sleep_for(std::chrono::milliseconds(100)); // 2 休眠100ms
  10. lk.lock(); // 3 再锁互斥量
  11. }
  12. }

循环中,休眠前②函数对互斥量进行解锁①,并且在休眠结束后再对互斥量上锁,所以另外的线程就有机会获取锁并设置标识。

这个实现就进步很多,当线程休眠时没有浪费执行时间,但很难确定正确的休眠时间。太短的休眠和没有一样,都会浪费执行时间。太长的休眠时间,可能会让任务等待时间过久。休眠时间过长比较少见,这会影响到程序的行为,在高节奏的游戏中,就意味着丢帧或错过了一个时间片。

第三个选择(也是优先选择的),使用C++标准库提供的工具去等待事件的发生。通过另一线程触发等待事件的机制是最基本的唤醒方式(例如:流水线上存在额外的任务时),这种机制就称为“条件变量”。从概念上来说,条件变量会与多个事件或其他条件相关,并且一个或多个线程会等待条件的达成。当某些线程被终止时,为了唤醒等待线程(允许等待线程继续执行),终止线程将会向等待着的线程广播“条件达成”的信息。

4.1.1 等待条件达成

C++标准库对条件变量有两套实现:std::condition_variablestd::condition_variable_any,这两个实现都包含在<condition_variable>头文件的声明中。两者都需要与互斥量一起才能工作(互斥量是为了同步),前者仅能与std::mutex一起工作,而后者可以和合适的互斥量一起工作,从而加上了_any的后缀。因为std::condition_variable_any更加通用,不过在性能和系统资源的使用方面会有更多的开销,所以通常会将std::condition_variable作为首选类型。当对灵活性有要求时,才会考虑std::condition_variable_any

所以,使用std::condition_variable去处理之前提到的情况——当有数据需要处理时,如何唤醒休眠中的线程?以下代码展示了使用条件变量唤醒线程的方式。

代码4.1 使用std::condition_variable处理数据等待

  1. std::mutex mut;
  2. std::queue<data_chunk> data_queue; // 1
  3. std::condition_variable data_cond;
  4. void data_preparation_thread()
  5. {
  6. while(more_data_to_prepare())
  7. {
  8. data_chunk const data=prepare_data();
  9. std::lock_guard<std::mutex> lk(mut);
  10. data_queue.push(data); // 2
  11. data_cond.notify_one(); // 3
  12. }
  13. }
  14. void data_processing_thread()
  15. {
  16. while(true)
  17. {
  18. std::unique_lock<std::mutex> lk(mut); // 4
  19. data_cond.wait(
  20. lk,[]{return !data_queue.empty();}); // 5
  21. data_chunk data=data_queue.front();
  22. data_queue.pop();
  23. lk.unlock(); // 6
  24. process(data);
  25. if(is_last_chunk(data))
  26. break;
  27. }
  28. }

首先,队列中中有两个线程,两个线程之间会对数据进行传递①。数据准备好时,使用std::lock_guard锁定队列,将准备好的数据压入队列②之后,线程会对队列中的数据上锁,并调用std::condition_variable的notify_one()成员函数,对等待的线程(如果有等待线程)进行通知③。

另外的一个线程正在处理数据,线程首先对互斥量上锁(这里使用std::unique_lock要比std::lock_guard④更加合适)。之后会调用std::condition_variable的成员函数wait(),传递一个锁和一个Lambda表达式(作为等待的条件⑤)。Lambda函数是C++11添加的新特性,可以让一个匿名函数作为其他表达式的一部分,并且非常合适作为标准函数的谓词。例子中,简单的Lambda函数[]{return !data_queue.empty();}会去检查data_queue是否为空,当data_queue不为空,就说明数据已经准备好了。附录A的A.5节有Lambda函数更多的信息。

wait()会去检查这些条件(通过Lambda函数),当条件满足(Lambda函数返回true)时返回。如果条件不满足(Lambda函数返回false),wait()将解锁互斥量,并且将线程(处理数据的线程)置于阻塞或等待状态。当准备数据的线程调用notify_one()通知条件变量时,处理数据的线程从睡眠中苏醒,重新获取互斥锁,并且再次进行条件检查。在条件满足的情况下,从wait()返回并继续持有锁。当条件不满足时,线程将对互斥量解锁,并重新等待。这就是为什么用std::unique_lock而不使用std::lock_guard的原因——等待中的线程必须在等待期间解锁互斥量,并对互斥量再次上锁,而std::lock_guard没有这么灵活。如果互斥量在线程休眠期间保持锁住状态,准备数据的线程将无法锁住互斥量,也无法添加数据到队列中。同样,等待线程也永远不会知道条件何时满足。

代码4.1使用了简单的Lambda函数用于等待⑤(用于检查队列何时不为空),不过任意的函数和可调用对象都可以传入wait()。当写好函数做为检查条件时,不一定非要放在一个Lambda表达式中,也可以直接将这个函数传入wait()。调用wait()的过程中,在互斥量锁定时,可能会去检查条件变量若干次,当提供测试条件的函数返回true就会立即返回。当等待线程重新获取互斥量并检查条件变量时,并非直接响应另一个线程的通知,就是所谓的伪唤醒(spurious wakeup)。因为任何伪唤醒的数量和频率都是不确定的,所以不建议使用有副作用的函数做条件检查。

本质上,std::condition_variable::wait是“忙碌-等待”的优化。下面用简单的循环实现了一个“忙碌-等待”:

  1. template<typename Predicate>
  2. void minimal_wait(std::unique_lock<std::mutex>& lk, Predicate pred){
  3. while(!pred()){
  4. lk.unlock();
  5. lk.lock();
  6. }
  7. }

为wait()准备一个最小化实现,只需要notify_one()或notify_all()。

std::unique_lock的灵活性,不仅适用于对wait()的调用,还可以用于待处理的数据⑥。处理数据可能是耗时的操作,并且长时间持有锁是个糟糕的主意。

使用队列在多个线程中转移数据(如代码4.1)很常见。做得好的话,同步操作可以在队列内部完成,这样同步问题和条件竞争出现的概率也会降低。鉴于这些好处,需要从代码4.1中提取出一个通用线程安全的队列。

4.1.2 构建线程安全队列

设计通用队列时,就要花时间想想,哪些操作需要添加到队列实现中去,就如之前在3.2.3节看到的线程安全的栈。可以看一下C++标准库提供的实现,找找灵感。std::queue<>容器的接口展示如下:

代码4.2 std::queue接口

  1. template <class T, class Container = std::deque<T> >
  2. class queue {
  3. public:
  4. explicit queue(const Container&);
  5. explicit queue(Container&& = Container());
  6. template <class Alloc> explicit queue(const Alloc&);
  7. template <class Alloc> queue(const Container&, const Alloc&);
  8. template <class Alloc> queue(Container&&, const Alloc&);
  9. template <class Alloc> queue(queue&&, const Alloc&);
  10. void swap(queue& q);
  11. bool empty() const;
  12. size_type size() const;
  13. T& front();
  14. const T& front() const;
  15. T& back();
  16. const T& back() const;
  17. void push(const T& x);
  18. void push(T&& x);
  19. void pop();
  20. template <class... Args> void emplace(Args&&... args);
  21. };

忽略构造、赋值以及交换操作,剩下了三组操作:

  1. 对整个队列的状态进行查询(empty()和size())
  2. 查询在队列中的各个元素(front()和back())
  3. 修改队列的操作(push(), pop()和emplace())

和3.2.3中的栈一样,也会遇到接口上的条件竞争。因此,需要将front()和pop()合并成一个函数调用,就像之前在栈实现时合并top()和pop()一样。与代码4.1不同的是,当队列在多个线程中传递数据时,接收线程通常需要等待数据的压入。这里提供pop()函数的两个变种:try_pop()和wait_and_pop()。

try_pop() ,尝试从队列中弹出数据,即使没有值可检索,也会直接返回。

wait_and_pop(),将会等待有值可检索的时候才返回。

当使用之前栈的方式来实现队列,接口可能会是下面这样:

代码4.3 线程安全队列的接口

  1. #include <memory> // 为了使用std::shared_ptr
  2. template<typename T>
  3. class threadsafe_queue
  4. {
  5. public:
  6. threadsafe_queue();
  7. threadsafe_queue(const threadsafe_queue&);
  8. threadsafe_queue& operator=(
  9. const threadsafe_queue&) = delete; // 不允许简单的赋值
  10. void push(T new_value);
  11. bool try_pop(T& value); // 1
  12. std::shared_ptr<T> try_pop(); // 2
  13. void wait_and_pop(T& value);
  14. std::shared_ptr<T> wait_and_pop();
  15. bool empty() const;
  16. };

就像之前的栈,裁剪了很多构造函数,并禁止简单赋值。需要提供两个版本的try_pop()和wait_for_pop()。第一个重载的try_pop()①在引用变量中存储着检索值,可以用来返回队列中值的状态。当检索到一个变量时,将返回true,否则返回false(详见A.2节)。第二个重载②就不行了,因为它是用来直接返回检索值的,当没有值可检索时,这个函数返回NULL。

那么问题来了,如何将以上这些和代码4.1相关联呢?从之前的代码中提取push()和wait_and_pop(),如以下代码所示。

代码4.4 从代码4.1中提取push()和wait_and_pop()

  1. #include <queue>
  2. #include <mutex>
  3. #include <condition_variable>
  4. template<typename T>
  5. class threadsafe_queue
  6. {
  7. private:
  8. std::mutex mut;
  9. std::queue<T> data_queue;
  10. std::condition_variable data_cond;
  11. public:
  12. void push(T new_value)
  13. {
  14. std::lock_guard<std::mutex> lk(mut);
  15. data_queue.push(new_value);
  16. data_cond.notify_one();
  17. }
  18. void wait_and_pop(T& value)
  19. {
  20. std::unique_lock<std::mutex> lk(mut);
  21. data_cond.wait(lk,[this]{return !data_queue.empty();});
  22. value=data_queue.front();
  23. data_queue.pop();
  24. }
  25. };
  26. threadsafe_queue<data_chunk> data_queue; // 1
  27. void data_preparation_thread()
  28. {
  29. while(more_data_to_prepare())
  30. {
  31. data_chunk const data=prepare_data();
  32. data_queue.push(data); // 2
  33. }
  34. }
  35. void data_processing_thread()
  36. {
  37. while(true)
  38. {
  39. data_chunk data;
  40. data_queue.wait_and_pop(data); // 3
  41. process(data);
  42. if(is_last_chunk(data))
  43. break;
  44. }
  45. }

线程队列中有互斥量和条件变量,所以独立的变量就不需要了①,并且push()不需要外部同步②。当然,wait_and_pop()还要兼顾条件变量的等待③。

另一个wait_and_pop()的重载写起来就很琐碎,剩下的函数就像从代码3.5实现的栈中粘过来一样。

代码4.5 使用条件变量的线程安全队列(完整版)

  1. #include <queue>
  2. #include <memory>
  3. #include <mutex>
  4. #include <condition_variable>
  5. template<typename T>
  6. class threadsafe_queue
  7. {
  8. private:
  9. mutable std::mutex mut; // 1 互斥量必须是可变的
  10. std::queue<T> data_queue;
  11. std::condition_variable data_cond;
  12. public:
  13. threadsafe_queue()
  14. {}
  15. threadsafe_queue(threadsafe_queue const& other)
  16. {
  17. std::lock_guard<std::mutex> lk(other.mut);
  18. data_queue=other.data_queue;
  19. }
  20. void push(T new_value)
  21. {
  22. std::lock_guard<std::mutex> lk(mut);
  23. data_queue.push(new_value);
  24. data_cond.notify_one();
  25. }
  26. void wait_and_pop(T& value)
  27. {
  28. std::unique_lock<std::mutex> lk(mut);
  29. data_cond.wait(lk,[this]{return !data_queue.empty();});
  30. value=data_queue.front();
  31. data_queue.pop();
  32. }
  33. std::shared_ptr<T> wait_and_pop()
  34. {
  35. std::unique_lock<std::mutex> lk(mut);
  36. data_cond.wait(lk,[this]{return !data_queue.empty();});
  37. std::shared_ptr<T> res(std::make_shared<T>(data_queue.front()));
  38. data_queue.pop();
  39. return res;
  40. }
  41. bool try_pop(T& value)
  42. {
  43. std::lock_guard<std::mutex> lk(mut);
  44. if(data_queue.empty())
  45. return false;
  46. value=data_queue.front();
  47. data_queue.pop();
  48. return true;
  49. }
  50. std::shared_ptr<T> try_pop()
  51. {
  52. std::lock_guard<std::mutex> lk(mut);
  53. if(data_queue.empty())
  54. return std::shared_ptr<T>();
  55. std::shared_ptr<T> res(std::make_shared<T>(data_queue.front()));
  56. data_queue.pop();
  57. return res;
  58. }
  59. bool empty() const
  60. {
  61. std::lock_guard<std::mutex> lk(mut);
  62. return data_queue.empty();
  63. }
  64. };

empty()是一个const成员函数,并且传入拷贝构造函数的other形参是一个const引用。因为其他线程可能有非const引用对象,并调用变种成员函数,所以这里有必要对互斥量上锁。又因为锁住互斥量是个可变操作,所以互斥量成员必须为mutable①才能在empty()和拷贝构造函数中进行上锁。

条件变量在多个线程等待同一个事件时也很有用。当线程用来分解工作负载,并且只有一个线程可以对通知做出反应时,与代码4.1中结构完全相同。当数据准备完成时,调用notify_one()将会唤醒一个正在wait()的线程,检查条件和wait()函数的返回状态(因为仅是向data_queue添加了一个数据项)。 这里不保证线程一定会被通知到,即使只有一个等待线程收到通知,其他处理线程也有可能因为在处理数据,而忽略了这个通知。

另一种可能是,很多线程等待同一事件。对于通知,都需要做出回应。这会发生在共享数据初始化的时候,当处理线程使用同一数据时,就要等待数据被初始化,或等待共享数据的更新,比如:周期性初始化(periodic reinitialization)。这些情况下,线程准备好数据时,就会通过条件变量调用notify_all(),而非调用notify_one()。顾名思义,这就是全部线程在都去执行wait()(检查他们等待的条件是否满足)的原因。

当条件为true时,等待线程只等待一次,就不会再等待条件变量了,所以尤其是在等待一组可用的数据块时,一个条件变量并非同步操作最好的选择。

接下来就来了解一下future,对于条件变量的补足。