进程
线程是资源分配的最小单元,拥有代码,数据,文件,网络连接,地址空间等资源。
fork
fork()是一个系统调用,用于创建进程。创建的这个进程与原来进程几乎完全相同。这个新产生的进程称为子进程。一个进程调用fork()函数后,系统先给新的进程分配资源,例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中,只有少数值与原来的进程的值不同。相当于克隆了一个自己。
需要注意的一点:就是调用fork之后,两个进程同时执行的代码段是fork函数之后的代码,而之前的代码已经由父进程执行完毕。下面来看一个很简单的例子。
#include<stdio.h>
#include<unistd.h>
int main()
{
pid_t pid;
int count = 0;
pid = fork(); //fork一个进程
if(pid == 0) { //pid为0,
printf("this is child process, pid is %d\n",getpid());//getpid返回的是当前进程的PID
count+=2;
printf("count = %d\n",count);
} else if(pid > 0) {
printf("this is father process, pid is %d\n",getpid());
count++;
printf("count = %d\n",count);
} else {
fprintf(stderr,"ERROR:fork() failed!\n");
}
return 0;
}
在main()函数调用fork了,创建了一个新的进程,这个进程称为原来进程的子进程。子进程与原来的进程并发执行,谁先谁后没有规律,由操作系统调度决定。
其实是子进程使用了和父进程一样的页表,导致两个进程所有数据都是一模一样的,没有任何差别。当然,在子进程的页表里会有特殊标记,使得当子进程需要写这段内存时(读的时候任何事情都不会发生),内核会将要写的这一页复制一份新的给子进程。是谓「写时复制」
线程
线程是一个执行和调度的单元,一个线程就是不停地去读取指令,解码,执行,写回。CPU 就是以线程为单位执行的。同一个进程中的线程共享其他线程的资源。拥有独立的寄存器和栈(函数调用需要)。
C++ 多线程方案有 pthread 和 c++11 标准库中的 thread,这里介绍标准库的 thread ,thread 构造函数只要传入一个可以调用的对象即可。
#include <iostream>
#include <vector>
#include <algorithm>
#include <thread>
#include <unistd.h>
#include <random>
#include <deque>
constexpr size_t COUNT = 4 * 1024 * 1024;
int main () {
using namespace std::chrono;
std::vector<double> vectors[4];
std::default_random_engine e;
std::uniform_real_distribution<double> u(0.0, 1.0);
for (auto &vec : vectors) {
vec.resize(COUNT);
std::generate(vec.begin(), vec.end(), [&e, &u]() {return u(e);});
}
auto start_time = high_resolution_clock::now();
std::deque<std::thread> threads;
for (auto &vec : vectors) {
threads.emplace_back([&vec] () {
double sum = 0;
for (int i = 0; i < COUNT; ++i) {
sum += vec[i];
}
std::cout << sum << std::endl;
});
}
for (auto &t : threads) {
t.join();
}
auto finish_time = std::chrono::high_resolution_clock::now();
std::cout << std::chrono::duration_cast<std::chrono::microseconds>(finish_time - start_time).count() << "us" << std::endl;
return 0;
}
如果线程数大于 cpu 核数,那么在执行多线程的时候会发生上下文切换,此时的速度不如顺序执行的速度快。 taskset -a -c 1 target.exe
来使用一个 cpu 来执行这个程序。