什么是进程
操作系统中执行的一个程序,类似微信、QQ,每个程序都是一个进程
概念
- 它是 CPU 最小资源分配单元
- 操作系统会给进程分配内存空间,每个进程都会有自己的地址空间、数据栈以及其他用于跟踪进程执行的辅助数据
- 操作系统管理所有进程的执行,为它们合理的分配资源
fork、spawn
什么是线程
- 进程中可以拥有多个并发的执行线索
- 它是 CPU 最小调度的执行单元
特点
- 同一个进程下的线程共享相同的上下文
- 相对于进程来说,线程间的信息共享和通信更加容易
单核 CPU 系统注意事项
- 真正的并发是不可能的
- 因为在某个时刻,CPU 只能运行唯一的一个线程
- 多个线程共享了 CPU 的执行时间
多线程的好处
- 提升程序的性能和改善用户体验
- 今天日常使用的软件几乎都用到了多线程
多线程的坏处
- 站在其他进程的角度,多线程的程序对其他程序并不友好,因为它占用了更多的 CPU 执行时间,导致其他程序无法获得足够的 CPU 执行时间
- 编写和调试多线程的程序对开发者要求较高
Python 实现并发编程的方式
- 多进程
- 多线程
- 多进程+多线程
Python 中的多进程
Linux 下的 fork 函数
- Linux 操作系统上提供了 fork() 系统调用来创建进程
- 调用 fork() 函数的是父进程
- 创建的是子进程
- 子进程是父进程的拷贝
- 但子进程有自己的 PID
- fork() 函数非常特殊,它会返回两次,父进程中调用 fork() 会返回子进程的 PID,子进程中调用 fork() 得到的都是0
Python 提供的 fork 函数
os 模块提供了 fork()
Window 下没有fork()的调用
- 实现跨平台的多进程变成,可以使用 multiprocessing 模块的 Process 类来创建子进程
- 还提供了更高级的封装,例如批量启动进程的进程池 pool、用于进程间同喜你的队列 Queue 和管道 Pipe
使用多进程和不使用多进程的区别(写代码)
不使用多进程
from random import randint
from time import time, sleep
def download_task(filename):
print('开始下载%s...' % filename)
time_to_download = randint(5, 10)
sleep(time_to_download)
print('%s下载完成! 耗费了%d秒' % (filename, time_to_download))
def main():
start = time()
download_task('Python从入门到住院.pdf')
download_task('Peking Hot.avi')
end = time()
print('总共耗费了%.2f秒.' % (end - start))
if __name__ == '__main__':
main()
执行结果
开始下载Python从入门到住院.pdf...
Python从入门到住院.pdf下载完成! 耗费了10秒
开始下载Peking Hot.avi...
Peking Hot.avi下载完成! 耗费了9秒
总共耗费了19.02秒.
使用多进程
from random import randint
from time import time, sleep
from multiprocessing import Process
def download_task(filename):
print('开始下载%s...' % filename)
time_to_download = randint(5, 10)
sleep(time_to_download)
print('%s下载完成! 耗费了%d秒' % (filename, time_to_download))
def main2():
start = time()
p1 = Process(target=download_task,args=("Python从入门到住院.pdf",))
p1.start()
p2 = Process(target=download_task, args=("Peking Hot.avi",))
p2.start()
p1.join()
p2.join()
end = time()
print('总共耗费了%.2f秒.' % (end - start))
if __name__ == '__main__':
main2()
执行结果
开始下载Python从入门到住院.pdf...
开始下载Peking Hot.avi...
Python从入门到住院.pdf下载完成! 耗费了6秒
Peking Hot.avi下载完成! 耗费了10秒
总共耗费了10.17秒.
知识点
- Process:通过 Process 类创建进程对象
- target:通过 target 参数传入一个函数名来表示进程启动后要执行的代码
- args:是一个元组,代表传递给函数的参数列表
- start:Process 的 start() 方法来启动进程
- join:Process 的 join() 方法表示等待进程执行结束,才会往下执行
Python 中的多线程
前言
推荐 threading 模块来实现多线程编程,它提供了更好的面向对象封装
多线程的实现方式
from random import randint
from threading import Thread
from time import time, sleep
def download_task(filename):
print('开始下载%s...' % filename)
time_to_download = randint(5, 10)
sleep(time_to_download)
print('%s下载完成! 耗费了%d秒' % (filename, time_to_download))
def main3():
start = time()
p1 = Thread(target=download_task,args=("Python从入门到住院.pdf",))
p1.start()
p2 = Process(target=download_task, args=("Peking Hot.avi",))
p2.start()
p1.join()
p2.join()
end = time()
print('总共耗费了%.2f秒.' % (end - start))
if __name__ == '__main__':
main3()
执行结果
开始下载Python从入门到住院.pdf...
开始下载Peking Hot.avi...
Peking Hot.avi下载完成! 耗费了6秒
Python从入门到住院.pdf下载完成! 耗费了8秒
总共耗费了8.01秒.
自定义线程类
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
__title__ =
__Time__ = 2021/3/19 18:17
__Author__ = 小菠萝测试笔记
__Blog__ = https://www.cnblogs.com/poloyy/
"""
from random import randint
from threading import Thread
from time import time, sleep
class downLoadTask(Thread):
def __init__(self,filename):
super().__init__()
self.filename = filename
def run(self) -> None:
print('开始下载%s...' % self.filename)
time_to_download = randint(5, 10)
sleep(time_to_download)
print('%s下载完成! 耗费了%d秒' % (self.filename, time_to_download))
def main3():
start = time()
p1 = downLoadTask("Python从入门到住院.pdf")
p2 = downLoadTask("Peking Hot.avi")
p1.start()
p2.start()
p1.join()
p2.join()
end = time()
print('总共耗费了%.2f秒.' % (end - start))
if __name__ == '__main__':
main3()
执行结果
开始下载Python从入门到住院.pdf...
开始下载Peking Hot.avi...
Peking Hot.avi下载完成! 耗费了6秒
Python从入门到住院.pdf下载完成! 耗费了9秒
总共耗费了9.00秒.
重点知识:start 和 run 方法的区别
比较点 | start | run |
---|---|---|
作用 | 启动线程,获取 CPU 时间片 | 运行线程指定的代码块 |
线程状态 | 可运行状态 | 运行状态 |
调用次数 | 一个线程只能调用一次 | 可以重复调用 |
运行线程 | 创建了一个子线程,线程名是自己命名的 | 在主线程中调用了一个普通函数 |
注意点 | 想用多线程,必须调用 start() |