Python---多进程---多线程

发布时间:2023年12月31日

总结

1- 多进程:计算机分配资源的最小单位。
2- 多线程:CPU进行任务切换的最小单位。
3- 线程不能独立存在,必须存在在进程中。
4- 多进程中,多个子进程和主进程间,不会共享全局变量
5- 多线程中,多个子线程和主线程间,会共享全局变量
6- 将子线程,标记为守护线程。只有设置为守护线程的,才会在主线程运行结束后,跟着结束。否则不受任何影响

  • 并发与并行
    • 并发:在一段时间内快速交替去执行多个任务(多线程)
    • 并行:在一段时间内真正的同时一起执行多个任务(多进程)
  • 进程(Process)
    • 是操作系统进行资源分配的基本单位
    • 进程可以有一个或多个子进程
    • 最原始的父进程是由操作系统提供的
  • 线程(Thread)
    • 是CPU进行调度的基本单位
    • 线程可以有一个或多个子线程
    • 线程是由进程主动创建出来的,创建第一次创建子线程时才会出现主线程
  • 线程的资源共享问题(只存在于低版本的Python解释器比如3.6.5,3.10已解决):当多个线程同时操作同一个共享的全局变量时,可能会造成错误的结果,解决办法如下
    • 线程同步:保证同一时刻只能有一个线程去操作共享资源(全局变量)
      • 线程等待thread.join()
        • 让一个线程完全执行结束,再去执行另一个线程
        • 缺点:一个执行完再执行另一个,和单任务几乎没有区别
      • 互斥锁:
        • 多个线程去抢同一把"锁",threading.Lock()抢到锁的线程执行,没抢到锁的线程会阻塞等待。
        • 缺点:虽然保障程序执行的多任务,如果频繁的加锁、释放锁会额外增加执行的时间消耗
    • 从场景下手:不用多线程做累加count操作,只做append操作!
  • 进程线程对比
    • 进程是操作系统资源分配的基本单位,线程是CPU调度的基本单位。
    • 线程不能够独立执行,必须依存在进程中。
    • 创建进程的资源开销要比创建线程的资源开销要大。
    • 进程之间不共享全局变量,线程之间共享全局变量,但是在低版本的Python中要注意线程资源竞争的问题。
    • 进程稳定性高,适合计算密集型任务;线程适合IO密集型任务
    • 目前Python多线程不能利用CPU多核心优势,想利用CPU多核心的优势,Python只能采用多进程

多进程

多进程实例

import time
import os
import multiprocessing
# os.getpid():process id,获取进程的编号
# os.getppid():parent process id,获取父进程编号

# 跳舞函数
def dance():
    print(f'dance进程的编号:{os.getpid()},父进程编号:{os.getppid()}')
    for i in range(5):
        print('跳舞中...')
        # 休眠1秒钟
        time.sleep(1)

# 唱歌函数
def sing():
    print(f'sing进程的编号:{os.getpid()},父进程编号:{os.getppid()}')
    for i in range(5):
        print('唱歌中...')
        # 休眠1秒钟
        time.sleep(1)

if __name__ == '__main__':
    # 最原始的父进程是由操作系统提供的
    print(f'主进程的编号为:{os.getpid()},父进程编号:{os.getppid()}')
    # 创建两个进程,一个执行 dance 函数,另一个执行 sing 函数
    dance_process = multiprocessing.Process(target=dance)
    sing_process = multiprocessing.Process(target=sing)
    # 启动进程
    dance_process.start()
    sing_process.start()

多进程执行带有参数的任务

import multiprocessing
import time

# 带有参数的任务(函数)
def task(count):
    for i in range(count):
        print('任务执行中...')
        time.sleep(0.2)
    else:
        print('任务执行完成')

if __name__ == '__main__':
    # 传参方式1 args=(参数值1, ...)
    # task_process = multiprocessing.Process(target=task, args=(3,))
    # 传参方式2 kwargs={'形参字符串1': 值1, '形参字符串2': 值2, ...}
    task_process = multiprocessing.Process(target=task, kwargs={'count': 5})
    # 启动进程
    task_process.start()
    task_process.join()
    print('这行代码一定等task_process进程执行完毕之后才会运行,打印')

多进程之间不共享变量

import multiprocessing
import time

# 定义全局变量
g_list = []

# 添加数据的函数
def add_data():
    for i in range(5):
        g_list.append(i)
        print('add:', i)
        time.sleep(0.2)
    print('add:', g_list)

# 读取数据的函数
def read_data():
    print('read:', g_list)

if __name__ == '__main__':
    # 创建添加数据的子进程
    add_data_process = multiprocessing.Process(target=add_data)
    # 创建读取数据的子进程
    read_data_process = multiprocessing.Process(target=read_data)

    # 启动添加数据子进程
    add_data_process.start()
    # 阻塞等待:主进程等待 add_data_process 执行完成,再向下继续执行
    add_data_process.join()
    # 启动读取数据子进程
    read_data_process.start()
    # 主进程读取数据
    print('main:', g_list)

    # 主进程延时 1s
    time.sleep(1)
    print('主进程结束!')

子进程设置为守护进程

主进程结束,设为守护进程的子进程主动GG

import multiprocessing
import time

def task():
    for i in range(10):
        print('任务执行中...')
        time.sleep(0.5)

if __name__ == '__main__':
    # 创建子进程并启动
    sub_process = multiprocessing.Process(target=task)
    # TODO:设置子进程为守护进程
    sub_process.daemon = True
    sub_process.start()

    # 主进程延时 1s
    time.sleep(1)
    print('主进程结束!')

主进程终止子进程

子进程被动GG

import multiprocessing
import time


# 任务函数
def task():
    for i in range(10):
        print('任务执行中...')
        time.sleep(0.5)


if __name__ == '__main__':
    # 创建子进程并启动
    sub_process = multiprocessing.Process(target=task)
    sub_process.start()

    # 主进程延时 1s
    time.sleep(1)
    print('主进程结束!')
    # TODO: 终止子进程
    sub_process.terminate()
    

多线程

多线程实例

import time
import threading

# 跳舞函数
def dance(num):
    for i in range(num):
        print('跳舞中...')
        time.sleep(1)

# 唱歌函数
def sing(num):
    for i in range(num):
        print('唱歌中...')
        time.sleep(1)

if __name__ == '__main__':
    # 创建两个线程,分别执行 dance 和 sing
    dance_thread = threading.Thread(target=dance, args=(5,))
    sing_thread = threading.Thread(target=sing, kwargs={'num':5})
    # 启动线程
    dance_thread.start()
    sing_thread.start()

线程共用全局变量

import threading
import time

# 定义全局变量
g_list = []

# 添加数据的函数
def add_data():
    for i in range(5):
        g_list.append(i)
        print('add:', i)
        time.sleep(0.2)

    print('add:', g_list)

# 读取数据的函数
def read_data():
    print('read:', g_list)


if __name__ == '__main__':
    # 创建添加数据的子线程
    add_data_thread = threading.Thread(target=add_data)
    # 创建读取数据的子线程
    read_data_thread = threading.Thread(target=read_data)

    # 启动添加数据子线程
    add_data_thread.start()
    # 阻塞等待:主线程等待 add_data_thread 执行完成,再向下继续执行
    add_data_thread.join()

    # 启动读取数据子线程
    read_data_thread.start()
    # 阻塞等待:主线程等待 read_data_thread 执行完成,再向下继续执行
    read_data_thread.join()

    print('main:', g_list)

join()使用总结:
1- 作用:线程等待子线程执行结束
2- 使用场景:主线程需要使用多个子线程运行的最终结果,才能够继续往下运行。
举例:吃火锅,张三叫李四带点食材,并且张三叫王五带锅。有了锅和食材以后,才能够开始煮火锅

线程互斥锁

注释lock锁相关代码,并使用 低版本的Python解释器(python3.6.5) 才能看到线程资源安全问题的效果!Python 3.10 已经解决了该问题!

# 互斥锁:多个线程去抢同一把"锁",抢到锁的线程执行,没抢到锁的线程会阻塞等待
import threading

# 定义全局变量
g_num = 0

# 创建一个多线程互斥锁
lock = threading.Lock()

def sum_num1():
    global g_num
    # 循环一次给全局变量加1
    for i in range(1000000):
        # 抢到锁,代码可以继续向下执行,否则就会阻塞等待
        lock.acquire() # 抢锁
        g_num += 1
        lock.release() # 释放锁
    print('sum1:', g_num)


def sum_num2():
    global g_num
    # 循环一次给全局变量加1
    for i in range(1000000):
        # 抢到锁,代码可以继续向下执行,否则就会阻塞等待
        lock.acquire() # 抢锁
        g_num += 1
        lock.release() # 释放锁
    print('sum2:', g_num)

if __name__ == '__main__':
    # 创建两个线程
    first_thread = threading.Thread(target=sum_num1)
    second_thread = threading.Thread(target=sum_num2)
    # 启动两个线程
    first_thread.start()
    second_thread.start()

    # 阻塞等待:主线程等待子线程结束再向下运行
    first_thread.join()
    second_thread.join()

    print(g_num)
文章来源:https://blog.csdn.net/qq_50215015/article/details/135257069
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。