当前位置：首页 > Python > 正文

Python多进程编程入门指南（使用multiprocessing实现高效并行计算）

主机测评网
Python
2025-12-24
997

在当今多核CPU普及的时代，利用Python multiprocessing库进行多进程编程已成为提升程序性能的重要手段。本文将从零开始，手把手教你如何使用multiprocessing模块实现并行计算和进程间通信，即使你是编程小白也能轻松上手！

为什么需要多进程？

Python由于全局解释器锁（GIL）的限制，在多线程中无法真正实现CPU密集型任务的并行执行。而多进程编程可以绕过GIL，让每个进程拥有独立的Python解释器和内存空间，从而充分利用多核CPU资源。

Python多进程编程入门指南（使用multiprocessing实现高效并行计算） Python multiprocessing 多进程编程并行计算进程间通信第1张

1. 创建并启动一个简单进程

最基础的用法是使用Process类创建新进程：

import multiprocessingimport timedef worker(name):    print(f'进程 {name} 开始执行')    time.sleep(2)    print(f'进程 {name} 执行完毕')if __name__ == '__main__':    # 创建进程对象    p = multiprocessing.Process(target=worker, args=('Worker-1',))        # 启动进程    p.start()        # 等待进程结束    p.join()        print('主进程结束')

注意：必须将进程创建和启动代码放在if __name__ == '__main__':块中，这是为了防止在Windows系统上出现递归创建进程的问题。

2. 同时运行多个进程

我们可以创建多个进程并同时运行它们：

import multiprocessingimport timedef task(task_id):    print(f'任务 {task_id} 开始')    time.sleep(2)    print(f'任务 {task_id} 完成')if __name__ == '__main__':    processes = []        # 创建5个进程    for i in range(5):        p = multiprocessing.Process(target=task, args=(i,))        processes.append(p)        p.start()        # 等待所有进程完成    for p in processes:        p.join()        print('所有任务已完成')

3. 使用进程池（Pool）简化管理

当需要处理大量相似任务时，使用Pool类更加高效：

import multiprocessingdef square(x):    return x * xif __name__ == '__main__':    numbers = [1, 2, 3, 4, 5]        # 创建包含4个工作进程的进程池    with multiprocessing.Pool(processes=4) as pool:        results = pool.map(square, numbers)        print(f'计算结果: {results}')    # 输出: 计算结果: [1, 4, 9, 16, 25]

4. 进程间通信（IPC）

多进程之间默认无法共享内存，但可以通过以下方式实现进程间通信：

4.1 使用Queue队列

import multiprocessingdef producer(queue):    for i in range(5):        queue.put(f'消息-{i}')    queue.put(None)  # 发送结束信号def consumer(queue):    while True:        item = queue.get()        if item is None:            break        print(f'收到: {item}')if __name__ == '__main__':    queue = multiprocessing.Queue()        p1 = multiprocessing.Process(target=producer, args=(queue,))    p2 = multiprocessing.Process(target=consumer, args=(queue,))        p1.start()    p2.start()        p1.join()    p2.join()

4.2 使用Pipe管道

import multiprocessingdef sender(conn):    conn.send('Hello from sender!')    conn.close()def receiver(conn):    msg = conn.recv()    print(f'接收到消息: {msg}')if __name__ == '__main__':    parent_conn, child_conn = multiprocessing.Pipe()        p1 = multiprocessing.Process(target=sender, args=(parent_conn,))    p2 = multiprocessing.Process(target=receiver, args=(child_conn,))        p1.start()    p2.start()        p1.join()    p2.join()

5. 共享内存与同步

有时我们需要多个进程访问同一块数据，可以使用Value或Array：

import multiprocessingdef increment(counter, lock):    for _ in range(1000):        with lock:  # 使用锁保证原子操作            counter.value += 1if __name__ == '__main__':    counter = multiprocessing.Value('i', 0)  # 'i' 表示整数类型    lock = multiprocessing.Lock()        processes = []    for _ in range(4):        p = multiprocessing.Process(target=increment, args=(counter, lock))        processes.append(p)        p.start()        for p in processes:        p.join()        print(f'最终计数值: {counter.value}')  # 应该输出 4000