Linux I/O多路转接技术详解：从select到epoll

深入剖析高性能I/O模型，轻松掌握select与epoll

在Linux系统编程中，I/O多路转接（I/O Multiplexing）是一种关键的并发处理技术。它允许单个线程同时监视多个文件描述符，当某个描述符就绪时进行相应操作，从而高效处理大量I/O事件。本文将详细介绍两种经典的I/O多路转接机制：select和epoll，帮助小白快速理解其原理与使用。

一、什么是I/O多路转接？

传统的多进程/多线程模型为每个连接创建一个进程或线程，当连接数巨大时，资源消耗惊人。而I/O多路转接通过内核同时监听多个描述符，只在描述符就绪时才通知应用程序，避免了阻塞和频繁的线程切换，极大提升了系统并发能力。Linux I/O多路转接主要包括select、poll和epoll，其中select和epoll是本文重点。

二、select模型

select模型是最早的I/O多路转接函数，它通过三个fd_set集合（读、写、异常）来传递感兴趣的描述符，并设置超时时间。调用select后，内核会修改这些集合，标记就绪的描述符。应用程序需遍历所有描述符检查是否就绪。select的主要缺点包括： - 单个进程可监视的描述符数量受FD_SETSIZE限制（通常1024）； - 每次调用都需要从用户空间拷贝描述符集合到内核空间，效率低； - 返回后需要线性扫描全部描述符，O(n)复杂度。尽管如此，select跨平台支持较好，简单场景仍可使用。

Linux I/O多路转接技术详解：从select到epoll I/O多路转接 select模型 epoll模型高性能并发I/O 第1张

三、epoll模型

epoll模型是Linux特有的高性能I/O多路转接机制，专为处理大量文件描述符而设计。它通过三个系统调用（epoll_create, epoll_ctl, epoll_wait）完成。epoll采用事件驱动机制，内核通过回调函数直接将就绪描述符加入就绪队列，返回时只提供就绪的描述符，无需遍历。epoll的优势： - 支持水平触发（LT）和边缘触发（ET）两种模式，ET模式下效率更高； - 无最大描述符限制，仅受系统内存影响； - 就绪描述符直接返回，无需扫描，O(1)复杂度； - 内存映射技术避免数据拷贝，性能卓越。因此，epoll广泛应用于高并发服务器（如Nginx、Node.js），是实现高性能并发I/O的首选。

四、select与epoll对比

特性	select	epoll
描述符限制	FD_SETSIZE（1024）	几乎无限制
效率	O(n)，随描述符增加线性下降	O(1)，仅返回就绪描述符
数据拷贝	每次调用需拷贝全部集合	通过内存映射减少拷贝
触发方式	仅水平触发	水平触发+边缘触发