当前位置：首页 > C# > 正文

C#并行循环的分区器（Partitioner）详解

主机测评网
C#
2025-12-24
464

在C#中，并行编程是提升程序性能的重要手段。当你使用Parallel.ForEach处理大量数据时，.NET会自动将数据划分为多个“分区”（Partitions），分配给不同的线程执行。但默认的分区策略并不总是最优的——这时，我们就需要使用Partitioner来自定义分区逻辑。

什么是Partitioner？

Partitioner 是 .NET 提供的一个抽象类，位于 System.Collections.Concurrent 命名空间中。它允许你控制数据如何被分割成多个块，从而优化并行处理的效率。

默认情况下，Parallel.ForEach 使用的是“范围分区”（Range Partitioning），适用于数组或列表等索引类型。但对于某些场景（如处理链表、文件流、或计算成本不均的任务），自定义分区能显著提升性能。

C#并行循环的分区器（Partitioner）详解 C#并行循环 Partitioner分区器 Parallel.ForEach自定义分区 C#高性能并行处理第1张

为什么需要自定义分区？

考虑以下场景：

数据源不是随机访问的（如 LinkedList<T>）
每个元素处理时间差异很大（有的快、有的慢）
数据量极大，希望动态分配任务以避免线程空闲

这时，使用 Partitioner.Create 创建动态分区（Chunk Partitioning）会更高效。

实战：使用Partitioner优化Parallel.ForEach

下面是一个对比示例：处理一个包含100万个整数的列表。

✅ 默认分区（静态范围）

var data = Enumerable.Range(1, 1_000_000).ToList();Parallel.ForEach(data, item =>{    // 模拟耗时操作    Thread.Sleep(1);    Console.WriteLine($"Processing {item}");});

✅ 自定义动态分区（推荐用于非均匀任务）

using System.Collections.Concurrent;var data = Enumerable.Range(1, 1_000_000).ToList();// 创建动态分区器（chunk partitioning）var partitioner = Partitioner.Create(data, true);Parallel.ForEach(partitioner, chunk =>{    foreach (var item in chunk)    {        // 模拟耗时操作        Thread.Sleep(1);        Console.WriteLine($"Processing {item} on thread {Thread.CurrentThread.ManagedThreadId}");    }});

注意：Partitioner.Create(data, true) 中的 true 表示启用“动态负载均衡”，系统会根据线程处理速度动态分配新块。

高级技巧：自定义Partitioner类

如果你有特殊的数据结构（比如从数据库逐行读取），可以继承 Partitioner<T> 实现自己的分区逻辑。

public class CustomPartitioner : Partitioner<int>{    private readonly IEnumerable<int> _source;    public CustomPartitioner(IEnumerable<int> source) => _source = source;    public override bool SupportsDynamicPartitions => true;    public override IList<ILongEnumerator<int>> GetPartitions(int partitionCount)    {        var dynamicPartitioner = Partitioner.Create(_source, true);        return dynamicPartitioner.GetPartitions(partitionCount);    }}