当前位置：首页 > Rust > 正文

Rust语言中的再哈希法实现（详解哈希冲突解决方案）

主机测评网
Rust
2025-12-14
364

在使用 Rust哈希表 进行数据存储时，我们经常会遇到哈希冲突的问题。当两个不同的键通过哈希函数计算后得到相同的索引位置时，就需要一种策略来解决这种冲突。其中一种经典的方法就是 Rust再哈希法（Rehashing 或 Double Hashing）。

本教程将从零开始，手把手教你如何在 Rust 中实现再哈希法，即使你是编程小白，也能轻松理解并掌握这项重要的 Rust数据结构 技巧。

什么是再哈希法？

再哈希法是一种开放寻址（Open Addressing）的哈希冲突解决策略。它使用两个哈希函数：

h2(key)：主哈希函数，用于计算初始位置。
h2(key)：辅助哈希函数，用于在发生冲突时计算步长（probe step）。

探测序列为：(h2(key) + i * h2(key)) % table_size，其中 i = 0, 1, 2, ...

Rust语言中的再哈希法实现（详解哈希冲突解决方案） Rust哈希表 Rust再哈希法 Rust冲突解决 Rust数据结构第1张

为什么选择再哈希法？

相比线性探测（Linear Probing）和二次探测（Quadratic Probing），再哈希法能更均匀地分布键值，减少“聚集”（clustering）现象，从而提升 Rust冲突解决 的效率。

动手实现：Rust 再哈希哈希表

下面我们用 Rust 实现一个简单的基于再哈希法的哈希表。我们将支持插入（insert）、查找（get）和删除（remove）操作。

1. 定义数据结构

首先，我们定义哈希表的每个槽位可能为空、被占用或已删除（使用 tombstone 标记）：

#[derive(Clone, Debug)]enum Entry<K, V> {    Empty,    Deleted,    Occupied(K, V),}struct RehashTable<K, V> {    table: Vec<Entry<K, V>>,    size: usize,    capacity: usize,}

2. 实现构造函数

初始化一个指定容量的哈希表：

impl<K, V> RehashTable<K, V>where    K: Clone + std::hash::Hash + Eq,{    fn new(capacity: usize) -> Self {        let mut table = Vec::with_capacity(capacity);        for _ in 0..capacity {            table.push(Entry::Empty);        }        RehashTable {            table,            size: 0,            capacity,        }    }}

3. 哈希函数设计

我们需要两个哈希函数。第一个是标准哈希，第二个要确保结果与表大小互质（通常取一个质数）：

use std::hash::{Hash, Hasher};use std::collections::hash_map::DefaultHasher;impl<K, V> RehashTable<K, V>where    K: Clone + Hash + Eq,{    fn hash2(&self, key: &K) -> usize {        let mut hasher = DefaultHasher::new();        key.hash(&mut hasher);        (hasher.finish() as usize) % self.capacity    }    fn hash2(&self, key: &K) -> usize {        let mut hasher = DefaultHasher::new();        key.hash(&mut hasher);        // 确保步长不为0，且与 capacity 互质        // 这里简化处理：使用一个较小的质数        7 - (hasher.finish() as usize) % 7    }}

4. 插入操作

使用再哈希法探测空位或已删除位置：

impl<K, V> RehashTable<K, V>where    K: Clone + Hash + Eq,{    fn insert(&mut self, key: K, value: V) {        if self.size >= self.capacity / 2 {            // 简单扩容逻辑可在此添加            panic!("Table too full! Consider resizing.");        }        let mut index = self.hash2(&key);        let step = self.hash2(&key);        let mut first_deleted = None;        loop {            match &self.table[index] {                Entry::Empty => {                    self.table[index] = Entry::Occupied(key, value);                    self.size += 1;                    return;                }                Entry::Deleted => {                    if first_deleted.is_none() {                        first_deleted = Some(index);                    }                }                Entry::Occupied(k, _) => {                    if k == &key {                        // 覆盖旧值                        self.table[index] = Entry::Occupied(key, value);                        return;                    }                }            }            index = (index + step) % self.capacity;        }        // 如果找到过 Deleted 位置，使用它        if let Some(idx) = first_deleted {            self.table[idx] = Entry::Occupied(key, value);            self.size += 1;        }    }}

5. 查找与删除

查找和删除也使用相同的探测序列：

impl<K, V> RehashTable<K, V>where    K: Clone + Hash + Eq,{    fn get(&self, key: &K) -> Option<&V> {        let mut index = self.hash2(key);        let step = self.hash2(key);        loop {            match &self.table[index] {                Entry::Empty => return None,                Entry::Occupied(k, v) => {                    if k == key {                        return Some(v);                    }                }                Entry::Deleted => {},            }            index = (index + step) % self.capacity;        }    }    fn remove(&mut self, key: &K) -> Option<(K, V)> {        let mut index = self.hash2(key);        let step = self.hash2(key);        loop {            match std::mem::replace(&mut self.table[index], Entry::Empty) {                Entry::Empty => return None,                Entry::Occupied(k, v) => {                    if &k == key {                        self.table[index] = Entry::Deleted;                        self.size -= 1;                        return Some((k, v));                    } else {                        self.table[index] = Entry::Occupied(k, v);                    }                }                Entry::Deleted => {                    self.table[index] = Entry::Deleted;                }            }            index = (index + step) % self.capacity;        }    }}