当前位置：首页 > 服务器技术 > 正文

Shell数组去重全攻略（小白也能轻松掌握的Linux去重技巧）

在日常使用Linux Shell脚本时，我们经常会遇到需要对数组进行去重操作的场景。比如从日志中提取唯一IP地址、合并多个列表并去除重复项等。本文将详细介绍几种简单有效的Shell数组去重方法，即使你是刚接触Linux的小白，也能轻松上手！

方法一：使用 sort + uniq 命令组合

这是最经典、最常用的去重方法。利用 sort 对数据排序，再用 uniq 去除相邻重复项。

# 定义一个包含重复元素的数组arr=("apple" "banana" "apple" "orange" "banana" "grape")# 使用 sort + uniq 去重dedup_arr=($(printf "%s\n" "${arr[@]}" | sort -u))# 输出结果echo "去重后的数组: ${dedup_arr[@]}"

说明：sort -u 相当于先排序再去重，比单独使用 sort | uniq 更简洁高效。

方法二：使用 awk 去重（保留原始顺序）

如果你希望保留数组元素的原始顺序（不去打乱），可以使用 awk 来实现。

arr=("apple" "banana" "apple" "orange" "banana" "grape")dedup_arr=($(printf "%s\n" "${arr[@]}" | awk '!seen[$0]++'))echo "保留顺序去重后: ${dedup_arr[@]}"

原理：!seen[$0]++ 表示如果当前行（$0）未被记录过，则输出；否则跳过。这样就能在不改变顺序的前提下完成去重。

方法三：使用关联数组（Bash 4.0+）

如果你使用的是 Bash 4.0 或更高版本，可以利用关联数组（associative array）来实现高效去重。

declare -A seenarr=("apple" "banana" "apple" "orange" "banana" "grape")dedup_arr=()for item in "${arr[@]}"; do    if [[ -z ${seen[$item]} ]]; then        dedup_arr+=("$item")        seen[$item]=1    fidoneecho "使用关联数组去重: ${dedup_arr[@]}"

这种方法逻辑清晰，效率高，特别适合处理大型数组。但请注意：它依赖 Bash 4.0+，在 macOS 默认的 Bash（版本较低）中可能无法运行。