当前位置：首页 > 系统教程 > 正文

Linux awk命令全面详解（从入门到精通）

主机测评网
系统教程
2026-03-08
173

Linux awk命令全面详解（从入门到精通）

掌握awk文本处理工具，轻松处理数据

awk命令是Linux/Unix环境下强大的文本处理工具，其名称来源于三位创始人Aho、Weinberger和Kernighan的姓氏首字母。它不仅能按行处理数据，还能将行分割成字段进行精细化操作，被广泛应用于日志分析、报表生成、数据提取等场景。本文将从零开始，详细讲解awk的记录、字段、命令空间等核心概念，并通过实例帮助读者快速上手。

一、awk基础：记录与字段

在awk中，记录（Record）通常指文本中的一行，默认由换行符分隔。内置变量RS（Record Separator）可自定义记录分隔符，ORS（Output Record Separator）定义输出时记录间的分隔符。NR（Number of Record）则表示当前已处理的记录数。

字段（Field）是记录被分割后的单元，默认以空白字符（空格或制表符）分隔。内置变量FS（Field Separator）可指定字段分隔符，OFS（Output Field Separator）定义输出字段间的分隔符。NF（Number of Field）表示当前记录的字段数，而$0代表整条记录，$1、$2等则分别对应第一个、第二个字段。

二、awk命令空间与执行流程

awk的命令空间主要体现在其独特的程序结构：BEGIN { ... } /pattern/ { action } END { ... }。BEGIN块在读取任何输入前执行，适合初始化变量或打印表头；pattern部分用于匹配特定记录，只有满足条件的记录才会执行对应的action；END块在所有输入处理完毕后执行，常用于输出汇总信息。

此外，awk支持变量（无需声明）、数组（包括关联数组）、算术运算、字符串函数、控制流（if-else、while、for）等，构成了一个完整的文本处理编程环境。例如，可以利用数组统计单词频率，或通过内置函数gsub()、split()等实现复杂数据提取。

三、实用示例：从基础到进阶

下面通过几个典型场景演示awk的威力。假设有一个员工数据文件employees.txt，内容如下：

Name  Department  SalaryAlice HR  5000Bob   IT     6000Carol Finance 5500

1. 打印所有员工姓名和部门：awk "{print $1, $2}" employees.txt2. 筛选工资大于5500的员工：awk "$3 > 5500 {print $1}" employees.txt3. 使用BEGIN和END计算平均工资：awk "BEGIN {sum=0; count=0} {sum+=$3; count++} END {print "平均工资:", sum/count}" employees.txt