awk 入门
1. 基本语法
awk [option] ‘PATTERN{ACTION STATEMENTS}’ FILE
awk按照行来读取文档,根据输入分隔符切分成小部分(用內建变量来表示$0 ,$1 ,$2 等),用ACTION STATEMENTS 来处理该行文本。$0表示显示整行。
2. 举例
root:x:0:0:root:/root:/usr/bin/zsh
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
sync:x:4:65534:sync:/bin:/bin/sync
假设上面文本为demo.txt的内容,执行下面命令效果如下:
$ awk -F ':' '{ print $1 }' demo.txt
root
daemon
bin
sys
sync
3. 变量
FS:input field seperator:输入字段分隔符,默认空白字符。也可使用-v指定。
OFS:输出字段分隔符。使用-v指定。
RS:输入时的换行符
ORS:输出时的换行符
NF:number of field 每一行的字段数量。加上$NF表示最后一列。
NR:number of record 文件的行数,打印出来是打印行号
FNR:多个文件中的行数分别计数
FILENAME:当前文件的文件名
ARGC:参数命令行中参数的个数
ARGV:返回数组,命令行中的每个参数
print 命令里面,如果原样输出字符,要放在双引号里面.
4. 函数
例如,同样的文本执行如下命令效果如下
$ awk -F ':' '{ print toupper($1) }' demo.txt
ROOT
DAEMON
BIN
SYS
SYN
常用的函数如下
tolower():字符转为小写。
length():返回字符串长度。
substr():返回子字符串。
[官方网站](Built-in (The GNU Awk User’s Guide))
5. 条件
格式为 $ awk ‘条件 动作’ 文件名
输出条件要写在动作的前面。
例如:
$ awk -F ':' 'NR % 2 == 1 {print $1}' demo.txt
root
bin
sync
6. 正则表达式
元字符 | 功能 | 意思 |
---|
^ | 匹配行首 | 表示以某个字符开头 | $ | 匹配行尾 | 表示以某个字符结尾 | ^$ | 空行的意思 | 表示空行的意思 | . | 匹配任意单个字符 | 表示任意一个字符 | ***** | 字符***** 匹配0或多个此字符 | 表示重复的任意多个字符 | ** | 屏蔽一个元字符的特殊含义 | 表示去掉有意义的元字符的含义 | [] | 匹配中括号内的字符 | 表示过滤括号内的字符 | .* | 代表任意多个字符 | 就是代表任意多个字符 | lele{n} | 用来匹配前面lele出现次数。n为次数 | 就是统计前面lele出现的次数 |
|