一、sed
1、sed执行原理
sed编辑器读取数据流时,它会基于换行符的位置将数据分成行。sed编 辑器根据定义好的脚本命令一次处理一行数据,然后移到下一行重复这个过程。
N:将下一行数据加载创建一个多行组来执行
D:删除多行组中的一行
P:打印某行
2、next命令
删除:
sed '/^$/d' data1.txt #--单行删除空行
sed 'N ; /System/d' data4.txt #--多行删除
替换:sed 's/sys/aaa/' data4.txt #--替换sys为aaa,/可以用任意字符表示只需满足s的格式
sed '1,10 s/sys/aaa/' data4.txt #--替换1到10行的数据
删除:sed 'd' data4.txt #--全部删除
sed '2,10d' data4.txt #--删除2到4行
sed '/2/,/3/d' data4.txt #--从第一个位置开始删除,第二个位置关闭
插入;sed '1i aaa' data4.txt #--上一行插入aaa
二、awk
1、原理:逐行读取文本,默认以空格或tab键为分隔符分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令。
sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个"字段"然后再进行处理。awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。在使用awk命令的过程中,可以使用逻辑操作符"&&"表示"与"、"||"表示"或"、"!"表示"非";还可以进行简单的数学运算,如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。
内建变量:
FS:列分割符。指定每行文本的字段分隔符,默认为空格或制表位。与"-F"作用相同
NF:当前处理的行的字段个数
NR:当前处理的行的行号(序数)
$0:当前处理的行的整行内容
$n:当前处理行的第n个字段
FILENAME:被处理的文件名
RS:行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是'\n'
按行输出:
awk '{print}' testfile #输出所有内容
awk 'NR==1,NR==3{print}' testfile #输出第 1~3 行
awk 'NR==1||NR==3{print}' testfile #输出第1行、第3行内容
按字段输出:awk -F ":" '{print $3}' /etc/passwd #输出每行中的第3个字段
awk -F ":" '{print $1,$3}' /etc/passwd #输出每行中的第1、3个字段