【嵌入式开发 Linux 常用命令系列 7.2 -- awk 找到空格并插入字符】

文章目录

    • [awk 列字符处理](#awk 列字符处理)
    • [awk gsub 学习](#awk gsub 学习)

awk 列字符处理

在工作中经常需要需要复制PDF文件表格中的数据,但是复制完成后,就不会以表格的形式存在了。所以想能不能使用linux 脚本或者命令来将复制的内容重新做成表格,比如做成 CSDN markdown 识别的表格。这个时候就可以使用 awk 命令来完成这个工作了。

如下内容是从PDF拷贝过来的内容(ARM 的寄存器表):

css 复制代码
Number Offset Name Access Width Type Description
0 0x000 - - - - Reserved
1 0x004 TRCPRGCTLR RW 32 Trace Programming Control Register
2 0x008 TRCPROCSELR RW 32 Trace PE Select Control Register
3 0x00C TRCSTATR RO 32 Trace Trace Status Register
4 0x010 TRCCONFIGR RW 32 Trace Trace Configuration Register
5 0x014 - - - - Reserved
6 0x018 TRCAUXCTLR RW 32 Trace Auxiliary Control Register
7 0x01C - - - Trace Reserved
8 0x020 TRCEVENTCTL0R RW 32 Trace Event Control 0 Register
9 0x024 TRCEVENTCTL1R RW 32 Trace Event Control 1 Register
10 0x028 - - - - Reserved
11 0x02C TRCSTALLCTLR RW 32 Trace Stall Control Register
12 0x030 TRCTSCTLR RW 32 Trace Global Timestamp Control Register
13 0x034 TRCSYNCPR RWa 32 Trace Synchronization Period Register
14 0x038 TRCCCCTLR RW 32 Trace Cycle Count Control Register
15 0x03C TRCBBCTLR RW 32 Trace Branch Broadcast Control Register
16 0x040 TRCTRACEIDR RW 32 Trace Trace ID Register
17 0x044 TRCQCTLR RW 32 Trace Q Element Control Register
18-31 0x048-0x07C - - - - Reserved
32 0x080 TRCVICTLR RW 32 Trace ViewInst Main Control Register
33 0x084 TRCVIIECTLR RW 32 Trace ViewInst Include/Exclude Control
Register
34 0x088 TRCVISSCTLR RW 32 Trace ViewInst Start/Stop Control Register
35 0x08C TRCVIPCSSCTLR RW 32 Trace ViewInst Start/Stop PE Comparator
Control Register
36-39 0x090-0x09C - - - - Reserved
40 0x0A0 TRCVDCTLR RW 32 Trace ViewData Main Control Register
41 0x0A4 TRCVDSACCTLR RW 32 Trace ViewData Include/Exclude Single
Address Comparator Control Register
42 0x0A8 TRCVDARCCTLR RW 32 Trace ViewData Include/Exclude Address
Range Comparator Control Register
43-63 0x0AC-0x0FC - - - - Reserved

下面是使用 awk 命令简单处理后的效果:

Number Offset Name Access Width Type Description
0 0x000 - - - - Reserved
1 0x004 TRCPRGCTLR RW 32 Trace Programming
2 0x008 TRCPROCSELR RW 32 Trace PE
3 0x00C TRCSTATR RO 32 Trace Trace
4 0x010 TRCCONFIGR RW 32 Trace Trace
5 0x014 - - - - Reserved
6 0x018 TRCAUXCTLR RW 32 Trace Auxiliary
7 0x01C - - - Trace Reserved
8 0x020 TRCEVENTCTL0R RW 32 Trace Event
9 0x024 TRCEVENTCTL1R RW 32 Trace Event
10 0x028 - - - - Reserved
11 0x02C TRCSTALLCTLR RW 32 Trace Stall
12 0x030 TRCTSCTLR RW 32 Trace Global
13 0x034 TRCSYNCPR RWa 32 Trace Synchronization
14 0x038 TRCCCCTLR RW 32 Trace Cycle
15 0x03C TRCBBCTLR RW 32 Trace Branch
16 0x040 TRCTRACEIDR RW 32 Trace Trace
17 0x044 TRCQCTLR RW 32 Trace Q
18-31 0x048-0x07C - - - - Reserved
32 0x080 TRCVICTLR RW 32 Trace ViewInst
33 0x084 TRCVIIECTLR RW 32 Trace ViewInst
Register
34 0x088 TRCVISSCTLR RW 32 Trace ViewInst
35 0x08C TRCVIPCSSCTLR RW 32 Trace ViewInst
Control Register
36-39 0x090-0x09C - - - - Reserved
40 0x0A0 TRCVDCTLR RW 32 Trace ViewData
41 0x0A4 TRCVDSACCTLR RW 32 Trace ViewData
Address Comparator Control Register
42 0x0A8 TRCVDARCCTLR RW 32 Trace ViewData
Range Comparator Control Register
43-63 0x0AC-0x0FC - - - - Reserved

处理命令如下

powershell 复制代码
awk '{gsub(/ /,"&|"); print}' csdn.txt

这里是命令的解释:

  • awk 是文本处理的命令;
  • gsub(/ /,"&X")gsub函数,它查找每个空格(/ /)并用该空格和字符"|"("&|")替换它。"&"代表原始匹配的内容,此处即空格;
  • print 是用来打印每一行;
  • filename 是你要处理的文件名。

这个命令会读取文件中的每一行,并在每个空格后面插入字符"X",然后打印出来。

注意: 处理完成后还需在表头后面加上一行:|-|-|-|-|-|-|-|,这个是 markdown 表格的识别符。

awk gsub 学习

gsub 是awk中的一个函数,用于进行全局替换。其语法格式如下:

powershell 复制代码
gsub(regexp, replacement [, target])
  • regexp 是一个正则表达式,用于匹配你想要替换的内容。
  • replacement 是你想要替换成的内容。
  • target 是一个可选的参数,表示你想要替换的字段。如果省略,那么默认替换整行。

gsub 函数会查找 target 中所有匹配regexp的部分,并用 replacement 进行替换。所有的替换操作在一个字段或整行中都是全局的,也就是说,会替换所有匹配的部分,而不仅仅是第一个。

举个例子,假设我们有一个文件,其中一行是:

kotlin 复制代码
hello world, hello awk, hello gsub

我们想要把所有的"hello"替换成"hi",可以使用下面的命令:

kotlin 复制代码
awk '{gsub(/hello/,"hi"); print}' filename

/hello/ 是一个正则表达式,匹配所有的"hello","hi"是我们想要替换成的内容。

运行上面的命令后,输出将会是:

kotlin 复制代码
hi world, hi awk, hi gsub

可以看到,所有的"hello"都被"hi"替换了。

相关推荐
努力的小T1 小时前
基于 Bash 脚本的系统信息定时收集方案
linux·运维·服务器·网络·云计算·bash
夜光小兔纸1 小时前
Oracle 普通用户连接hang住处理方法
运维·数据库·oracle
梓懿lwh1 小时前
vim的介绍
linux·编辑器·vim
爱敲代码的边芙2 小时前
Linux:信号的保存[2]
linux·运维·服务器
葛小白12 小时前
第五天 Labview数据记录(5.1 INI配置文件读写)
服务器·labview
阿俊仔(摸鱼版)2 小时前
Python 常用运维模块之OS模块篇
运维·开发语言·python·云服务器
工程师焱记2 小时前
Linux 常用命令——系统设置篇(保姆级说明)
linux·运维·服务器
某风吾起2 小时前
linux系统中的 scp的使用方法
linux·服务器·网络
『往事』&白驹过隙;2 小时前
操作系统(Linux Kernel 0.11&Linux Kernel 0.12)解读整理——内核初始化(main & init)之缓冲区的管理
linux·c语言·数据结构·物联网·操作系统
chian-ocean2 小时前
探索Linux中的进程控制:从启动到退出的背后原理
linux·运维·服务器