【嵌入式开发 Linux 常用命令系列 7.2 -- awk 找到空格并插入字符】

文章目录

    • [awk 列字符处理](#awk 列字符处理)
    • [awk gsub 学习](#awk gsub 学习)

awk 列字符处理

在工作中经常需要需要复制PDF文件表格中的数据,但是复制完成后,就不会以表格的形式存在了。所以想能不能使用linux 脚本或者命令来将复制的内容重新做成表格,比如做成 CSDN markdown 识别的表格。这个时候就可以使用 awk 命令来完成这个工作了。

如下内容是从PDF拷贝过来的内容(ARM 的寄存器表):

css 复制代码
Number Offset Name Access Width Type Description
0 0x000 - - - - Reserved
1 0x004 TRCPRGCTLR RW 32 Trace Programming Control Register
2 0x008 TRCPROCSELR RW 32 Trace PE Select Control Register
3 0x00C TRCSTATR RO 32 Trace Trace Status Register
4 0x010 TRCCONFIGR RW 32 Trace Trace Configuration Register
5 0x014 - - - - Reserved
6 0x018 TRCAUXCTLR RW 32 Trace Auxiliary Control Register
7 0x01C - - - Trace Reserved
8 0x020 TRCEVENTCTL0R RW 32 Trace Event Control 0 Register
9 0x024 TRCEVENTCTL1R RW 32 Trace Event Control 1 Register
10 0x028 - - - - Reserved
11 0x02C TRCSTALLCTLR RW 32 Trace Stall Control Register
12 0x030 TRCTSCTLR RW 32 Trace Global Timestamp Control Register
13 0x034 TRCSYNCPR RWa 32 Trace Synchronization Period Register
14 0x038 TRCCCCTLR RW 32 Trace Cycle Count Control Register
15 0x03C TRCBBCTLR RW 32 Trace Branch Broadcast Control Register
16 0x040 TRCTRACEIDR RW 32 Trace Trace ID Register
17 0x044 TRCQCTLR RW 32 Trace Q Element Control Register
18-31 0x048-0x07C - - - - Reserved
32 0x080 TRCVICTLR RW 32 Trace ViewInst Main Control Register
33 0x084 TRCVIIECTLR RW 32 Trace ViewInst Include/Exclude Control
Register
34 0x088 TRCVISSCTLR RW 32 Trace ViewInst Start/Stop Control Register
35 0x08C TRCVIPCSSCTLR RW 32 Trace ViewInst Start/Stop PE Comparator
Control Register
36-39 0x090-0x09C - - - - Reserved
40 0x0A0 TRCVDCTLR RW 32 Trace ViewData Main Control Register
41 0x0A4 TRCVDSACCTLR RW 32 Trace ViewData Include/Exclude Single
Address Comparator Control Register
42 0x0A8 TRCVDARCCTLR RW 32 Trace ViewData Include/Exclude Address
Range Comparator Control Register
43-63 0x0AC-0x0FC - - - - Reserved

下面是使用 awk 命令简单处理后的效果:

Number Offset Name Access Width Type Description
0 0x000 - - - - Reserved
1 0x004 TRCPRGCTLR RW 32 Trace Programming
2 0x008 TRCPROCSELR RW 32 Trace PE
3 0x00C TRCSTATR RO 32 Trace Trace
4 0x010 TRCCONFIGR RW 32 Trace Trace
5 0x014 - - - - Reserved
6 0x018 TRCAUXCTLR RW 32 Trace Auxiliary
7 0x01C - - - Trace Reserved
8 0x020 TRCEVENTCTL0R RW 32 Trace Event
9 0x024 TRCEVENTCTL1R RW 32 Trace Event
10 0x028 - - - - Reserved
11 0x02C TRCSTALLCTLR RW 32 Trace Stall
12 0x030 TRCTSCTLR RW 32 Trace Global
13 0x034 TRCSYNCPR RWa 32 Trace Synchronization
14 0x038 TRCCCCTLR RW 32 Trace Cycle
15 0x03C TRCBBCTLR RW 32 Trace Branch
16 0x040 TRCTRACEIDR RW 32 Trace Trace
17 0x044 TRCQCTLR RW 32 Trace Q
18-31 0x048-0x07C - - - - Reserved
32 0x080 TRCVICTLR RW 32 Trace ViewInst
33 0x084 TRCVIIECTLR RW 32 Trace ViewInst
Register
34 0x088 TRCVISSCTLR RW 32 Trace ViewInst
35 0x08C TRCVIPCSSCTLR RW 32 Trace ViewInst
Control Register
36-39 0x090-0x09C - - - - Reserved
40 0x0A0 TRCVDCTLR RW 32 Trace ViewData
41 0x0A4 TRCVDSACCTLR RW 32 Trace ViewData
Address Comparator Control Register
42 0x0A8 TRCVDARCCTLR RW 32 Trace ViewData
Range Comparator Control Register
43-63 0x0AC-0x0FC - - - - Reserved

处理命令如下

powershell 复制代码
awk '{gsub(/ /,"&|"); print}' csdn.txt

这里是命令的解释:

  • awk 是文本处理的命令;
  • gsub(/ /,"&X")gsub函数,它查找每个空格(/ /)并用该空格和字符"|"("&|")替换它。"&"代表原始匹配的内容,此处即空格;
  • print 是用来打印每一行;
  • filename 是你要处理的文件名。

这个命令会读取文件中的每一行,并在每个空格后面插入字符"X",然后打印出来。

注意: 处理完成后还需在表头后面加上一行:|-|-|-|-|-|-|-|,这个是 markdown 表格的识别符。

awk gsub 学习

gsub 是awk中的一个函数,用于进行全局替换。其语法格式如下:

powershell 复制代码
gsub(regexp, replacement [, target])
  • regexp 是一个正则表达式,用于匹配你想要替换的内容。
  • replacement 是你想要替换成的内容。
  • target 是一个可选的参数,表示你想要替换的字段。如果省略,那么默认替换整行。

gsub 函数会查找 target 中所有匹配regexp的部分,并用 replacement 进行替换。所有的替换操作在一个字段或整行中都是全局的,也就是说,会替换所有匹配的部分,而不仅仅是第一个。

举个例子,假设我们有一个文件,其中一行是:

kotlin 复制代码
hello world, hello awk, hello gsub

我们想要把所有的"hello"替换成"hi",可以使用下面的命令:

kotlin 复制代码
awk '{gsub(/hello/,"hi"); print}' filename

/hello/ 是一个正则表达式,匹配所有的"hello","hi"是我们想要替换成的内容。

运行上面的命令后,输出将会是:

kotlin 复制代码
hi world, hi awk, hi gsub

可以看到,所有的"hello"都被"hi"替换了。

相关推荐
王小义笔记4 分钟前
WSL(Linux)如何安装conda
linux·运维·conda
Fairy要carry7 分钟前
面试10-Agent 团队协议的管理
运维·服务器·网络
袁庭新7 分钟前
M系列芯片Mac上通过Homebrew一键安装/卸载Nginx并上线项目全指南
运维·nginx·macos·袁庭新·袁庭新ai
偷懒下载原神14 分钟前
【linux操作系统】信号
linux·运维·服务器·开发语言·c++·git·后端
skd899918 分钟前
MicroSIP助手,智慧语音V3.2.3版本,MicroSIP自动拨号助手
服务器
源远流长jerry21 分钟前
RDMA 传输服务详解:可靠性与连接模式的深度剖析
linux·运维·网络·tcp/ip·架构
存储服务专家StorageExpert25 分钟前
NetApp NVME SSD 盘的学习笔记
运维·服务器·笔记·学习·存储维护·emc存储·netapp
小璐资源网28 分钟前
新服务器上线:标准化初始化流程
运维·服务器
AMoon丶37 分钟前
Golang--垃圾回收
java·linux·开发语言·jvm·后端·算法·golang
2501_9181269138 分钟前
学习所有python写服务器的语句
服务器·人工智能·python·学习·个人开发