【嵌入式开发 Linux 常用命令系列 7.2 -- awk 找到空格并插入字符】

文章目录

    • [awk 列字符处理](#awk 列字符处理)
    • [awk gsub 学习](#awk gsub 学习)

awk 列字符处理

在工作中经常需要需要复制PDF文件表格中的数据,但是复制完成后,就不会以表格的形式存在了。所以想能不能使用linux 脚本或者命令来将复制的内容重新做成表格,比如做成 CSDN markdown 识别的表格。这个时候就可以使用 awk 命令来完成这个工作了。

如下内容是从PDF拷贝过来的内容(ARM 的寄存器表):

css 复制代码
Number Offset Name Access Width Type Description
0 0x000 - - - - Reserved
1 0x004 TRCPRGCTLR RW 32 Trace Programming Control Register
2 0x008 TRCPROCSELR RW 32 Trace PE Select Control Register
3 0x00C TRCSTATR RO 32 Trace Trace Status Register
4 0x010 TRCCONFIGR RW 32 Trace Trace Configuration Register
5 0x014 - - - - Reserved
6 0x018 TRCAUXCTLR RW 32 Trace Auxiliary Control Register
7 0x01C - - - Trace Reserved
8 0x020 TRCEVENTCTL0R RW 32 Trace Event Control 0 Register
9 0x024 TRCEVENTCTL1R RW 32 Trace Event Control 1 Register
10 0x028 - - - - Reserved
11 0x02C TRCSTALLCTLR RW 32 Trace Stall Control Register
12 0x030 TRCTSCTLR RW 32 Trace Global Timestamp Control Register
13 0x034 TRCSYNCPR RWa 32 Trace Synchronization Period Register
14 0x038 TRCCCCTLR RW 32 Trace Cycle Count Control Register
15 0x03C TRCBBCTLR RW 32 Trace Branch Broadcast Control Register
16 0x040 TRCTRACEIDR RW 32 Trace Trace ID Register
17 0x044 TRCQCTLR RW 32 Trace Q Element Control Register
18-31 0x048-0x07C - - - - Reserved
32 0x080 TRCVICTLR RW 32 Trace ViewInst Main Control Register
33 0x084 TRCVIIECTLR RW 32 Trace ViewInst Include/Exclude Control
Register
34 0x088 TRCVISSCTLR RW 32 Trace ViewInst Start/Stop Control Register
35 0x08C TRCVIPCSSCTLR RW 32 Trace ViewInst Start/Stop PE Comparator
Control Register
36-39 0x090-0x09C - - - - Reserved
40 0x0A0 TRCVDCTLR RW 32 Trace ViewData Main Control Register
41 0x0A4 TRCVDSACCTLR RW 32 Trace ViewData Include/Exclude Single
Address Comparator Control Register
42 0x0A8 TRCVDARCCTLR RW 32 Trace ViewData Include/Exclude Address
Range Comparator Control Register
43-63 0x0AC-0x0FC - - - - Reserved

下面是使用 awk 命令简单处理后的效果:

Number Offset Name Access Width Type Description
0 0x000 - - - - Reserved
1 0x004 TRCPRGCTLR RW 32 Trace Programming
2 0x008 TRCPROCSELR RW 32 Trace PE
3 0x00C TRCSTATR RO 32 Trace Trace
4 0x010 TRCCONFIGR RW 32 Trace Trace
5 0x014 - - - - Reserved
6 0x018 TRCAUXCTLR RW 32 Trace Auxiliary
7 0x01C - - - Trace Reserved
8 0x020 TRCEVENTCTL0R RW 32 Trace Event
9 0x024 TRCEVENTCTL1R RW 32 Trace Event
10 0x028 - - - - Reserved
11 0x02C TRCSTALLCTLR RW 32 Trace Stall
12 0x030 TRCTSCTLR RW 32 Trace Global
13 0x034 TRCSYNCPR RWa 32 Trace Synchronization
14 0x038 TRCCCCTLR RW 32 Trace Cycle
15 0x03C TRCBBCTLR RW 32 Trace Branch
16 0x040 TRCTRACEIDR RW 32 Trace Trace
17 0x044 TRCQCTLR RW 32 Trace Q
18-31 0x048-0x07C - - - - Reserved
32 0x080 TRCVICTLR RW 32 Trace ViewInst
33 0x084 TRCVIIECTLR RW 32 Trace ViewInst
Register
34 0x088 TRCVISSCTLR RW 32 Trace ViewInst
35 0x08C TRCVIPCSSCTLR RW 32 Trace ViewInst
Control Register
36-39 0x090-0x09C - - - - Reserved
40 0x0A0 TRCVDCTLR RW 32 Trace ViewData
41 0x0A4 TRCVDSACCTLR RW 32 Trace ViewData
Address Comparator Control Register
42 0x0A8 TRCVDARCCTLR RW 32 Trace ViewData
Range Comparator Control Register
43-63 0x0AC-0x0FC - - - - Reserved

处理命令如下

powershell 复制代码
awk '{gsub(/ /,"&|"); print}' csdn.txt

这里是命令的解释:

  • awk 是文本处理的命令;
  • gsub(/ /,"&X")gsub函数,它查找每个空格(/ /)并用该空格和字符"|"("&|")替换它。"&"代表原始匹配的内容,此处即空格;
  • print 是用来打印每一行;
  • filename 是你要处理的文件名。

这个命令会读取文件中的每一行,并在每个空格后面插入字符"X",然后打印出来。

注意: 处理完成后还需在表头后面加上一行:|-|-|-|-|-|-|-|,这个是 markdown 表格的识别符。

awk gsub 学习

gsub 是awk中的一个函数,用于进行全局替换。其语法格式如下:

powershell 复制代码
gsub(regexp, replacement [, target])
  • regexp 是一个正则表达式,用于匹配你想要替换的内容。
  • replacement 是你想要替换成的内容。
  • target 是一个可选的参数,表示你想要替换的字段。如果省略,那么默认替换整行。

gsub 函数会查找 target 中所有匹配regexp的部分,并用 replacement 进行替换。所有的替换操作在一个字段或整行中都是全局的,也就是说,会替换所有匹配的部分,而不仅仅是第一个。

举个例子,假设我们有一个文件,其中一行是:

kotlin 复制代码
hello world, hello awk, hello gsub

我们想要把所有的"hello"替换成"hi",可以使用下面的命令:

kotlin 复制代码
awk '{gsub(/hello/,"hi"); print}' filename

/hello/ 是一个正则表达式,匹配所有的"hello","hi"是我们想要替换成的内容。

运行上面的命令后,输出将会是:

kotlin 复制代码
hi world, hi awk, hi gsub

可以看到,所有的"hello"都被"hi"替换了。

相关推荐
云和数据.ChenGuang7 分钟前
关闭 GitLab 升级提示的详细方法
运维·自动化·gitlab·es运维
007php00716 分钟前
服务器上PHP环境安装与更新版本和扩展(安装PHP、Nginx、Redis、Swoole和OPcache)
运维·服务器·后端·nginx·golang·测试用例·php
冰橙子id4 小时前
linux-远程访问管理(sshd,scp,sftp)
linux·网络·ssh
光电的一只菜鸡5 小时前
ubuntu之坑(十五)——设备树
linux·数据库·ubuntu
saynaihe6 小时前
ubuntu 22.04 anaconda comfyui安装
linux·运维·服务器·ubuntu
企鹅与蟒蛇7 小时前
Ubuntu-25.04 Wayland桌面环境安装Anaconda3之后无法启动anaconda-navigator问题解决
linux·运维·python·ubuntu·anaconda
小蜜蜂爱编程7 小时前
ubuntu透网方案
运维·服务器·ubuntu
程序设计实验室7 小时前
小心误关了NAS服务器!修改Linux的电源键功能
linux·nas
AI视觉网奇7 小时前
git 访问 github
运维·开发语言·docker
头发那是一根不剩了8 小时前
nginx:SSL_CTX_use_PrivateKey failed
运维·服务器