linux麾下大将sed是如何仿真鼠标键盘实现换行符的替换

不知道你有没有经常使用sed , 在使用sed 进行文本编辑的时候使用s模式总是无法如愿的替换掉换行符 , 这个属实让我非常不爽,翻阅资料才知道原来是我的模式没有用对

替换换行符

  • sed 的处理是针对行的,换句话说处理单元是行内容,处理完成之后还是被回置到行内容中,所以你想要替换文本中的换行符仅仅通过上面提到的替换功能是不行的。
  • echo '1,2,3,4' | sed 's/,/\n/g' 进行模拟四行文本。后续我们看看能不能通过 s 将换行符替换回来。
  • echo '1,2,3,4' | sed 's/,/\n/g' | sed 's/\n/:/g'
  • 事实证明我们并没有将四行内容合并成一行且用 拼接没一行的内容。至于原因吗,我们一开始就说了,sed 的处理单元是行,处理写回去还是行,那么自然就会产生换行符了。那么我们该怎么解决呢?
  • sed 中提供了一种模式(追加文本流中的下一行到模式空间进行合并处理)。这种模式就是 N; 这个模式怎么理解呢?就是他会将 下一行追加到当前行(包括换行符号) ,如果我们在这种模式没有将换行符替换掉,等写回去的时候还是新站新行。所以出现如下效果。

半吊子替换了一半的换行符

  • 你可能会说那好办,我们将换行符替换掉就可以了。我想说并没有这么简单,我们先来看下直接替换后是啥效果
  • 看到了吗,他并没有将文本合并成一行,而是每两行合并成 1行输出,这是为什么呢?原因还得看 N 模式,我们上面提到 N 模式是将下一行内容追加到当前行一次性处理,sed 在处理第一行的时候第二行提出过来,处理完成之后写入第一行,光标移动到下一行继续将他的下一行读取过来处理,这就解释了为什么每两行合并成一行了。

  • 主要问题是出现光标下移。那么 sed 中能不能控制光标呢?答案是肯定的。

  • 目前我没有找到控制光标移动的方法,但是 sed 支持打标签,这也是 vim 中的功能,sed 作为 linux 三大神器肯定也是有对应功能的,在 sed 中通过 ; 进行语法切割的,和 VIM 一样通过 : label 的方式进行打标签,然后通过 b 或者 t 跳转到标签处。关于 b 和 t 的区别这里不赘述了,记住一句话 b 是跳过当前行脚本后在跳转 label 。这点很重要决定了他存在的位置。

  • 那么我们只需要在每次合并下一行内容并替换换行符后跳回刚开始的那一行就行了。sed ':l;N;s/\n/,/g;tl'

结合光标跳转完美实现换行替换

  • 上面我们使用 t 跳转标签。我们也说了 b 同样可以跳转标签。
  • b 是忽略当前行跳转,因为我们是先执行替换在执行 bl 跳转 l 标签的,所以效果是一样的。但是替换脚本和 bl 位置对掉效果就不一样了。
  • tl 好像加了和没加是一个效果,的确是的,因为先跳转在替换,替换后还是会继续跳到下一行。这里主要是为了大家看看 bl 和 tl 的区别的。

  • 如果你就想先跳转在执行替换脚本的方式实现整个换行操作也是可以的。

  • 上面的又让你蒙蔽了吧。!b 就是不跳过后面的执行,也就是 !bl;...; == ...;tl

  • 至此,我们跳转实现换行符替换就结束了。

总结

特殊含义 解释
\[:alpha:] 匹配任意字母字符,不管是大写还是小写(等价于a-zA-Z
\[:alnum:] 匹配任意字母数字字符09、AZ或a~z(等价于A-Za-z0-9)
\[:blank:] 匹配空格或制表符
\[:digit:] 匹配0~9之间的数字(等价于0-9
\[:lower:] 匹配小写字母字符a~z(等价于a-z
\[:print:] 匹配任意可打印字符
\[:punct:] 匹配标点符号
\[:space:] 匹配任意空白字符:空格、制表符、NL、FF、VT和CR
\[:upper:] 匹配任意大写字母字符A~Z(等价于A-Z
相关推荐
卷无止境8 小时前
现代 C++特性大盘点:一门脱胎换骨的老语言
c++·后端
Ausra无忧8 小时前
记录在公司把单服务器升级成多服务器架构流程
前端·后端·架构
XiaoYuanCode9 小时前
Spring Cloud Alibaba实战01|Nacos入门服务注册与配置中心
后端
宇宙之一粟9 小时前
乐企版式文件生成平台
java·后端·python
不好听6139 小时前
拆解 LLM Tool Use 的完整机制:从缸中大脑到 Agent 觉醒
架构·llm·agent
java小白小9 小时前
SpringBoot(11):Spring Security 入门——让你的项目加上登录墙
后端
一只公羊9 小时前
在 Ubuntu 26.04 宿主机上利用 Docker 构建低版本 glibc 兼容编译环境
后端
玉宇夕落9 小时前
别被AI骗了!深度拆解 LLM Tool Use 背后的“缸中大脑”与代码真相
后端
starsstreaming9 小时前
200K 的窗口,跑完 400K 的任务:Claude Code 上下文压缩机制全拆解
架构