zsh-字符串转义和格式化

导读

上一篇讲了 zsh 的常用字符串操作,这篇开始讲更为琐碎的转义字符和格式化输出相关内容。包括转义字符、引号、printprintf 的使用等等。其中很多内容没有必要记忆,作为手册参考即可。

转义字符

转义字符是很多编程语言中都有的概念,它主要解决某些字符因为没有对应键盘按键无法直接输出、字符本身有特殊含义(比如 \")或者显示不直观(比如难以区别多个空格和一个 tab)等问题。

最常用的转义字符是 (换行)、(回车)、(tab)。

直接用 echoprint 或者 printf 内置命令都可以正常输出转义字符,但包括转义字符的字符串需要用引号(单双引号都可以)扩起来。

% echo 'Hello\n\tWorld'
Hello
        World

常用转义字符对照表,不常用的可以去查 ASCII 码表,然后使用 \xnn(如 \x14)。

转义字符
含义
ASCII 码值(十六进制)

换行

0a

回车

0d

tab

09

\

\

5c

`

`

60

\xnn

取决于 nn

nn

可以用 hexdump 命令查看字符的 ASCII 码值。

还有一些字符是可选转义(通常有特殊含义的字符都是如此)的,比如空格、"'*~$&()[]{};? 等等,即如果在引号里边则无需转义(即使转义也不出错,转义方法都说前边加一个 \),但如果在引号外边则需要转义。谨慎起见,包含半角符号的字符串全部用引号包含即可,可以避免不必要的麻烦。

可以这样检查一个字符在空格外是否需要转义,输出的字符中前边带 \ 的都是需要的。

单引号

单引号的左右主要是为了避免字符串里的特殊字符起作用。在单引号中,只有一个字符需要转义,转义符号 \ 。所以如果字符串里包含特殊符号时,最好使用单引号包含起来,避免不必要的麻烦。如果字符串需要包含单引号,可以使用这几种方法。

双引号

双引号的作用类似单引号,但没有单引号那么严格,有些特殊字符在双引号里可以继续起作用。

简单说,$ 加各种东西的用法在双引号里都是可以正常使用的,而其他特殊符号(比如 *?>)的功能通常不可用。

反引号

反引号是用来运行命令的,它会返回命令结果,以便保存到变量等等。

反引号的功能和 $( ) 功能基本一样,但 $( ) 可以嵌套,而反引号不可以,而且反引号看起来更费事,某些字体中的反引号和单引号差别不大。所以在脚本里不建议使用反引号。

print 是类似 echo 的内部命令(echo 命令很简单,不作介绍),但功能比 echo 强大很多。完全可以使用 print 代替 echo

不加参数的 printecho 的功能基本一样,但如果字符串里包含转义字符,某些情况可能不一致。如果需要输出转义字符,尽量统一使用 print,避免不一致导致的麻烦。

print 有很多参数,在 zsh 里输入 print - 然后按 tab 即可查看选项帮助(如果没有效果,需要配置 ~/.zshrc 里的补全选项,网上有很多现成的配置)。

这里以常用程度的顺序依次介绍所有的选项,另外文末有“print 选项列表”方便查询。

-l 用于分行输出字符串:

-n 用于不在输出内容的末尾自动添加换行符(echo 命令也有这个用法):

-m 用于只输出匹配到的字符串:

-o/-O/-i 用于对字符串排序:

-r 用于不对字符串进行转义。print 默认是会对转义字符进行转义的,加 -r 后会原样输出:

-c 用于将字符串按列输出。如果对自动决定的列数不满意,可以用 -C 指定列数:

-C 用于按指定列数输出字符串:

-D 用于将符合条件的路径名转化成带 ~ 的格式(~ 是家目录):

-N 用于将输出的字符串以 \x00(null)分隔,而不是空格。这样可能方便处理包含空格的字符串,xargs 等命令也可以接受以 \x00 分隔的字符串:

-x 用于将行首的 tab 替换成空格。-x 是将行首的 tab 展开成空格,-x 后的参数是一个 tab 对应的空格数:

-X 用于将所有的 tab 补全成空格。注意不是简单地替换成空格。比如每行有一个 tab,-X 8,那么如果 tab 前(到行首或者上一个 tab)有 5 个字符,就补全 3 个空格,凑够 8,这么做是为了对齐每一列的。但如果前边有 8 个或者 8 个以上字符,那么依然是一个 tab 替换成 8 个字符,因为 tab 不能凭空消失,一定要转成至少一个空格才行。如果没理解就自己多试试找规律吧。

-u 用于指定文件描述符(fd)输出。print 默认输出到 fd 1,即 stdout,可以指定成其他 fd(2 是 stderr,其他的可以运行 ls -l /proc/$$/fd 查看。

-v 用于把输出内容保存到变量:

-s/-S 用于把字符串保存到历史记录:

-z 用于把字符串输出到命令行编辑区:

-f 用于按指定格式化字符串输出,同 printf,用法见“printf 命令用法”。

-P 用于输出带颜色和特殊样式的字符串,见“输出带颜色和特殊样式的字符串”。

-b 用于辨认出 bindkey 中的转义字符串,bindkey 是 Zle 的快捷键配置内容,写脚本用不到,不作介绍。

-R 用于模拟 echo 命令,只支持 -n-e 选项,通常用不到。

printf 命令用法

printf 命令很像 c 语言的 printf 函数,用于输出格式化后的字符串:

printf 的第一个参数是格式化字符串,在 zsh 里输入 printf % 后按 tab,可以看到所有支持的用法。下面只举几个比较常用的例子:

我把完整的格式贴在这里,方便搜索:

输出带颜色和特殊样式的字符串

用 zsh 的 print -P 可以方便地输出带颜色和特殊样式的字符串,不用再和 \033[41;36;1m 之类莫名其妙的字符串打交道了。

为了方便查询,我把 print 的选项列表放在这里:

选项
功能
参数

-C

按列输出

列数

-D

替换路径成带 ~ 的版本

-N

使用 \x00 作为字符串的间隔

-O

降序排列

-P

输出颜色和特殊样式

-R

模拟 echo 命令

-S

放命令放入历史命令文件(要加引号)

-X

替换所有 tab 为空格

tab 对应空格数

-a

-c/-C 一起使用时,改为从左到右

-b

识别出 bindkey 转义字符串

-c

按列输出(自动决定列数)

-f

printf

-i

-o/-O 一起用时,大小写不敏感排序

-l

使用换行符作为字符串分隔符

-m

只输出匹配的字符串

匹配模式字符串

-n

不自动添加最后的换行符

-o

升序排列

-r

不处理转义字符

-s

放命令放入历史命令文件(不加引号)

-u

指定 fd 输出

fd 号

-v

把内容保存到变量

变量名

-x

替换行首的 tab 为空格

tab 对应空格数

-z

把内容放置到命令行编辑区

参考

zsh开发指南