iconv 是 Linux 系统中用于在不同字符编码之间转换文本的核心命令工具,常用于解决因编码不一致导致的乱码问题。
下面是它的命令格式和主要参数:
bash
iconv [选项] [-f 原始编码] [-t 目标编码] [输入文件...]
| 参数/标志 | 作用 | 使用说明 |
|---|---|---|
| -f**/** --from-code | 指定输入文件的原始编码 | 必须明确指定,否则默认会使用系统当前的语言环境(locale)编码,可能导致乱码。 |
| -t**/** --to-code | 指定输出文件的目标编码 | 必须明确指定,否则默认会使用系统当前的语言环境(locale)编码。 |
| -o**/** --output | 将转换结果写入指定文件 | 未使用时,转换结果将直接打印到终端(标准输出)。 |
| -l**/** --list | 列出 iconv支持的所有编码 | 此操作会输出一个非常长的列表,有助于确认编码的准确名称。 |
| -c | 静默丢弃无法转换的字符 | 当目标编码中不含某些源字符时,默认会报错并终止。添加 -c 后,iconv 会忽略这些字符,继续处理其余部分。 |
| -s**/** --silent | 静默模式,不输出转换过程的错误信息 | 适用于批量转换时,避免终端被大量信息刷屏。 |
| //IGNORE | 后缀追加至目标编码 ( -t**)** | 类似于 -c 选项,但即使忽略字符也会在转换后打印错误提示。 |
| //TRANSLIT | 后缀追加至目标编码 ( -t**)** | 若字符在目标编码中不存在,会尝试将其音译(transliterate)为一个或多个最相似的字符。 |
💡 常用编码
日常工作中,掌握几种核心编码足以应对大多数场景:
- UTF-8:最通用的编码,Linux/macOS 系统默认,推荐作为目标编码。
- GBK / GB2312:中文 Windows 环境常见编码。
- GB18030:国标中文编码,是 GBK 的超集,支持更全面的中文字符。
- ASCII:仅支持英文字母、数字和符号的基础编码。
- ISO-8859-1 (Latin-1):支持西欧语言的单字节编码。
💡 应用示例
以下是一些常见的使用场景,可以帮助你更好地理解 iconv 的用法。
1. 基本文件转换
将 GBK 编码的文件转换为 UTF-8,并保存到新文件:
bash
#输入文件input.txt是GBK编码,输出文件为output.txt
iconv -f GBK -t UTF-8 input.txt -o output.txt
说明 :操作完成后,input.txt 保持不变,结果是生成了一个新的 UTF-8 编码文件。
2. 转换后直接显示(不保存)
直接查看由 ISO-8859-1 编码文件转换来的内容,不生成新文件:
bash
#查看转换后的内容
iconv -f ISO-8859-1 -t UTF-8 myfile.txt
3. 处理管道输入
iconv 也能和其他命令配合,处理标准输入流:
bash
#将当前目录的文件列表按GBK编码输出(某些Windows程序可能需要)
ls | iconv -f UTF-8 -t GBK