alpine 和 ubuntu 系统中文乱码问题

简介

最近在制作alpine的java镜像和Ubuntu的java镜像。输出的日志中的中文,以及附件等相关涉及中文的都变成问号,这是由于系统缺乏相应的编码文件导致,需要在系统里安装相应的中文编码,中文编码主要有zh_CN.gb18030、zh_CN.gbk、zh_CN.gbk2312、zh_CN.utf8。如果中文是gbk编码的,需要将变量LANG设置成gb18030或gbk编码,如果中文是utf8编码的需要LANG设置成utf-8编码。现将安装过程记录如下:

一、alpine系统中文问号乱码

【1】下载地址:

https://alpine-pkgs.sgerrand.com/sgerrand.rsa.pub

https://github.com/sgerrand/alpine-pkg-glibc/releases/download/2.29-r0/glibc-2.29-r0.apk

https://github.com/sgerrand/alpine-pkg-glibc/releases/download/2.29-r0/glibc-bin-2.29-r0.apk

https://github.com/sgerrand/alpine-pkg-glibc/releases/download/2.29-r0/glibc-i18n-2.29-r0.apk

【2】安装glibc

将sgerrand.rsa.pub 放到 /etc/apk/keys目录下,然后执行如下命令安装apk文件

bash 复制代码
apk add glibc-2.29-r0.apk glibc-bin-2.29-r0.apk glibc-i18n-2.29-r0.apk

【3】添加path变量

bash 复制代码
export PATH=/usr/glibc-compat/bin:$PATH

【4】使用localedef生成本地化配置

bash 复制代码
localedef -i en_US -f UTF-8 en_US.UTF-8
localedef -i zh_CN -f UTF-8 zh_CN.UTF-8
localedef -i zh_CN -f GBK zh_CN.GBK
localedef -i zh_CN -f GB18030 zh_CN.GB18030

【5】设置环境变量

bash 复制代码
export LANG=zh_CN.GB18030
export LANGUAGE="zh_CN:zh:en_US:en"
export LC_TIME="en_US.UTF8"

经过以上步骤以后,如果是GBK编码的中文就不会乱码了,如果是UTF8编码的话,就改成utf8的编码。LANG=zh_CN.UTF-8 。如果是制作dockerfile的话,参考代码如下:

bash 复制代码
FROM alpine:3.17
ENV LANG=zh_CN.GB18030
ENV LANGUAGE="zh_CN:zh:en_US:en"
ENV LC_TIME=en_US.UTF8
ENV PATH=$PATH:/usr/glibc-compat/bin:$JAVA_HOME/bin

COPY glibc-2.29-r0.apk glibc-bin-2.29-r0.apk glibc-i18n-2.29-r0.apk /tmp
RUN mkdir -p /etc/apk/keys
COPY sgerrand.rsa.pub /etc/apk/keys
RUN    apk add --force-overwrite /tmp/glibc-2.29-r0.apk /tmp/glibc-bin-2.29-r0.apk /tmp/glibc-i18n-2.29-r0.apk \
    && rm -f /tmp/glibc-2.29-r0.apk /tmp/glibc-bin-2.29-r0.apk /tmp/glibc-i18n-2.29-r0.apk \
    && localedef -i en_US -f UTF-8 en_US.UTF-8 \
            && localedef -i zh_CN -f UTF-8 zh_CN.UTF-8 \
            && localedef -i zh_CN -f GBK zh_CN.GBK \
            && localedef -i zh_CN -f GB18030 zh_CN.GB18030

二、ubuntu中文问号乱码

【1】安装libgcc及语言包

bash 复制代码
apt-get update
apt-get -y install vim language-pack-zh-hans gcc libgcc-s1 libssl-dev

【2】本地化配置

bash 复制代码
 locale-gen zh_CN.GB18030
 locale-gen zh_CN.GBK
 locale-gen zh_CN.UTF-8
locale-gen en_US.UTF-8

【3】设置环境变量

bash 复制代码
export LANG=zh_CN.GB18030
export LANGUAGE="zh_CN:zh:en_US:en"
export LC_TIME=en_US.UTF8

经过以上步骤以后,如果是GBK编码的中文就不会乱码了,如果是UTF8编码的话,就改成utf8的编码。LANG=zh_CN.UTF-8 。如果是制作dockerfile的话,参考代码如下:

bash 复制代码
FROM ubuntu:22.04

ENV LANG=zh_CN.GB18030
ENV LANGUAGE="zh_CN:zh:en_US:en"
ENV LC_TIME=en_US.UTF8

ENV TZ=Asia/Shanghai
RUN ln -snf /usr/share/zoneinfo/${TZ} /etc/localtime && echo ${TZ} > /etc/timezone


RUN     apt-get update \
        && apt-get -y install vim language-pack-zh-hans gcc libgcc-s1 libssl-dev \
        && locale-gen zh_CN.GB18030 \
        && locale-gen zh_CN.GBK \
        && locale-gen zh_CN.UTF-8 \
        && locale-gen en_US.UTF-8 \
        && rm /bin/sh \
        && ln -s /bin/bash /bin/sh \
        && apt-get -y autoremove \
        && echo "LC_TIME=en_US.UTF8" >>/etc/default/locale \
        && rm -rf /var/lib/apt/lists/*

三、系统语言环境确认

【1】alpine 系统下locale命令查看系统语言环境

没有执行本地化时,执行locale -a 命令是不会显示zh_CN.gb18030、zh_CN.gbk、zh_CN.gbk2312、zh_CN.utf8,如果系统中的中文是utf-8编码的话,需要将LANG改成zh_CN.utf8。

bash 复制代码
执行命令:locale
返回如下:
LANG=zh_CN.GB18030
LC_CTYPE="zh_CN.GB18030"
LC_NUMERIC="zh_CN.GB18030"
LC_TIME=en_US.UTF8
LC_COLLATE="zh_CN.GB18030"
LC_MONETARY="zh_CN.GB18030"
LC_MESSAGES="zh_CN.GB18030"
LC_PAPER="zh_CN.GB18030"
LC_NAME="zh_CN.GB18030"
LC_ADDRESS="zh_CN.GB18030"
LC_TELEPHONE="zh_CN.GB18030"
LC_MEASUREMENT="zh_CN.GB18030"
LC_IDENTIFICATION="zh_CN.GB18030"
LC_ALL=

执行命令:locale -a
返回如下:
C
C.utf8
en_US.utf8
POSIX
zh_CN.gb18030
zh_CN.gbk
zh_CN.gbk2312
zh_CN.utf8

【2】Ubuntu 系统下locale命令查看系统语言环境

没有执行本地化时,执行locale -a 命令是不会显示zh_CN.gb18030、zh_CN.gbk、zh_CN.gbk2312、zh_CN.utf8,如果系统中的中文是utf-8编码的话,需要将LANG改成zh_CN.utf8。

bash 复制代码
执行命令:
 sh-5.1# locale -a
C
C.utf8
en_US.utf8
POSIX
zh_CN.gb18030
zh_CN.gbk
zh_CN.utf8
zh_SG.utf8

执行命令:
sh-5.1# locale
LANG=zh_CN.GB18030
LANGUAGE=zh_CN:zh:en_US:en
LC_CTYPE="zh_CN.GB18030"
LC_NUMERIC="zh_CN.GB18030"
LC_TIME=en_US.UTF8
LC_COLLATE="zh_CN.GB18030"
LC_MONETARY="zh_CN.GB18030"
LC_MESSAGES="zh_CN.GB18030"
LC_PAPER="zh_CN.GB18030"
LC_NAME="zh_CN.GB18030"
LC_ADDRESS="zh_CN.GB18030"
LC_TELEPHONE="zh_CN.GB18030"
LC_MEASUREMENT="zh_CN.GB18030"
LC_IDENTIFICATION="zh_CN.GB18030"
LC_ALL=

【3】locale中各个变量的讲解

locale命令的详细用法参考:blog.fpliu.com/it/software/GNU/glibc/bin/locale

相关推荐
小歆88413 分钟前
100%全国产化时钟服务器、全国产化校时服务器、全国产化授时服务器
运维·服务器
涛ing42 分钟前
21. C语言 `typedef`:类型重命名
linux·c语言·开发语言·c++·vscode·算法·visual studio
翻滚吧键盘43 分钟前
debian中apt的配置与解析
运维·debian
0xfather1 小时前
在Debian系统中安装Debian(Linux版PE装机)
linux·服务器·debian
workingman_li1 小时前
centos虚拟机异常关闭,导致数据出现问题
linux·运维·centos
Fireworkitte2 小时前
linux环境变量配置文件区别 /etc/profile和~/.bash_profile
linux
PaLu-LI2 小时前
ORB-SLAM2源码学习:Initializer.cc⑧: Initializer::CheckRT检验三角化结果
c++·人工智能·opencv·学习·ubuntu·计算机视觉
Jackson~Y2 小时前
Linux(LAMP)
linux·运维·服务器
不知 不知2 小时前
最新-CentOS 7安装1 Panel Linux 服务器运维管理面板
linux·运维·服务器·centos
晚秋贰拾伍4 小时前
设计模式的艺术-职责链模式
运维·设计模式·运维开发·责任链模式·开闭原则·单一职责原则