Linux内核如何输出中文字符的方法示例-无双技术网

你在Windows/MacOS的登录Linux的SSH终端上很容易输入中文并且获得中文输出，比如下面这样：

Linux内核如何输出中文字符的方法示例

但是却几乎不可能将中文显示在Linux自身的 虚拟终端 上：

  [root@localhost font]# echo 皮鞋 >/dev/tty2

Linux内核如何输出中文字符的方法示例

显示了两个问号，显然Linux内核并不能识别中文。

为什么说是Linux内核不能识别中文呢？这里需要理清一个关系：

你在远程SSH终端上的输入和显示输出的行为，都是SSH终端的宿主机完成的，比如Windows，MacOS，和Linux无关。
你在Linux本地虚拟终端，比如/dev/tty1上的输入和显示输出行为，则是由Linux内核自己处理的。

比如，我在MacOS用iTerm SSH连接到了一个远程CentOS Linux，iTerm上的所有的键盘输入，显示器输出行为都是iTerm的这台MacOS宿主机完成的。

相反，如果你直接在这台CentOS Linux的虚拟终端上输入并且企图获得输出，那么这个输入输出则必须由Linux内核自身来处理。

基本上就这些。至于说为什么Linux内核不支持中文，那要了解Linux内核处理虚拟终端输入输出时是如何对待unicode的逻辑，这要涉及一大堆的理论知识，非常烦人。

反正我这里就是无法输出中文，我也不是做这个的，显然这不是一个必然要完成的工作任务，所以，我只是玩玩。

本文的目标就是要让Linux的虚拟终端可以输出中文。

仅仅是输出中文，哪怕是一个中文汉字也好。具体来讲，就是 当我在键盘敲入’A’字符时，显示器回显出来的是一个汉字。

所以说，本文并不打算 让Linux内核大规模完备地支持中文 ，这种事已经有很多人和社区做了，但是可玩性并不高，毕竟这种事是可以当私活儿赚钱的，只要是赚钱的活儿，可玩性就不高，因为要快嘛。

不需要懂冗长枯燥的unicode编码，不需要懂枯燥的font字体格式，看看怎么玩。

先展示效果吧，下面是一个8×168times 168×16的点阵例子：

Linux内核如何输出中文字符的方法示例

不是很好看，于是就做了下面一个28×1628times 1628×16的点阵：

Linux内核如何输出中文字符的方法示例

下面说一下这是如何实现的。

从你敲键盘的某个按键开始，到某个字符最终显示在虚拟终端的显示器上，这期间其实有两个映射：

键盘和字符集的映射

将某个按键事件转换为某个字符集里的某个码，比如当按下’A’键时，将其映射到0x41。

字符集和字体的映射

将某个字符集的码字映射到某个点阵用来显示。比如将0x41映射到能让人看出来是一个字符’A’的样子的8×168times 168×16点阵。

Linux的console并不能识别超过0x00ff的字符集码字，因此就不能处理码字超过0x00ff的unicode，如果希望它能做到，这就要改内核代码了。

刚才说了，修改内核代码大规模全面支持中文，这是可以赚钱的事，不但没意思，也没人会分享。

所以我尝试去修改上面的两个映射来解决问题。由于只是显示，所以我不会去修改 键盘和字符集的映射 ，因为那样仍然会碰到字符集码字超过0x00ff的处理问题。

这意味着要想显示中文，只剩下一条路，那就是修改 字符集和字体的映射 ！

这个映射肯定是保存在内核内存或者文件系统的某个地方。我可以在当前内核的config文件里找到如下的信息：

  [root@localhost font]# cat /boot/config-3.10.0-862.11.6.el7.x86_64 |grep FONT  # CONFIG_FONTS is not set  CONFIG_FONT_8x8=y  CONFIG_FONT_8x16=y

再去看/proc/kallsyms里有什么：

  [root@localhost font]# cat /proc/kallsyms |grep font.*8x  ffffffffb006a3e0 R font_vga_8x8  ffffffffb006a420 r fontdata_8x8  ffffffffb006ac20 R font_vga_8x16  ffffffffb006ac60 r fontdata_8x16  ffffffffb0307a10 r __ksymtab_font_vga_8x16  ffffffffb03234b8 r __kcrctab_font_vga_8x16  ffffffffb034246e r __kstrtab_font_vga_8x16

嗯，这就是内核里保存的字体：

  [root@localhost rh]# ll ./drivers/video/console/font_8x*  -rw-r--r--. 1 root root 95976 Sep 17 2018 ./drivers/video/console/font_8x16.c  -rw-r--r--. 1 root root 50858 Sep 17 2018 ./drivers/video/console/font_8x8.c

这里不再分析这两个文件。这里仅仅是确认了一个事实， 内核在初始化的时候会使用自己的字体 ，这个时候毕竟除了内核本身，什么都没有。

问题是到了用户态，这个字体是可以被改变的，可以被改的花里胡哨的，这些个字体可不是仅仅两个8×8和8×16就能hold住的…

这个时候就需要找我们安装在发行版里面的字体文件了。我们要找到它，然后改掉里面的某个字体的形状，将其变成中文！就这么简单。

不必去搜这个字体文件安装保存在什么地方，通过执行strace setfont命令就能找到它。

  [root@localhost ~]# strace -F -e trace=open setfont  ...  strace: Process 6276 attached  [pid 6276] open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 4  ...  [pid 6276] open("/lib/kbd/consolefonts/default8x16.psfu.gz", O_RDONLY|O_NOCTTY|O_NONBLOCK) = 4  [pid 6276] +++ exited with 0 +++  --- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=6276, si_uid=0, si_status=0, si_utime=0, si_stime=0} ---  +++ exited with 0 +++

就是它了， /lib/kbd/consolefonts/default8x16.psfu.gz

也不必去搜psfu格式的字体的format，通过模式识别就能找到特定的字符。

我准备先找到 ‘A’，然后把它后面的’B’和’C’改成我的名字“赵”和“亚”。

首先我要把“赵”和“亚”字做出来，形成一个点阵。以下是我的作品“赵”：

  00000000  00000000  00100000  11111000  00100101   00100101  11111010  00100011   00111010   01100101   01100000  10011000  10000111  00000000  00000000  00000000

Linux内核如何输出中文字符的方法示例

下面就要用这个点阵替换’B’的点阵，同时制作一个“亚”字，替换’C’的点阵，

在下面的站点可以找到该default font的对应点阵图解：

Linux内核如何输出中文字符的方法示例

我们就可以得到该’A’字符的点阵数组，然后在default8x16.psfu文件里匹配这个数组就可以了。代码如下：

  #include <stdio.h>  #include <stdlib.h>  #include <fcntl.h>  #include <linux/fb.h>  #include <string.h>    unsigned char zhaoya[32] = {  			// 第一行为“赵”  			0x00, 0x00, 0x20, 0xf8, 0x25, 0x25, 0xfa, 0x23, 0x3a, 0x65, 0x60, 0x98, 0x87, 0x00, 0x00, 0x00,  			// 第二行为亚  			0x00, 0x00, 0x00, 0x7e, 0x24, 0x24, 0x24, 0xa5, 0xa5, 0x66, 0x24, 0x24, 0x7e, 0x00, 0x00, 0x00  };      int main(int argc, char **argv)  {  	int i = 0;  	unsigned char buf[16];  	off_t offset = 0;  	int s = 0;    	int fd = open("default8x16.psfu", O_RDWR);  	i = pread(fd, buf, 8, offset);  	while (1) {  		i = pread(fd, buf, 16, offset);  		if (s == 2) { // 替换'C'  			memcpy (buf, &zhaoya[16], 16);  			i = pwrite(fd, buf, 16, offset);  			break;  		}  		if (s == 1) { // 替换'B'  			memcpy (buf, &zhaoya[0], 16);  			pwrite(fd, buf, 16, offset);  			s = 2;  		}  		// 简易的方法识别到'A'  		if (buf[0] == 0x00 && buf[1] == 0x00 &&  			buf[2] == 0x10 && buf[3] == 0x38) {  			printf("A found at %d !n", offset);  			s = 1;  		}  		offset += 16;  	}  }

直接编译执行，然后将这个default8x16.psfu作为参数set到内核即可：

  [root@localhost font]# setfont ./default8x16.psfu

此时进入Linux的虚拟终端tty2，当敲键盘的大写’B’时，就会出现一个“赵”字。

虽然16×816times 816×8甚至8×88times 88×8也能做出复杂的中文点阵，但是这也太难看了。

于是我要找一个更高分辨率的font。我在Ubuntu上找到了一个高分辨率的28×1628times 1628×16点阵 Arabic-VGA28x16.psf.gz 。修改它的方法和前面这个完全一样，它的点阵图如下：

我不需要自己做28×1628times 1628×16的点阵了，我只要用GNU uifont的现成的即可。直接在 unifont_sample-12.1.01.hex 里面按照“赵”和“亚”的unicode码字就能索引到点阵。关于任意字符的unicode码字的查询，可以参见：

替换font的代码如下：

  #include <stdio.h>  #include <stdlib.h>  #include <fcntl.h>  #include <string.h>  #include "zhao"    #define L	28*2  int fd;    int main(int argc, char **argv)  {  	unsigned char buf[L];  	off_t offset = 0;  	// 这个0x0e60 就是模式匹配获得的偏移。  	offset += 0x0e60;    	fd = open("Lat7-VGA28x16.psf", O_RDWR);  	pread(fd, buf, L, offset);  	memset(buf, 0, L);  	memcpy(buf+8, &code[0], 32);  	pwrite(fd, buf, L, offset);    	offset += L;  	pread(fd, buf, L, offset);  	memset(buf, 0, L);  	memcpy(buf+8, &code[32], 32);  	pwrite(fd, buf, L, offset);    	offset += L;  	pread(fd, buf, L, offset);  	memset(buf, 0, L);  	memcpy(buf+8, &code[64], 32);  	pwrite(fd, buf, L, offset);  }

然后它的效果就是：

Linux内核如何输出中文字符的方法示例

还不错。

其实本文的内容仅仅就是：

做一个蹩脚的点阵；
keyboard，ascii/unicode，font之间的映射关系；
什么细节都不懂的情况下定位分析问题的方法；
越简单越好，越复杂越糟糕。

嗯，其实第三点和第四点是最重要的。

最后，如果你想知道你当前的虚拟终端支持那些字体，输入：

  [root@localhost font]# showconsolefont

就会显示：

Linux内核如何输出中文字符的方法示例

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

文章版权归作者所有，未经允许请勿转载。

THE END

Linux

Linux内核如何输出中文字符的方法示例

请登录后发表评论

无双技术网 www.bnskd.com

关于我们

支持服务

用户服务

精品文章等您来关注