IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 通过OpenCV在Ubuntu系统下显示点阵汉字 -> 正文阅读

[人工智能]通过OpenCV在Ubuntu系统下显示点阵汉字

一、汉字点阵字库原理

汉字编码

1. 区位码

1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是国内所有汉字系统的统一标准。国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码

区位码编码规则如下

  • 01-09区为特殊符号
  • 10-15区为用户自定义符号区(未编码)
  • 16-55区为一级汉字,按拼音排序
  • 56-87区为二级汉字,按部首/笔画排序
  • 88-94区为用户自定义汉字区(未编码)

参考:百度百科——区位码

2. 机内码

汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。

汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。如上所述,汉字区位码的区码和位码的取值均在 1~ 94 之间,如直接用区位码作为机内码,就会与基本 ASCII 码混淆。为了避免机内码与基本 ASCII 码的冲突,需要避开基本 ASCII 码中的控制码(00H~1FH),还需与基本 ASCII 码中的字符相区别。为了实现这两点,可以先在区码和位码分别加上 20H,在此基础上再加 80H(此处“H”表示前两位数字为十六进制数)。经过这些处理,用机内码表示一个汉字需要占两个字节,分别 称为高位字节和低位字节,这两位字节的机内码按如下规则表示:
高位字节 = 区码 + 20H + 80H(或区码 + A0H)
低位字节 = 位码 + 20H + 80H(或位码 + A0H)


由于汉字的区码与位码的取值范围的十六进制数均为 01H~ 5EH(即十进制的 01~ 94),所以汉字的高位字节与低位字节的取值范围则为 A1H~ FEH(即十进制的 161~254)。

二、点阵字库结构

点阵字体是把每一个字符都分成16×16或24×24个点,然后用每个点的虚实来表示字符的轮廓。点阵字体也叫位图字体,其中每个字形都以一组二维像素信息表示。

1. 点阵字库存储

在汉字的点阵字库中,每个字节的每个位都代表一个汉字的一个点,每个汉字都是由一个矩形的点阵组成,0 代表没有,1 代表有点,将 0 和1分别用不同颜色画出,就形成了一个汉字,常用的点阵矩阵有 12×12, 14×14, 16×16 三种字库。
字库根据字节所表示点的不同有分为横向矩阵纵向矩阵,目前多数的字库都是横向矩阵的存储方式(用得最多的应该是早期 UCDOS 字库),纵向矩阵一 般是因为有某些液晶是采用纵向扫描显示法,为了提高显示速度,于是便把字库矩阵做成纵向,省得在显示时还要做矩阵转换。

下图是一个16×16的点阵 “汉” 字,可用于帮助理解点阵字库结构
在这里插入图片描述

2. 点阵字体特点

点阵字体优点是显示速度快,不像矢量字体需要计算;其最大的缺点是不能放大,一旦放大后就会发现文字边缘的锯齿。

3. 字体结构

点阵字体也叫位图字体,其中每个字形都以一组二维像素信息表示。这种文字显示方式于较早前的电脑系统(例如未有图形接口时的 DOS 操作系统)被普遍采用。由于位图的缘故,点阵字体很难进行缩放,特定的点阵字体只能清晰地显示在相应的字号下,否则文字只被强行放大而失真字形,产生成马赛克式的锯齿边缘。但对于字号 8-14px 的尺寸较小的汉字字体(即现今操作系统大多采用的默认字号)现今亦仍然被使用于荧幕显示上,能够提供更高的显示效果;不过现今该种点阵字体主要只作为“辅助”的部分,当使用者设定的字体尺寸并没有拥有位图像时,字体便会以向量图象方式显示;而当打印时,印有字体无论大小亦会使用向量字型打印。

三、汉字点阵的获取

1. 利用区位码获取汉字

汉字点阵字库是根据区位码的顺序进行存储的,因此,我们可以根据区位来
获取一个字库的点阵,它的计算公式如下:

  • 点阵起始位置 = ((区码- 1)×94 + (位码 – 1)) × 汉字点阵字节数

获取点阵起始位置后,我们就可以从这个位置开始,读取出一个汉字的点阵。

2. 利用汉字机内码获取汉字

前面我们己经讲过,汉字的区位码和机内码的关系如下:

  • 机内码高位字节 = 区码 + 20H + 80H(或区码 + A0H)
  • 机内码低位字节 = 位码 + 20H + 80H(或位码 + A0H)

反过来说,我们也可以根据机内码来获得区位码:

  • 区码 = 机内码高位字节 - A0H
  • 位码 = 机内码低位字节 - A0H

将这个公式与获取汉字点阵的公式进行合并计就可以得到汉字的点阵位置。

四、利用C++语言在图上书写汉字

本次实验的环境是在ubantu18.04下,利用C++调用openCV库编程显示一张图片,并打开一个名为"logo.txt"的文本文件,按照文本文件去读取汉字24*24点阵字形字库(压缩包中的文件HZKf2424.hz)中对应字符的字形数据。

1. 创建文件与源码

  1. 打开ubuntu系统,在某个文件夹下输入命令touch HZ.cpp创建文件HZ.cpp
  2. 随后输入命令gedit HZ.cpp编辑HZ.cpp
  3. 在cpp文件中输入以下源码
#include<iostream>
#include<opencv/cv.h>
#include"opencv2/opencv.hpp"
#include<opencv/cxcore.h>
#include<opencv/highgui.h>
#include<math.h>
using namespace cv;

void PaintSChinese(Mat& image, int x_offset, int y_offset, unsigned long offset);
void PaintSAscii(Mat& image,int x_offset, int y_offset, unsigned long offset);
void putTextToImage(int x_offset,int y_offset,String imagePath ,char* txtPath);

int main(){

    String image_path="1.jpg";

    char* logo_path=(char*)"logo.txt";

    putTextToImage(900,600,image_path,logo_path);

    return 0;

}
void putTextToImage(int x_offset,int y_offset,String imagePath ,char* txtPath)
{
	//通过图片路径获取图片
	Mat img = imread(imagePath);
	unsigned char qh, wh;
	unsigned long offset;	
	//用于存放从记事本读取的十六进制		
	char hexcode[30];          
	//打开包含名字的txt文件,转为十六进制,存入hexcode中
	FILE* filetxt;
	if ((filetxt = fopen(txtPath, "rb")) == NULL){
		printf("Can't open txtfile,Please check the path!");
		//getch();
		exit(0);
	}
	fseek(filetxt, 0, SEEK_SET);			 /*将文件指针移动到偏移量的位置*/
	fread(hexcode, 17, 1, filetxt);
	int x = x_offset, y = y_offset;//x,y:在图片上绘文字的起始的坐标
	for (int m = 0; m < 17; )
		if (hexcode[m] == 0x23)                /* 当读取到‘#’号时结束 */
			break;
		//判断高阶两个十六进制数,大于或等于b0(汉字第一个是b0a1)的都应该从汉字字库中找
		else if (hexcode[m] > 0xffffffaf)
		{
			qh = hexcode[m] - 0xaf;						/*计算区码*/
			wh = hexcode[m+1] - 0xa0;						/*计算位码*/
			offset = (94 * (qh - 1) + (wh - 1)) * 72L;/*计算该汉字在字库中偏移量*/
			PaintSChinese(img, x , y , offset);
			m = m + 2;                               //一个汉字占两个char,所以加2                             						
			x += 24;      //一个汉字在图片上占24个像素点,所以水平坐标每次+24
		}
		else
		{
			wh = hexcode[m];
			offset = wh * 16L;                   //计算其他英文字符的偏移量
			PaintSAscii(img, x, y, offset);
			m++;                                //一个char
			//原本应该8*16,但是和24*24比小了点,所以改为16*32,原本的一个像素点现在用四个像素点绘画
			x += 16;
		}
		cv::imshow("image", img);

    cv::waitKey();			
}
void PaintSChinese(Mat& image, int x_offset, int y_offset, unsigned long offset){
	//实际在图片上绘制的像素点坐标
	Point p;
	p.x = x_offset;
	p.y = y_offset;
	//打开DZKs1516汉字库文件
	FILE *HZK;
	char buff[72];            //存放汉字字膜
	if ((HZK = fopen("HZKf2424.hz", "rb")) == NULL){
		printf("Can't openHZKf2424.hz,Please check the path!");
		//getch();
		exit(0);
	}
	fseek(HZK, offset, SEEK_SET);			 /*将文件指针移动到偏移量的位置*/
	fread(buff, 72, 1, HZK);				 /*从偏移量的位置读取72个字节,每个汉字占72个字节*/
	bool mat[24][24];                        /*定义一个新的矩阵存放转置后的文字字膜 */
	int i, j, k;
	//转置汉字字膜矩阵,因为汉字字膜存储的是装置后的数据(反的)
	for (i = 0; i<24; i++)                 /*24x24点阵汉字,一共有24行*/
	{
		for (j = 0; j<3; j++)                /*横向有3个字节,循环判断每个字节的*/
			for (k = 0; k<8; k++)              /*每个字节有8位,循环判断每位是否为1*/
				if (buff[i * 3 + j] & (0x80 >> k))    /*测试当前位是否为1*/
				{
					mat[j * 8 + k][i] = true;          /*为1的存入新的字膜中*/
				}
				else {
					mat[j * 8 + k][i] = false;
				}

	}
	for (i = 0; i < 24; i++)
	{
		p.x = x_offset;
		for (j = 0; j < 24; j++)
		{		
			if (mat[i][j])
				circle(image, p, 1, Scalar(255, 0, 0), -1);		  //写(替换)像素点
			p.x++;                                                //右移一个像素点
		}
		p.y++;                                                    //下移一个像素点
	}

}
void PaintSAscii(Mat& image, int x_offset, int y_offset, unsigned long offset){
	//绘制的起点坐标
	Point p;
	p.x = x_offset;
	p.y = y_offset;
	 //存放ascii字膜
	char buff[16];           
	//打开ascii字库文件
	FILE *ASCII;
	if ((ASCII = fopen("Asci0816.zf", "rb")) == NULL){
		printf("Can't open Asci0816.zf,Please check the path!");
		//getch();
		exit(0);
	}
	fseek(ASCII, offset, SEEK_SET);
	fread(buff, 16, 1, ASCII);
	int i, j;
	Point p1 = p;
	for (i = 0; i<16; i++)                  //十六个char
	{
		p.x = x_offset;
		for (j = 0; j < 8; j++)              //一个char八个bit
		{
			p1 = p;
			if (buff[i] & (0x80 >> j))    /*测试当前位是否为1*/
			{
				/*
					由于原本ascii字膜是8*16的,不够大,
					所以原本的一个像素点用4个像素点替换,
					替换后就有16*32个像素点
					ps:感觉这样写代码多余了,但目前暂时只想到了这种方法
				*/
				circle(image, p1, 0, Scalar(0, 0, 255), -1);
				p1.x++;
				circle(image, p1, 0, Scalar(0, 0, 255), -1);
				p1.y++;
				circle(image, p1, 0, Scalar(0, 0, 255), -1);
				p1.x--;
				circle(image, p1, 0, Scalar(0, 0, 255), -1);
				
			}						
			p.x+=2;            //原来的一个像素点变为四个像素点,所以x和y都应该+2
		}
		p.y+=2;
	}
	
}


2. 其他文件准备

2.1 创建文本文件

创建文本文件时,需要把文本文件保存为ANSI格式,最初在我的ubuntu中,将格式默认保存为了utf-8,导致中文产生了乱码。在ubuntu中改格式貌似比较麻烦,所以我这里推荐另外一个方法——在windows创建后,复制进入ubuntu

  • 首先在windows创建一个文本文件logo,写入你需要的内容
    在这里插入图片描述
  • 将文件按照以下操作,另存为ANSI格式
    在这里插入图片描述
    在这里插入图片描述
    再次打开logo.txt文件后,就可以发现文件已经是ANSI格式了,此时就可以复制进ubuntu中了,放到HZ.cpp同一文件夹下。
    在这里插入图片描述

2.2 准备字体文件

根据代码,将Asci0816.zfHZKF2424.hz放进文件夹
在这里插入图片描述

2.3 运行程序,演示效果

输入./HZ运行程序
在这里插入图片描述

五、总结

这次实验利用通过C++,调用OpenCV库在图片上进行汉字的显示,我在这个实验最大的收获是帮助了我了解了什么是点阵汉字,以及点阵汉字的结构、如何通过编程调用点阵汉字。
实验的过程大体上是比较顺利的,但是其中也遇到了一些小困难,比如说txt文件的格式保存最初在ubuntu系统下,默认保存了为utf-8格式,这导致我后来的文字显示出现乱码,但是在发现了错误之后,文本格式改为了ANSI格式,就很快地解决了问题,姓名与学号都正确地显示了出来。

参考文献

opencv g++编译问题解决
点阵汉字的字模读取与显示:图片上显示汉字(Ubuntu+OpenCV+C++)
百度百科——区位码
百度百科——汉字机内码
百度百科——点阵字体

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-12 19:35:31  更:2021-11-12 19:36:48 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 6:30:59-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码