IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 游戏开发 -> 将中文转换成拼音 -> 正文阅读

[游戏开发]将中文转换成拼音

1. 背景

由于项目需要根据拼音字符进行搜索中文,本博客特为此提出解决方案

2. 方案1

使用pinyin4j将中文处理成拼音的形式存入数据库中

  1. 引入依赖
        <dependency>
            <groupId>com.belerweb</groupId>
            <artifactId>pinyin4j</artifactId>
            <version>2.5.1</version>
        </dependency>
  1. 拼音处理源代码
public class PinYinUtils {

    private static HanyuPinyinOutputFormat hanyuPinyinOutputFormat;

    static {
        hanyuPinyinOutputFormat = new HanyuPinyinOutputFormat();
        //2.设置好格式
        hanyuPinyinOutputFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
        hanyuPinyinOutputFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
    }

    public static void main(String[] args) throws BadHanyuPinyinOutputFormatCombination {
        String chinese = "给我一首歌的时间";
        System.out.println("中文:>>" + chinese);
        System.out.println("全拼:>>" + convertToFullPinYin(chinese));
        System.out.println("第一个汉字全拼:>>" + convertToFullAbbMixPinYin(chinese));
        System.out.println("全部汉字首字符:>>" + convertToFirstLetterPinYin(chinese));

    }

    /**
     * 根据中文获取拼音全拼
     *
     * @param chinese
     * @return
     * @throws BadHanyuPinyinOutputFormatCombination
     */
    public static Set<String> convertToFullPinYin(String chinese) throws BadHanyuPinyinOutputFormatCombination {
        List<String> pinyinFullList = new ArrayList<>();
        for (int i = 0; i < chinese.length(); i++) {
            char chineseChar = chinese.charAt(i);
            if (String.valueOf(chineseChar).matches("[\\u4E00-\\u9FA5]+")) {
                //是中文
                String[] currentPinyinArray = PinyinHelper.toHanyuPinyinStringArray(chineseChar, hanyuPinyinOutputFormat);
                if (pinyinFullList.isEmpty()) {
                    pinyinFullList = Arrays.asList(currentPinyinArray);
                    continue;
                }
                pinyinFullList = getCartesian(pinyinFullList, Arrays.asList(currentPinyinArray));
            } else {
                //不是中文
                for (int j = 0; j < pinyinFullList.size(); j++) {
                    pinyinFullList.set(j, pinyinFullList.get(j) + chineseChar);
                }
            }
        }

        return pinyinFullList.stream().collect(Collectors.toSet());
    }

    /**
     * 根据中文获取首字母拼音
     *
     * @param chinese
     * @return
     * @throws BadHanyuPinyinOutputFormatCombination
     */
    public static Set<String> convertToFirstLetterPinYin(String chinese) throws BadHanyuPinyinOutputFormatCombination {
        List<String> pinyinFullList = new ArrayList<>();
        for (int i = 0; i < chinese.length(); i++) {
            char chineseChar = chinese.charAt(i);
            if (String.valueOf(chineseChar).matches("[\\u4E00-\\u9FA5]+")) {
                //是中文
                String[] currentPinyinArray = getFirstLetterPinYin(chineseChar, hanyuPinyinOutputFormat);
                if (pinyinFullList.isEmpty()) {
                    pinyinFullList = Arrays.asList(currentPinyinArray);
                    continue;
                }
                pinyinFullList = getCartesian(pinyinFullList, Arrays.asList(currentPinyinArray));
            } else {
                //不是中文
                for (int j = 0; j < pinyinFullList.size(); j++) {
                    pinyinFullList.set(j, pinyinFullList.get(j) + chineseChar);
                }
            }
        }

        return pinyinFullList.stream().collect(Collectors.toSet());
    }

    /**
     * 根据中文获取拼音字符
     * 第一个汉字的全拼,其余汉字取首字符
     * todo 目前可能有bug
     *
     * @param chinese
     * @return
     */
    public static Set<String> convertToFullAbbMixPinYin(String chinese) throws BadHanyuPinyinOutputFormatCombination {
        List<String> pinyinFullList = new ArrayList<>();
        for (int i = 0; i < chinese.length(); i++) {
            char chineseChar = chinese.charAt(i);
            if (String.valueOf(chineseChar).matches("[\\u4E00-\\u9FA5]+")) {
                //是中文
                String[] currentPinyinArray;
                if (i == 0) {
                    currentPinyinArray = PinyinHelper.toHanyuPinyinStringArray(chineseChar, hanyuPinyinOutputFormat);
                } else {
                    currentPinyinArray = getFirstLetterPinYin(chineseChar, hanyuPinyinOutputFormat);
                }
                if (pinyinFullList.isEmpty()) {
                    pinyinFullList = Arrays.asList(currentPinyinArray);
                    continue;
                }
                pinyinFullList = getCartesian(pinyinFullList, Arrays.asList(currentPinyinArray));
            } else {
                //不是中文
                for (int j = 0; j < pinyinFullList.size(); j++) {
                    pinyinFullList.set(j, pinyinFullList.get(j) + chineseChar);
                }
            }
        }

        return pinyinFullList.stream().collect(Collectors.toSet());
    }

    /**
     * 获取汉字的首字符
     *
     * @param chineseChar
     * @param hanyuPinyinOutputFormat
     * @return
     * @throws BadHanyuPinyinOutputFormatCombination
     */
    private static String[] getFirstLetterPinYin(char chineseChar, HanyuPinyinOutputFormat hanyuPinyinOutputFormat) throws BadHanyuPinyinOutputFormatCombination {
        String[] currentPinyinArray = PinyinHelper.toHanyuPinyinStringArray(chineseChar, hanyuPinyinOutputFormat);
        String[] firstLetterPinYin = new String[currentPinyinArray.length];
        for (int i = 0; i < currentPinyinArray.length; i++) {
            firstLetterPinYin[i] = String.valueOf(currentPinyinArray[i].charAt(0));
        }
        return firstLetterPinYin;
    }

    /**
     * 两个list笛卡尔积
     *
     * @param list1
     * @param list2
     * @return
     */
    private static List<String> getCartesian(List<String> list1, List<String> list2) {
        List<String> set = new ArrayList<>();
        for (String str : list1) {
            for (String str2 : list2) {
                set.add(str + str2);
            }
        }
        return set;
    }
}
  1. 程序运行截图
    在这里插入图片描述
    本代码效率可能较低,希望有大神可以优化一下

3. 方案2

如果数据库使用elsaticsearch,可以为此安装拼音分词插件,但是可能有的时候拼音分词不尽人意,不能满足相关需求,所以需要有能力者对该拼音分词插件进行调整。(这里贴上拼音分词插件github地址:https://github.com/medcl/elasticsearch-analysis-pinyin/releases
在这里插入图片描述

  游戏开发 最新文章
6、英飞凌-AURIX-TC3XX: PWM实验之使用 GT
泛型自动装箱
CubeMax添加Rtthread操作系统 组件STM32F10
python多线程编程:如何优雅地关闭线程
数据类型隐式转换导致的阻塞
WebAPi实现多文件上传,并附带参数
from origin ‘null‘ has been blocked by
UE4 蓝图调用C++函数(附带项目工程)
Unity学习笔记(一)结构体的简单理解与应用
【Memory As a Programming Concept in C a
上一篇文章      下一篇文章      查看所有文章
加:2022-04-04 12:42:53  更:2022-04-04 12:46:34 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 18:49:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码