IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 移动开发 -> Android动态识别字符编码 -> 正文阅读

[移动开发]Android动态识别字符编码

最近碰到一个需求,读取txt文本内容并加载到textview中,但是测试发现当txt文件编码为GBK时会乱码,查阅了很多资料,大多数都是通过判断文件前三字节实现字符编码的识别,但是实际发现读取到的前三字节并没有包含编码信息,直接就是文本内容的前三字节,后续查阅到一个资料,基本思想是在输入流中指定解码方式,然后根据读取时有无报错判断是否是该字符编码,这样一来,通过循环使用不同的字符编码去解码就可以得到正确的字符编码,具体实现如下:

private String getTextFileCharset(String filePath){
        String[] charsets = {"US-ASCII", "UTF-8", "GB2312", "BIG5", "GBK", "GB18030", "UTF-16BE", "UTF-16LE", "UTF-16", "UNICODE"};
        String charset = Charset.defaultCharset().displayName();
        CharsetDecoder decoder;
        BufferedReader br = null;
        String s = null;
        for (int i = 0; i < charsets.length; i++) {
            decoder = Charset.forName(charsets[i]).newDecoder();
            try {
                br = new BufferedReader(new InputStreamReader(new FileInputStream(filePath), decoder));
                do {
                    s = br.readLine();
                } while (s != null);
                charset = charsets[i];
                Log.d(TAG, "getTextFileCharset: is " + charsets[i] + ",break");
                break;
            } catch (FileNotFoundException e) {
                e.printStackTrace();
                break;
            } catch (MalformedInputException e) { //如果编码不能解码此文本就会抛出这个异常
                Log.d(TAG, "getTextFileCharset: not " + charsets[i] + ",continue");
                continue;
            } catch (IOException e) {
                e.printStackTrace();
                break;
            }
        }
        return charset;
        /*File file = new File(filePath);
        if (null == filePath || !file.exists() || file.isDirectory()) return charset;
        try {
            FileInputStream fis = new FileInputStream(file);
            BufferedInputStream bi = new BufferedInputStream(fis);
            byte[] header = new byte[3];
            bi.read(header);
            if (header[0] == (byte) 0xEF && header[1] == (byte) 0xBB
                    && header[2] == (byte) 0xBF) {// utf-8
                charset = "UTF-8";
            } else if (header[0] == (byte) 0xFF
                    && header[1] == (byte) 0xFE) {
                charset = "UNICODE";
            } else if (header[0] == (byte) 0xFE
                    && header[1] == (byte) 0xFF) {
                charset = "UTF-16BE";
            } else if (header[0] == (byte) 0xFF
                    && header[1] == (byte) 0xFF) {
                charset = "UTF-16LE";
            } else {
                charset = "GBK";
            }
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        Log.d(TAG, "getTextFileCharset: charset = " + charset);
        return charset;*/
    }

这种方式无需第三方库,特此记录

  移动开发 最新文章
Vue3装载axios和element-ui
android adb cmd
【xcode】Xcode常用快捷键与技巧
Android开发中的线程池使用
Java 和 Android 的 Base64
Android 测试文字编码格式
微信小程序支付
安卓权限记录
知乎之自动养号
【Android Jetpack】DataStore
上一篇文章      下一篇文章      查看所有文章
加:2021-07-28 07:56:17  更:2021-07-28 07:57:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/3 10:32:04-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码