IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 2021-08-14 -> 正文阅读

[Python知识库]2021-08-14

UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xa4 in position 25: ordinal not in range(128)

解决过程

我想看看一个文件里存的数据是什么,但是是个.bin文件,遇是想到用pickle来输出一下,就报这个错了。

def load(self, filename):
	f = open(filename,'rb')
	tmp = pickle.load(f)

做功课了解到 .bin是个万能后缀,以二进制存储,它特点是随便什么类型文件都可以改成bin文件而不损害内容本身。同理,你也可以尝试改成你想要的后缀看看他到底是什么内容,不过只有猜对了才能正常打开,否则就会出现乱码等错误……我改成 .txt 等后缀以文本编辑器、记事本打开都不行,后来想到pickle用来存储结构化数据的,就想把tmp输出一下就报错了。

报错:
报错这个错误是因为文件中有字符是非ascii编码的字符,其16进制编码超过127。

后来看到有解决办法是在程序最前面加上以下三行:

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

我搜了一下reload发现是python2版本的,然后找了一个python3版本的写法,如下:

import sys
import importlib
importlib.reload(sys)

同时了解到python2默认编码是ascii,当程序中出现非ascii编码时,就会报以上错,而python3默认使用的就是utf-8编码,所以也没有sys.setdefaultencoding了。另外XML和JSON文件默认编码也是utf-8。

也就是此问题还没解决。

后来又看到有方法说把打开模式改成 ‘r’,然后在load里加encoding,也就是

def load(self, filename):
	f = open(filename,'r')
	tmp = pickle.load(f,encoding='UTF-8')

然后出现另一个bug:
在这里插入图片描述
这个错误是因为要处理的字符串不是gbk编码,却要用它去解码。

之前出现过这种错误,是打开txt文件,这种把文件另存为,改编码为UTF-8就可以解决了,但是现在是个bin文件……

后来有办法说把编码模式改成bytes就可以,也就是:

def load(self, filename):
	f = open(filename,'rb')
	tmp = pickle.load(f,encoding='bytes')

发现!确实不报这个错了,数据也能看到了,但是用这个编码模式,发现每个字符串前面多了个b:
在这里插入图片描述
这样的话,就没办法根据键值取出里面的数据了……
然后又经过一轮发现,将‘bytes’改成‘latin1’就没事了:

def load(self, filename):
	f = open(filename,'rb')
	tmp = pickle.load(f,encoding='latin1')

在这里插入图片描述
终于解决了!

总结

用pickle.load加载文件的时候,出现ascii或者gbk等问题,可以用bytes编码模式加载,如果要处理数据,用latin1模式加载。

pickle是个序列化模块。这里再回顾一下pickle的优点:pickle可以保存几乎任何数据格式的数据,存进去是怎么样,拿出来也是怎么样;当你多次加载数据的时候,第二次之后读取更加高效,因为不需要重新计算数据。

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-08-15 15:29:40  更:2021-08-15 15:31:09 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/26 11:39:56-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计