首先,如果你的数据需要经常打开浏览的话,请不要把文件存成这个格式!!!(重要的事情三个感叹号)
npy文件的格式是存储成二进制格式的,应该是比较适合存储数值型的文件。并且你不能像csv那样即时地打开修改(读取只能用numpy),所以适合存储那种重要的,怕误操作会影响里面内容的数据。我想,可能神经网络训好的权重用它来存储时比较合适的。
但是,有一点是可以肯定的,它一定不适合存储文字信息(不是说嵌入的向量),就是像你现在读的话,不适合不适合不适合。
转换代码如下:用到了numpy和json模块
import json
import numpy as np
# 路径
npy_path = "xxx.npy"
json_path = "xxx.json"
# 读取
file = np.load(npy_path, allow_pickle = True)
# print("转换前:", file.dtype) # 查看数据类型
# 转为list
file = file.tolist()
# print("转换后", file.dtype) # 间接查看数据类型
# 存为json
with open (json_path, "w", encoding = "utf-8") as new_file:
new_file.write(json.dumps(file, indent = 2, ensure_ascii=False))
来做一些说明,并指出一些关键点:
第一步:读取np.load,没有什么特殊的地方。
第二步:tolist,很重要,不能省略这一步,直接暴力转存为json的话会有下图这种问题:?
?我们来查看前后的数据类型发生了什么变化,这一句之前是object,应该是narray的object,转换后,虽然这句查看代码报错,但是发现是dict。应该是成了。?
?第三步:很普通的存为json,需要注意的是?encoding = "utf-8" 这个不能省。
|