IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 查看模型的内部信息 -> 正文阅读

[人工智能]查看模型的内部信息

1.如何查看模型的各个层次

print(model)#实例化后的

2.打印模型的参数

  • 缺点:是可以看见一堆的参数,但是你不知道他是谁的参数,很乱。
print("-------------------------------------------------")
    print("model的bert的属性")
    for parameter in model.parameters():
        print(parameter)
        print("-------------------------------------------------")
    print("-------------------------------------------------")

3.打印模型的各层名字以及参数

print("-------------------------------------------------")
    print("model的bert的属性")
    for name,parameter in model.named_parameters():
        print(name,parameter)
        print("-------------------------------------------------")
    print("-------------------------------------------------")
     7.8309e-02, -2.3176e-02,  1.9839e-02, -1.7092e-02,  9.4321e-02,
    -1.4221e-02,  6.2530e-02, -3.1816e-02, -7.9080e-02,  1.4354e-02,
    -2.1350e-02, -5.6522e-02, -3.4564e-02], device='cuda:1',
   requires_grad=True)

classifier.weight Parameter containing:
tensor([[ 0.0106, -0.0667, -0.0263, …, -0.0182, -0.0581, 0.0074],
[ 0.0011, -0.0372, -0.0474, …, 0.0231, -0.0420, -0.0075],
[ 0.0103, 0.0349, 0.0343, …, -0.0065, -0.0091, 0.0024],
…,
[-0.1062, -0.1443, -0.0232, …, -0.0280, 0.0067, 0.0993],
[ 0.0186, -0.0386, 0.0207, …, -0.0693, -0.0363, 0.0977],
[ 0.0094, 0.0551, -0.0461, …, -0.0175, -0.0222, -0.0230]],
device=‘cuda:1’, requires_grad=True)


classifier.bias Parameter containing:
tensor([-0.3976, 0.1223, 0.3341, 0.3246, 0.2115, -0.0361, 0.2665, 0.1029,
0.4019, 0.1331, -0.1092, 0.1410, -1.5911, -0.1935, 0.2342],
device=‘cuda:1’, requires_grad=True)
4.返回模型的各种信息

for module in model.children():
     print(module)  # 打印网络第一代子模块
print("-------------------------------------------------")
for name, module in model.named_children():
     print(name, module)  # 打印模块名称 网络第一代子模块
print("-------------------------------------------------")
for module in model.modules():
     print(module)  # 打印模块
print("-------------------------------------------------")
for name, module in model.named_modules():
     print([name, module])  # 打印模块名称 模块
print("-------------------------------------------------")
print(model.state_dict())  # model.state_dict() 返回一个有序字典
print(model.state_dict().keys())
torch.save(model.state_dict(), "./weight.pth")
print("-------------------------------------------------")

weight = torch.load("./weight.pth")  # weight 是一个有序字典
print(weight)
# print("-------------------------------------------------")
for k, v in weight.items():
    print(k)
# model.modules()类似于 [[1, 2], 3],其遍历结果为:
[[1, 2], 3], [1, 2], 1, 2, 3
 
# model.children()类似于 [[1, 2], 3],其遍历结果为:
[1, 2], 3
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-17 22:08:21  更:2022-03-17 22:09:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 14:53:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码