[人工智能] 查看模型的内部信息

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 查看模型的内部信息 -> 正文阅读

[人工智能]查看模型的内部信息

1.如何查看模型的各个层次

print(model)#实例化后的

2.打印模型的参数

缺点：是可以看见一堆的参数，但是你不知道他是谁的参数，很乱。

print("-------------------------------------------------")
    print("model的bert的属性")
    for parameter in model.parameters():
        print(parameter)
        print("-------------------------------------------------")
    print("-------------------------------------------------")

3.打印模型的各层名字以及参数

print("-------------------------------------------------")
    print("model的bert的属性")
    for name,parameter in model.named_parameters():
        print(name,parameter)
        print("-------------------------------------------------")
    print("-------------------------------------------------")

     7.8309e-02, -2.3176e-02,  1.9839e-02, -1.7092e-02,  9.4321e-02,
    -1.4221e-02,  6.2530e-02, -3.1816e-02, -7.9080e-02,  1.4354e-02,
    -2.1350e-02, -5.6522e-02, -3.4564e-02], device='cuda:1',
   requires_grad=True)

classifier.weight Parameter containing:
tensor([[ 0.0106, -0.0667, -0.0263, …, -0.0182, -0.0581, 0.0074],
[ 0.0011, -0.0372, -0.0474, …, 0.0231, -0.0420, -0.0075],
[ 0.0103, 0.0349, 0.0343, …, -0.0065, -0.0091, 0.0024],
…,
[-0.1062, -0.1443, -0.0232, …, -0.0280, 0.0067, 0.0993],
[ 0.0186, -0.0386, 0.0207, …, -0.0693, -0.0363, 0.0977],
[ 0.0094, 0.0551, -0.0461, …, -0.0175, -0.0222, -0.0230]],
device=‘cuda:1’, requires_grad=True)

classifier.bias Parameter containing:
tensor([-0.3976, 0.1223, 0.3341, 0.3246, 0.2115, -0.0361, 0.2665, 0.1029,
0.4019, 0.1331, -0.1092, 0.1410, -1.5911, -0.1935, 0.2342],
device=‘cuda:1’, requires_grad=True)
4.返回模型的各种信息

for module in model.children():
     print(module)  # 打印网络第一代子模块
print("-------------------------------------------------")
for name, module in model.named_children():
     print(name, module)  # 打印模块名称 网络第一代子模块
print("-------------------------------------------------")
for module in model.modules():
     print(module)  # 打印模块
print("-------------------------------------------------")
for name, module in model.named_modules():
     print([name, module])  # 打印模块名称 模块
print("-------------------------------------------------")
print(model.state_dict())  # model.state_dict() 返回一个有序字典
print(model.state_dict().keys())
torch.save(model.state_dict(), "./weight.pth")
print("-------------------------------------------------")

weight = torch.load("./weight.pth")  # weight 是一个有序字典
print(weight)
# print("-------------------------------------------------")
for k, v in weight.items():
    print(k)

# model.modules()类似于 [[1, 2], 3],其遍历结果为：
[[1, 2], 3], [1, 2], 1, 2, 3
 
# model.children()类似于 [[1, 2], 3],其遍历结果为：
[1, 2], 3

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-03-17 22:08:21 更:2022-03-17 22:09:54

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/29 12:12:42-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码