模型参数访问

发布时间：2024年01月10日

文章目录

前言
某一层的参数
目标参数
一次性访问所有参数
嵌套块收集参数

前言

在选择了架构并设置了超参数后，进入训练阶段。此时，我们的目标就是找到使损失函数最小化的模型参数。有时，我们希望提取参数，以便在其他环境中复用。

某一层的参数

net=nn.Sequential(nn.Linear(4,8),nn.ReLU(),nn.Linear(8,1))
X=torch.rand(size=(2,4))

print(net[2].state_dict())

目标参数

print(net[2].bias)
print(net[2].bias.data)

一次性访问所有参数

print(*[(name,param.shape) for name,param in net.named_parameters()])

print(net.state_dict()['2.bias'].data)

嵌套块收集参数

def block1():
    return nn.Sequential(nn.Linear(4,8),nn.ReLU(),
                         nn.Linear(8,4),nn.ReLU())

def block2():
    net=nn.Sequential()
    for i in range(4):
        net.add_module(f'block {i}',block1())
    return net

rgnet=nn.Sequential(block2(),nn.Linear(4,1))

print(rgnet) # 查看网络结构
print(rgnet[0][1][0].bias) # 访问具体参数
print(*[(name,param.shape) for name,param in rgnet.named_parameters()])

在这里插入图片描述

文章来源:https://blog.csdn.net/dingning12469/article/details/135477867
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！