IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 知识图到文本的生成——柒 -> 正文阅读

[人工智能]知识图到文本的生成——柒

2021SC@SDUSC

上次我们分析了model类中的类定义函数,了解了这个类各个参数的意思,接下来我们继续分析train.py。

m = m.to(args.device)

m就是一个model类,这是将m加载到设备device上。

  if args.ckpt:
    cpt = torch.load(args.ckpt)
    m.load_state_dict(cpt)
    starte = int(args.ckpt.split("/")[-1].split(".")[0])+1
    args.lr = float(args.ckpt.split("-")[-1])
    print('ckpt restored')

args是调用了pargs()函数的变量,是一个ArgumentParser对象,包含将命令行解析成 Python 数据类型所需的全部信息,在pargs.py中有体现。?

args = parser.parse_args()
parser.add_argument("-ckpt",default=None,type=str,help='load checkpoint')

对args进行检查point,若为真则加载到m的字典中,starte将checkpoint以“/”和“.”分割后数量+1。

parser.add_argument("-lr",default=0.1,type=float,help='learning rate')

这是有关args.lr的代码解释,在pargs.py文件中。

  else:
    with open(args.save+"/commandLineArgs.txt",'w') as f:
      f.write("\n".join(sys.argv[1:]))
    starte=0

若不为真,则新建一个文件,路径为保存后的文件路径+commandLineArgs.txt,向其中写入sys.argv[1:],也就是一个列表,里面都是用户输入的参数,然后将starte设为0。

o = torch.optim.SGD(m.parameters(),lr=args.lr, momentum=0.9)

我们先简单介绍一下torch.optim.SGD函数,它是实现随机梯度下降算法的函数,在普通的梯度下降法x+=v中,每次x的更新量v为v=dx*lr,其中dx为目标函数func(x)的对x的一阶导数。当使用“冲量”时,则把每次x的更新量v考虑为本次的梯度下降量-dx*lr与上次x的更新量v乘上一个介于[0,1]因子的momentum的和,即v=-dx*lr+v*momentum。这条语句是把这个模型m的参数,包括权重和偏置(是神经网络中的参数,也是SGD优化的重点)。lr为学习率,冲量设为0.9。

  for e in range(starte,args.epochs):
    print("epoch ",e,"lr",o.param_groups[0]['lr'])
    train(m,o,ds,args)

starte为之前设置过的一个变量,已经被赋值,args.epochs默认为20,在pargs.py文件中。

parser.add_argument("-epochs",default=20,type=int)

在starte和args.epochs的范围里进行循环操作,每次循环之前打印第几次epoch和学习率,然后对m,o,ds,args调用train()函数。train()为train.py中的函数,也是这个测试的核心代码,我将在后面的博客里详细分析。

vloss = evaluate(m,ds,args)

evaluate()为评估函数,也是需要详细分析的核心代码。(该语句在上面的for循环中)

    if args.lrwarm:
      update_lr(o,args,e)
    print("Saving model")
parser.add_argument("-lrwarm",action="store_true",help='use cycling learning rate')

关于parser.add_argument()记录一个特殊的情况:action。当运行的时候,如果不加入--lr_use,那么程序运行的时候,lr_use的值为default:False,如果加上了--lr_use,不需要指定True/False,那么程序运行的时候,lr_use的值为True。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-11 15:43:22  更:2021-12-11 15:43:39 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 23:44:56-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码