| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 使用huggingface 领域数据适配预训练 -> 正文阅读 |
|
[人工智能]使用huggingface 领域数据适配预训练 |
? ? ? ? 如果自己有一批数据,想要使用预训练模型再进行领域数据的适配,可以使用huggingface中的run_mlm.py进行训练。 ? ? ? ? 最近在训练的时候遇到一个问题:训练的时候GPU占用上升导致out of memory。 ? ? ? ? 详细问题描述:pytorch 使用 transoformers(version=4.8.2)中 run_mlm.py 进行垂直领域数据适配预训练的时候;GPU显存占用量慢慢上升,但是并不是一直在升,隔几百个step之后会有一个量(1G)的上升并稳定一段时间后再次上升; 直至 out of memory。 ????????代码的报错位置是 : ????????网上查了下,看到了这个解答: ????????和报错位置的代码差不多,但是这个问题应该是pytorch之前版本的问题了,新的版本应该已经修复这个问题了;试了一下解决方法,果然还是有上述问题。 ? ????????加入了这两行语句,简单暴力,再看gpu的使用会在两个值之间跳动,应该是代码生效了。 ? ? ? ? 总结:原因应该是,损失累加的时候有很多局部的损失没有删除;因为训练循环没有结束,所以一直占用显存。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/17 20:48:18- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |