组队学习资料:
datawhale8月组队学习 -基于transformers的自然语言处理(NLP)入门
Task03主要学习内容: 2.3-图解BERT.md 2.4-图解GPT.md
声明:NLP纯小白,本文内容主要是作为个人学习笔记,可能很多地方我自己理解也不是很到位,仅供参考,有争议的话可以多查点儿其他资料,并请评论区留言指正!谢谢
图解BERT
data:image/s3,"s3://crabby-images/19b2f/19b2f0213a9c7e1edae3662d0ed91101f055df86" alt="在这里插入图片描述"
图解GPT
data:image/s3,"s3://crabby-images/6a053/6a05306cae2dd158cc394db43aad40ac4c43d3cb" alt="在这里插入图片描述"
BERT使用基本思路
BERT开源github地址 基本使用思路:查找预训练好的模型,在别人已有模型基础上进行自主化训练 data:image/s3,"s3://crabby-images/4f43f/4f43f69470da6b5b5bde7dcc3e21b23f4b6127af" alt="在这里插入图片描述"
基于MRPC的BERT代码实现
data:image/s3,"s3://crabby-images/48826/488260fb99eb068fb8fb791342f674023afe0ef3" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/38b02/38b02906eee72e20eae8cc3ad0a2018fdb2dbffb" alt="在这里插入图片描述"
data:image/s3,"s3://crabby-images/42c5d/42c5d480aa8b31fcf27127b6d0bd921bce4b8d89" alt="在这里插入图片描述"
篇章小测
1、问题4: BERT预训练时mask的比例,可以mask更大的比例吗?
2、问题5: BERT如何进行tokenize操作?有什么好处? 3、问题6: GPT如何进行tokenize操作?和BERT的区别是什么? 4、问题7: BERT模型特别大,单张GPU训练仅仅只能放入1个batch的时候,怎么训练?
其他参考资料
问题:AttributeError: module ‘tensorflow’ has no attribute ‘gfile’ import tensorflow 报错 as tf ImportError: DLL load failed TensorFlow报错:AttributeError: module ‘tensorflow_core._api.v2.train’ has no attribute 'Optimizer‘
|