| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> BERT实践详解 -> 正文阅读 |
|
[人工智能]BERT实践详解 |
BERT特点
BERT实践环境配置安装anaconda,一个机器学习平台软件 Anaconda | The World's Most Popular Data Science Platform 安装pycharm,方便调试代码 PyCharm: the Python IDE for Professional Developers by JetBrains 将python interpreter设置成anaconda下面的python.exe,这样后面通过anaconda命令行下载的包都可以在pycharm下找到。 深度学习框架实践中会发现某些资料中的代码无法运行,主要是tensorflow和BERT版本匹配的问题。 tensorflow 2.0之前的一些旧的版本可以配套bert-as-service这种第三方开源工具。我们很少使用旧的库,那么我们把目光集中在tensorflow 2.0以后的BERT配套。 目前针对tensorflow 2.0有两个深度学习框架可以使用:
Keras的开发主要是Google支持,配合tensorflow_hub使用。 transformers是Hugging Face公司开发,一家专注于NLP的公司。 下面分别介绍下两个框架下的实践。 transformersanaconda打开命令行安装依赖:
输出: tokenized ['[CLS]', '曝', '梅', '西', '已', '通', '知', '巴', '萨', '他', '想', '离', '开', '[SEP]'] {'token_ids': [101, 3284, 3449, 6205, 2347, 6858, 4761, 2349, 5855, 800, 2682, 4895, 2458, 102, 0, 0, 0, 0, 0, 0], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0]} keraspip install tensorflow==2.6.2 pip install tensorflow_hub pip install bert-for-tf2 pip install tensorflow-probability pip install tf-models-official pip install tfds-nightly pip install tensorflow_text==2.6.0 注: tensorflow_text的2.7.0版本,在windows下报错ModuleNotFoundError: No module named 'tensorflow_text.core',转到2.6.0版本以后解决,连带的tensorflow也从最新的2.7.0自动回退到2.6.2。 安装tf-models-official时,windows下报错Microsoft Visual C++ 14.0 or greater is required. 安装Microsoft Visual C++后解决。
bert_zh_preprocess_3中文预处理成bert的标准输入 pooled_output输出768维句向量 sequence_output输出词向量 注: tfhub.dev这个网址可能需要翻墙,预处理model可以下到本地使用。 参考 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 4:18:52- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |