| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 命名实体识别(NER)实战demo-LSTM+CRF -> 正文阅读 |
|
[人工智能]命名实体识别(NER)实战demo-LSTM+CRF |
该篇面向的更多是开始做命名实体识别的小白,推荐几篇对NER介绍非常详细的文章 简介最开始接触知识图谱的时候可能更多理解的是概念,对实战没有很多认识,之后慢慢有开始学习知识图谱的构建。认识到其实命名实体识别本质是多分类任务(定义好实体类别后,对每个字词进行分类),具体的分类基于标签体系(常见的标签体系有IO,BIO,BMEWO,BMWEO+),一般标签体系越复杂,准确性越高。 做命名实体识别时,网上找了大量资源,但最初的学习效果并不好,看了很多内容还是不知道真正该怎么做。直到b站看到一个视频TensorFlow:BERT框架项目实战,其中一节内容是医学糖尿病数据命名实体识别,详细介绍了code和模型,让我收获很多。具体资源可以在自然语言处理实战项目(基于深度学习)找到,唐宇迪老师讲的真的很清晰透彻!之前很多东西都是跟着老师视频学的(PS:b站有很多视频,因为直接买课程的话会比较贵)。
于是乎找到NER的code后拿来开始跑,但其中碰到了许多问题,最终解决后想把整个过程记录下来,感兴趣的uu可以一起学习呀~ 项目资源来自唐宇迪老师的项目资源 NLP通用框架BERT 可以直接在百度网盘下载 链接: https://pan.baidu.com/s/13SrM1V08eeVeFfgRbqWe_w 提取码: uphm 项目文件用的是tensorflow,主要是keras做
代码运行过程中的问题环境配置TensorFlow 1.14.0 + Keras 2.2.5 on Python 3.6. 我用的IDE是Pycharm,用的是anaconda下新建的环境(也可以用已有的编译器,但是相关库的版本对应问题可能不太好解决,对于NER任务的话,主要是python、tensorflow、keras版本) 1、对于版本对应问题,可以看这篇文章 tensorflow + python + keras 版本对应关系 2、对于pycharm中配置anaconda,可以看这篇文章 Anaconda+pycharm+tensorflow安装和环境配置(win10)
3、需要下载CRF相关库,这里直接根据 keras-contrib : Keras community contributions 进行即可,命令“pip install git+https://www.github.com/keras-team/keras-contrib.git” 这里需要注意要提前下载git,直接pip install会报错,需要用conda install git 报错及解决方法1、TypeErmor: Tensors in list passed to ‘values’ of ‘ConcatV2’ 0p have types [bool,float32] that don’t all match. 2、importEPror: Failed to impont 'pydot '. Please install 'pydot '. For example with 'pip install pydot .
3、AttributeError: ‘str’ object has no attribute 'deco 将query = query.decode(errors=‘replace’)改成query = query.encode(errors=‘replace’) |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 4:01:24- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |