| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【部署医药类问答系统QASystemOnMedicalKG】 -> 正文阅读 |
|
[人工智能]【部署医药类问答系统QASystemOnMedicalKG】 |
前言从无到有搭建一个以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。github链接 部署过程一、Ubuntu18.04安装MongoDB4.0参考官网链接
引入秘钥:
创建列表文件:
更新apt库:
安装:
开启MongoDB数据库服务:
输入mongo可连接数据库
注意问题:注意版本对应,mongodb其他版本在本项目中使用可能会出现问题。 二、运行数据准备脚本1. 运行prepare_data文件夹中的data_spider.py数据爬取脚本,完成对网页数据的爬取,并存储在数据库中
在此脚本中,首先建立数据库medical,其分为两个集合,分别为data,jc 其中data中包含每个爬取的病理的如下信息 其中jc为初步抓取检查项目抓取的结果,包含 2. 运行prepare_data文件夹中的build_data.py数据建立脚本
首先调用modify_jc函数对数据库中jc集合进行修改完善,具体实施是从html中提取检查项的名称和检查项结果的描述,得到集合jc下的set{‘name’:name, ‘desc’:sesc} 三、安装neo4j
在浏览器访问127.0.0.1:7474进入nei4j 四、运行构建知识图谱脚本进入项目根目录,输入命令:
此部分分为两个步骤,分别为创建知识图谱实体节点类型、创建实体关系边。 1. 创建知识图谱实体节点在创建知识图谱实体节点中,首先读入节点,节点分为8类:药品、食物、检查、科室、药品信息、疾病、症状、疾病信息,然后定义节点和实体的关系,包含科室——科室、疾病——忌吃、疾病——宜吃、疾病——推荐吃、疾病——通用药物、疾病——热门药物、疾病——检查关系、厂商——药物、疾病——症状、疾病——科室、疾病与并发关系。 其他节点label即为节点类型(如药品、食物、检查等),仅有name一个属性。实例如下图 2. 创建实体关系边同样先获取节点和关系的信息,此部分使用获取到的节点的关系。 { 其他关系与此类似。 五、运行问答对话脚本运行根目录下chatbot_graph.py,进行对话交互。 1. 问句类型分析首先以药品、食物、检查项目、科室、药品信息、疾病、症状即知识图谱中节点的名称为特征词,构建领域的关键词树;然后分别构建症状提问关键词、原因提问关键词、并发症提问关键词、食物提问关键词、药品提问关键词、预防提问关键词、持续时间提问关键词、治疗方法提问关键词、治愈概率提问关键词、易感人群提问关键词、检查项目提问关键词、科室提问关键词、治疗作用提问关键词。 1)构建领域关键词树安装ahocorasick包,其能够在一次运行中找到给定集合所有字符串,可帮助我们快速进行关键词匹配。
首先利用特征词进行构建actree,pyahocorasick构建actree的用法如下: 2)构建问句疑问词词典分别构建症状提问关键词、原因提问关键词、并发症提问关键词、食物提问关键词、药品提问关键词、预防提问关键词、持续时间提问关键词、治疗方法提问关键词、治愈概率提问关键词、易感人群提问关键词、检查项目提问关键词、科室提问关键词、治疗作用提问关键词。 3)问句过滤和类型确定利用1)中以特征词构建的actree进行关键词匹配,得到关键词的类别词典,以关键词的类别确定问题的类型,如疾病症状、疾病原因等。 2. 问句内容解析根据得到的类别词典和问题类型判断的结果,组合sql语句: 3. 问句答案搜索首先链接neo4j,在上面已经构建完成了节点和关系边: 然后根据sql列表中每个sql实体的sql语句从知识图谱中得到搜索的答案,然后根据问题类型组装搜索得到的答案,得到回答。其中根据对于疾病症状问题类型进行的答案组装实例: 六、运行结果 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 2:23:27- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |