| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 论文解读:A novel antibacterial peptide recognition algorithm based on BERT -> 正文阅读 |
|
[人工智能]论文解读:A novel antibacterial peptide recognition algorithm based on BERT |
A novel antibacterial peptide recognition algorithm based on BERT论文概述1. 论文基本信息发表期刊: BRIEFINGS IN BIOINFORMATICS(BIB) 2. 生物背景2.1 肽的理解
2.2 抗菌肽的理解
2.3 论文解决的问题预测肽是不是抗菌肽,如下图所示 3. 实验数据3.1 引用的数据集1. 预训练数据集 3.2 作者自己处理的数据集1. 预训练数据集 4. 方法4.1 数据预处理
4.2 预训练模型输入为序列, 4.3 微调微调数据的形式: NSL的模型结构如下图所示, MSM微调模型的输入为整个序列的编码,包括[CLS]、[SEQ]、[MASK],如下图所示 4.4 预测输入序列,即可利用训练好的模型进行训练。 5. 结果5.1 对比其他方法独立测试结果使用六种方法提出的数据集对用uniprot预训练的模型进行微调,改变论文方法的训练集和测试集的K值,来判定K值对实验结果的影响以及作者提出方法的优势,比较的方法使用的K值均为1
5.2. 预训练对实验结果的影响省略了预训练步骤,而直接使用AMPScan Vr.2的数据集重新训练模型,然后对独立测试进行比较。
结论:
5.3 平衡数据对微调模型的影响对MAMPsPred模型的数据集和iAMP-2 L模型的数据集进行下采用分别得到平衡的数据集和失衡的数据集(如表4),先利用平衡的训练集和失衡的测试集对预训练的模型进行微调,再进行独立测试,并进一步比较K值对微调模型的阴线,得到下图结果。
AmPEP模型提供的数据集中存在大量的负数据,从AmPEP模型数据集中得到一组1:1、1:3、1:5、1:7和1:9正负样本比例的数据,通过10倍交叉验证评估了Ampep模型的预测性能 5.4 训练得到一个通用模型增加训练集的多样性可以在一定程度上提高模型的通用性,所以使用更多样的AMP和非AMP数据集来训练我们的模型。在此基础上,通过增强对新数据集特定特征的学习,使模型更适合新数据集(举列子)。
实验设计:
1.B的表现更好,即不同数据集中的AMPs之间存在一些共同特征。 实验设计: 使用StarPepDB数据库中包含的16 990个非冗余AMP序列,加上相同数量的随机选择的非冗余非AMP多肽链作为训练集来训练一个通用模型。我们对这个模型进行了5倍交叉验证,结果如表7所示。
6. 结论
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 20:59:55- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |