创新实训——生物大分子分析平台1
2021SC@SDUSC
项目概述
这是一个基于人工智能的生物大分子序列智能分析平台,面向大规模生物医药数据,包括蛋白质组学,基因组学,转录组学数据等,为非计算机专业背景的研究者们提供方便快捷的机器学习训练与预测,同时将结果可视化分析与展示,让使用者开展更加迅速有效的科研工作。
一、小组成员分工 整个项目分为前端、后端及算法三大模块。本小组共5人,一人负责web前端,一人负责后端,其余3人负责人工智能算法部分。前端的设计需求为提供界面友好的互动界面,可以将模型运行得到的结果进行可视化展示。算法部分解决包括如蛋白质结构预测在内的多个热门生物信息学问题。我所具体的负责的部分为基于序列的蛋白质结构质量的预测。 二、个人任务概述
- 研究背景
目前,x射线晶体学是确定蛋白质结构的主要方法。这种方法成本高且成功率低,而且得到的结构质量水平不一。然而有些应用如药物设计需要特定水平的结构质量。因此我们希望能提供预测模型直接根据蛋白质序列预测分辨率和R-free(蛋白质结构质量的两种度量)并提供web服务器,允许批量预测并提供结果的信息可视化。 2.目标 首先,通过阅读论文和分析源代码,学习用于处理生物序列信息的常用模型。接下来几篇博客将对来自Nature Machine Intelligence、Bioinformatics等生信领域顶刊的论文进行解读,并分析其关键部分的源码实现。然后,自己设计合适的模型,编程实现端到端的预测方案。 3.关键代码确定 代码分析的核心关注点为深度学习算法部分,特别是蛋白质序列的特征提取部分的设计及对传统序列处理模型的创新。
三、代码环境配置 以下为开发工具配置的简单记录 1.前端开发:Vue及nodejs 下载合适的nodejs版本:https://nodejs.org/en/download/ 通过命令行窗口,安装vue
npm install vue -g
2.深度学习算法:pytorch框架 在之前的一篇博客中有记录:https://blog.csdn.net/weixin_45897586/article/details/115334186
|