IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 游戏开发 -> Inverse design of 3d molecular structures with conditional generative neural networks(2022论文阅读) -> 正文阅读

[游戏开发]Inverse design of 3d molecular structures with conditional generative neural networks(2022论文阅读)

目录

摘要

简介

方法


用条件生成神经网络对三维分子结构进行逆向设计

2022 Natre Communicaions

最近读了一篇蛮有意思的文章,这里把主要思想整理了一下,这部分主要包括论文提到的生成模型的介绍,以及涉及的公式的介绍(其中有些一些自己在阅读过程中的问题(Q开头的句子))。

论文的全部翻译可自行下载:用条件生成神经网络对三维分子结构进行逆向设计-深度学习文档类资源-CSDN文库

摘要

合理设计具有理想特性的分子是化学领域的一个长期挑战。生成神经网络已经成为一种强大的方法,可以从学习到的分布中抽取新分子。在这里,我们提出了一个条件生成神经网络,用于具有特定化学和结构特性的三维分子结构。这种方法与化学键无关,可以从条件分布中对新分子进行有针对性的取样,即使在参考计算稀少的领域我们展示了我们的方法在逆向设计中的实用性,通过生成具有特定主题或组成的分子,发现特别稳定的分子,以及联合针对训练制度以外的多种电子特性。

Q、生成的分子结构是现实中没有的吗?

有的,但是我们要是在制药中选择一种有特定作用的化合物比较难找到各方面性能都很合适的。从而用生成模型去生成,再去找生成的化合物来做实验。如果每个化合物都做实验的话,效率就会很低。

可以认为是只要是合理的结构就是可以合成的吗?在计算机里面合成和在现实的情况下合成是有区别的吧?可能这个东西在样本库里面很少在现实中怎么会更加稳定,要么不稳定,要么不好合成。

Q、合理的理想特性是怎么保证可以得到的?加入条件算就交叉熵。

Q、与化学键无关?就是怎么能保证我生成的这个东西真的可以用呢?不会生成一些很奇怪的东西吗?

有一个判断的方法,就是对生成的结构匹配化学键 编号,检测可用性。

Q、逆向设计?

就是根据需要生成一个化学结构式,根据这个结构式去找合适的分子结构。

Q、训练样本是什么,3D总不能是图片吧?

应该是一个向量or矩阵这里还不是很明了诶


简介:

在这项工作中,我们提出了条件性G-SchNet(cG-SchNet),一个用于分子逆向设计的条件性生成神经网络。在G-SchNet的基础上,该模型根据结构或化学特性学习条件分布,使我们能够对相应的三维分子结构进行采样我们的架构旨在生成任意大小的分子,不需要指定目标成分(化学键 官能团?)因此,它可以学习分子的组成和它们的物理特性之间的关系(分子的结构--对应物理特性),以便对表现出给定目标特性候选分子进行采样,例如,在针对小的极化率时更倾向于较小的结构(?)。以前提出的方法通过调整训练目标或数据,每次都偏向于一组特定的目标属性值48,51(这种方法为什么会有偏向呢?)。相比之下,我们的条件性方法允许在训练完成后搜索具有任何所需目标属性值的分子。它能够共同瞄准多个属性,而不需要重新训练或以其他方式间接约束采样过程。这为该模型利用训练数据的全部信息提供了基础,从而提高了泛化和数据效率。我们证明了cG-SchNet能够探索人口稀少的区域,而这些区域用无条件模型是很难达到的。为此,我们对不同的调节目标进行了广泛的实验,包括化学性质、原子组成和分子指纹。通过这种方式,我们产生了具有预定结构图案的新分子、表现出特定化学性质的特定成分的异构体以及共同优化HOMO-LUMO间隙和能量的新配置。这表明我们的模型能够灵活地、有指导地探索化合物空间。

Q、就是在原来的基础上加上了条件吗?

可以这么说,加上条件之后训练的数据的选取和训练方式有所区别了,原来的G-SchNet应该是通过改变训练数据的倾向性来改变输出的倾向性(我想模型生成具有性能A的结构,用含有性能A的结构训练模型)。而cG-SchNet只要把A作为条件就可以实现性能A的结构的生成。

Q、关键是,这个模型可以学习到分子的组成和其物理成分之间的关系。为什么别的网络就不能学到呢?或者说能学到的网络有什么样的结构上的特点,或者数据上的特点,(输入的数据是怎么样的?什么样的数据拿来训练,输出的结果是什么样的数据呢?)

Q、这个生成性网络的构造是什么样的?在方法部分

Q、加入了什么条件?如何确定的这些条件?

标量,矢量,embeding之后过全连接网络,这些被写进去的条件应该是相关化学性能,某些官能团和分子结构等。

Q、训练的数据是什么?肯定不是三维结构的映射吧?后面会讲训练数据怎么来的,但是不太懂,文中的训练分子样本挺多的

Q、学习分子的组成和它们的物理特性之间的关系(how?):设定合适的loss函数(本文为交叉熵)


方法

cG-SchNet生成有针对性的三维分子。

1、cG-SchNet学习分子的条件分布的因子化,即以目标属性为条件的原子位置和原子类型的联合分布。(模型在学什么?)

?2、一个分子的具体生成流程:

这个是具体的生成过程示意图

1、在未完成的分子里面随机的选取一个原子作为交点focus:原子类型在下面那行(除了碳、氢、这种原子类型之外还有两个辅助标记(focus、origin)后面会讲怎么用)

2、未完成分子的所有结构的位置和类型作为条件,以及性能条件,预测下一个原子的类型,如果stop则1,如果非则3

3、未完成分子的所有结构的位置和类型作为条件,以及性能条件,以及该原子的类型为条件 预测相对位置分布

4、有一个3d的网格以焦点原子为中心的,确保下一个原子的位置离焦点最近,(算出来的距离要对应网格的位置,要进一步处理的,比如离散化等)

5、得到下一个原子的位置

6、把原子放上去,直到所有的原子都marked为止

?3、cG-SchNet模型结构

?cG-SchNet架构的输入和输出的示意图。

"⊕"代表连接(这里好像是串联),"⊙"代表Hadamard乘积(对应元素相乘)

左图:用SchNet提取代表未完成分子的原子特征向量,条件被单独嵌入,然后连接起来以提取条件特征向量。确切的嵌入取决于条件的类型(如标量或矢量值)。

中间:从提取的特征向量中预测下一个原子的类型分布。

右边:根据提取的特征向量下一个原子的采样类型,预测下一个原子与未完成分子中每个原子/标记之间的成对距离分布。关于构件的细节,Methods部分。

Q、MLP 是什么?感知机网络(这里全连接)

?训练数据来源:

?神经网络架构的细节

?所有的条件组合在一起得到输入条件y:

?预测下一个原子的类型:

给定代表目标性质的条件特征y和描述部分分子的原子特征cG-SchNet架构通过两个输出网络预测下一个原子的类型及其到所有前面原子的成对距离的分布。

?

?预测下一个原子的位置:

训练数据怎么来的?

模型的训练方法?

论文的相关结论?

见下一章。

  游戏开发 最新文章
6、英飞凌-AURIX-TC3XX: PWM实验之使用 GT
泛型自动装箱
CubeMax添加Rtthread操作系统 组件STM32F10
python多线程编程:如何优雅地关闭线程
数据类型隐式转换导致的阻塞
WebAPi实现多文件上传,并附带参数
from origin ‘null‘ has been blocked by
UE4 蓝图调用C++函数(附带项目工程)
Unity学习笔记(一)结构体的简单理解与应用
【Memory As a Programming Concept in C a
上一篇文章      下一篇文章      查看所有文章
加:2022-05-01 16:02:57  更:2022-05-01 16:04:01 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 10:23:59-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码