基因组关联分析中的交互作用研究
?语音?编辑?讨论?上传视频
本词条缺少概述图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!
《基因组关联分析中的交互作用研究》是依托中国科学技术大学,由杨亚宁担任项目负责人的面上项目。
中文名
基因组关联分析中的交互作用研究
项目类别
面上项目
项目负责人
杨亚宁
依托单位
中国科学技术大学
目录
- 1?中文摘要
- 2?结题摘要
中文摘要
编辑?语音
复杂疾病与多个基因和环境因素以及它们之间的交互作用有关,本项目旨在研究复杂疾病全基因组关联分析中的交互作用。
基因组数据的复杂性及其交互作用分析的特点导致了传统统计方法在全基因组应用上的局限性,因此发展可行且有效的交互作用分析技术是复杂疾病关联分析中亟待解决的重要课题。
本项目通过借鉴机器学习工具研究基因交互作用的统计分析。我们提出的条件化搜索方法将赋予交互作用一个清晰的刻画并给出有效的统计推断方法。我们通过研究机器学习中的组合划分、回归分类树、多基因降维等多种技术降低问题复杂度,从而得到高效的检验。
所提方法既注重计算上的高效性也注重操作上的易用性,能够适用于高通量的全基因组数据的分析。另外,多重检验问题、群体分层、基因型测量误差等一系列与交互作用相关的问题也在我们的研究范围中。本项目既有重要的生物医学实际背景,也有统计理论和方法上的创新性,可引发一系列后续研究。
结题摘要
编辑?语音
本项目研究复杂疾病基因关联分析中的交互作用分析方法。
复杂疾病如糖尿病、高血压、心脏病等与多个基因和环境因素有关,发现和研究多个基因与疾病的关联关系是当前生物医学研究的热点问题之一。单基因关联分析是目前应用最为广泛的统计方法,已有诸多成功的案例。但对于复杂疾病的基因关联分析,多基因分析是一条有为有效的途径,而多个基因的交互作用机制及其统计检测方法是多基因关联分析的一个重要内容。 全基因组研究中实施多基因关联分析的主要困难在于缺乏有效的交互作用分析方法以及简单高效的计算技术,本项目对这两个方面进行了一些研究探索。 在国家自然科学基金面上项目的资助下,我们顺利地完成了预定的计划任务目标,在基因组关联分析交互作用研究方面取得了若干重要成果,发表标注基金支持论文8篇(其中7篇SCI),作为第二作者合作完成基因组关联分析学术专著一部(Springer出版社)。主要研究成果如下。
(1)关于基因交互作用的刻画与表示,我们提出了一种条件化分层方法,旨在发现统计模型难于涵盖的非可加性交互作用。单基因分析方法可以使用基因模型方法降低维数提高功效,等价于给每个基因型赋予有序的分值,但对于多个基因位点,基因模型难以定义,可能存在多种不同的定义方法。我们研究了列联表存在多种不同的分值或排序情况下的统计检验方法,并应用于研究多基因交互作用。
(2)我们提出了这一种有次序的组合划分降维方法,通过线性次运算得到全局最优解,大大降低了多因子降维法指数阶的运算复杂度,从而为多基因交互作用分析提供了一种运算高效的分析方法。
(3)多基因分析的一种途径是通过单体型分析多个基因的共同作用,我们从理论上研究了血样混合情形下的单体型估计的效率问题,证明了对于高度相关的基因位点,使用血样混合并以单体型为工具的分析方法是花费-有效的,因而可以作为两阶段设计的第一阶段以减少实验费用。
(4)网络数据模型、多重检验问题、群体分层、基因型测量误差等一系列与交互作用相关的问题也在我们的研究范围中,比如我们我们证明了Bradley-Terry模型中当节点个数趋于无穷,而节点连线个数较小的稀疏情况下实力参数极大似然估计的渐近理论性质。另外我们研究了关联分析中相关样本的有效样本量计算方法,从而简单地刻画了相依样本对于关联分析提供的信息量。
(5)通过本项目的实施,培养博士生6人(毕业3人),硕士生12人(毕业4人)。?[1] ?
|