跳转到主要内容

基因效应的全基因组变异研究与最大的神经解剖学覆盖

摘要

背景

脑成像遗传学为研究基因变异对大脑的影响提供了巨大的机会。许多研究表明,大脑的结构、功能和异常(如与阿尔茨海默氏症有关的)是可遗传的。然而,哪些基因变异导致了这些表型变化尚不完全清楚。神经成像和遗传学的进展使我们能够获得详细的大脑解剖和全基因组信息。这些数据为我们提供了新的机会来识别影响大脑结构的基因变异,如单核苷酸多态性(SNPs)。在本文中,我们进行了一项基于全基因组变异的研究,目的是识别顶级SNP或SNP集,这些SNP集在体素和感兴趣区域(ROI)水平上具有最大的神经切面覆盖的遗传效应。基于体素层面的全基因组关联研究(GWAS)结果,我们使用详尽搜索来寻找基于体素或roi神经解剖学覆盖范围最大的顶级SNP或SNP集。对于具有>2个SNP的SNP集,我们提出了一种有效的遗传算法来识别能够覆盖所有ROI或特定ROI的顶级SNP集。

结果

我们鉴定了顶级SNP,SNP-对和SNP-Sets的集合,其效果具有最大的神经肿瘤覆盖率。实验结果对真实成像遗传学数据表明,在识别顶部SNP集的计算时间方面,所提出的遗传算法优于穷举搜索。

结论

我们提出并应用了一种信息学策略来识别具有最大神经解剖学覆盖范围的基因效应的顶级snp、snp -对和snp -集。所提出的遗传算法为完成该任务提供了一种有效的解决方案,特别是对顶级snp集的识别。

背景

随着近期获取多峰神经影像和高通量遗传学数据的技术进步,收集了人脑的大量多模结构和功能成像数据以及来自相同一组受试者的基因组遗传数据。随着这些数据集的可用性,脑成像遗传学已成为一个新兴的研究领域,为检查遗传变异对大脑的影响提供了巨大的机会。许多研究表明,大脑的结构,功能和异常(例如,与阿尔茨海默病有关的那些)是遗传的。然而,哪种遗传变异有助于这些表型变化并不完全清楚。

为了弥合这一差距,出现了一些发现遗传变异和成像表现型之间联系的方法。全基因组关联研究(GWAS) [1),该研究将基因变异如单核苷酸多态性(SNPs)与成像表型联系起来,主要分析了snp与感兴趣区域(roi)测量之间的关联。voxelwise GWAS (vGWAS)是Stein等人提出的[2,3.]生成大脑上的SNP效果的详细三维图,而无需在大脑上定义ROI。黄等人。(4[开发了一种功能基因组 - 宽协会研究(FGWA)方法,用于识别极大的搜索空间中的稀疏信号。与GWA相比,FGWA可以改善检测能力,以发现影响脑结构和功能的重要遗传变异和基因环境相互作用。Vounou等。(5提出了另一种用于同时选择SNP变体和绑定区域的方法,假设信号稀疏。这可以减少测试的SNP和表型的数量。在这些方法中,VoxelWise GWA可以从更细微的角度来研究SNP,并且可以捕获基于ROI的方法容易错过的微妙信号[6,7,8]。

随着SNP的数量增加,数据量呈指数增长。在现有研究中,研究人员使用各种方法来检测两个标记效应[9]。冈瑟F, et al。用神经网络建立模型来揭示影响。有一个问题,估计的重量无法解释[10]。随机森林被用来建立精确的决策树的效果[11]和两阶段分组确定独立筛选[12]来检测因果关系。为了检测这种效应,人们设计了其他方法,如比值比[13、蚁群优化算法[14和MegaSNPHunter [15]。然而,由于n个SNPs的影响比较复杂,且数据增长迅速,对其的研究仍是一个有待发展的问题。

尽管脑成像遗传学已经成为一个新兴的快速发展的研究领域[16,17,18,19],遗传效应对神经解剖学覆盖的研究仍然是一个未充分探索的话题。为了弥补这一差距,在本文中,我们进行了一项基于全基因组变异的研究,目的是识别在体素和ROI水平上具有最大神经切开术覆盖率的顶级SNP或SNP集。基于体素级GWAS结果,我们使用穷例搜索来找到基于体素或roi神经解剖学覆盖范围最大的顶级SNP或SNP集。对于具有>2个SNP的SNP集,我们提出了一种有效的遗传算法来识别能够覆盖所有ROI或特定ROI的顶级SNP集。

结果

单标记效应的结果

我们在图中展示了VBC、VBP、RBC和RBP不同阈值下的前10个SNPs的频率。1。24个SNPs显示出很大的神经切面覆盖。与预期的一样,20号染色体上发现了最常见的位点,包括rs6092321RTF2rs6024860(无)。本研究中确定的其他snp见图。1。表格1显示了被识别的snp解释的方差。rs6092321和rs6024860的主效应分别占表型方差的0.93%和0.82%。

图1
图1

VBC、VBP、RBC、RBP的前10位snp及其频率。X轴表示所有阈值中前10个SNPs的数量;Y轴表示SNPs的名称;VBC =根据覆盖体素的数量对snp进行排序;VBP =根据最小要求p阈值对snp进行排序;RBC =根据roi的个数对SNPs进行排序;RBP =根据最低要求p阈值对snp进行排序

SNP-SNP效应的结果

53对单核苷酸多态性对神经切断器覆盖的影响具有统计学意义。只有1对通过了覆盖标准:4个策略都需要被SNP对覆盖。SNP-SNP效应的结果为rs6092321 (RTF2) - rs700319 (CNTNAP2)。数字2提供了其他SNP对的频率。rs6092321 - rs700319的方差解释为0.94%,rs6092321 - rs700319的相关性分别为0.0945、0.0533和\ \ (-0.0381)(表1)。

图2
figure2

VBC、VBP、RBC、RBP的前10位SNP对及其频率。X轴表示所有阈值中前10个SNPs的数量;Y轴为SNP对名称;VBC =根据覆盖体素的数量对snp进行排序;VBP =根据最小要求p阈值对snp进行排序;RBC =根据roi的个数对SNPs进行排序;RBP =根据最低要求p阈值对snp进行排序

三种SNPs效应的结果

为了寻找一个合适的种群大小和最大进化代,我们选择100和1000作为中心,0-200和0-2000作为范围,20和200作为步长分别计算分数。为了避免偶尔的最终得分过小,我们统计了每种情况下10个循环后的最大得分和相应的SNP集。得到的得分、种群大小和最大进化代数如图所示。3.。如图1所示。3.,当我们使用100(种群大小)和1000(最大进化代)对SNP集进行过滤时,SNP集的得分达到最高值2.08。

图3
图3

得分与混合参数(种群大小+最大进化代)的关系。X轴为SNP集得分;Y轴表示种群大小和最大进化代的总和

图4
装具

分数与进化生成的曲线。种群规模为100;最大进化代为1000;1、2、3、4、5、6、7、8、9、10是10个循环的次数

使用所选人口尺寸(100)和最大进化产生(1000),我们计算得分与进化产生之间的关系。得到的曲线如图1所示。4。为避免偶尔的最终得分太小或大,我们用相同的参数运行遗传算法10次。第6,第7,第8,第9和第10和第10次的得分约为1.5,而第6和第9次过早收敛。初始人口和后代的缺陷可能是主要原因。所有剩余的分数高于2.0,第一个,第3和第4个具有更好的分数。他们的初始分数急剧地波动,分数随着时间的推移迅速增加。其中大约600代的第1个收敛到最佳分数,并且第3和第4的转折点约为400代。这是因为父母具有更好的分数,可以有机会繁殖和传递给他们的代码。

与预期的一样,SNP集的神经解剖学覆盖最大,最小p来自AR的值和高数包括RS6092321(图。3.)。在SR方面(我们的实验中有两个roi分别为hippocampus_l和hippocampus_r), rs429358在大多数被识别的SNP集中存在,且最小p值(无花果。5)。三个SNPs效应的结果分别为rs6092321 (RTF2) - rs10500192 (CNTNAP2) - RS4811693(FAM210B.),及rs429358 (APOE) - rs2640726 (EPHX2) - rs4621717 (CNTNAP2), rs429358 (APOE) - rs516125 (SCARA3) - rs4621717 (CNTNAP2), rs429358 (APOE) - rs10933428 (INPP5D) - rs4621717 (CNTNAP2)及rs429358 (APOE) - rs12539907 (CNTNAP2) - rs4621717 (CNTNAP2)。详情见附表1

图5
figure5

AR和sr中排名前10位的SNP集合及其频率。X轴表示所有设置阈值中排名前10位的SNP个数;Y轴表示SNP集的名称;AR =根据最小p阈值对SNPS进行排序,覆盖所有roi;SR =根据最小p阈值对特定ROI进行SNPS排序

事后分析。

表1 VBC、VBP、RBC、RBP、AR和SR中发现的8个显著SNP、SNP对和SNP集

表格1也显示了snp与海马体、记忆和记忆之间的相关性。对于每一个SNP、SNP对和SNP集,我们叠加了每一组SNP的体素图像。我们结合图像和特征[20.来确定SNPs对大脑特征的贡献。对于rs6092321,相关性占0.073、0.0806和0.0042,rs6092321 - rs700319的相关性占0.0945、0.0533和\ \ (-0.0381), rs6092321 - rs10500192 - rs4811693的相关性分别为0.0804、0.0675、-0.0111。在SR中,rs429358 - rs12539907 - rs4621717的相关性分别为0.3085、0.1522、0.1186。

讨论

在这项研究中,我们使用了来自阿尔茨海默病神经成像倡议(ADNI)数据库的1515名受试者样本,进行了体素级GWAS。据我们所知,这项检测SNP、SNP对和SNP集的研究是第一个关于遗传效应对神经解剖学覆盖的研究。

将不同处理下的降采样图像与遗传数据进行vGWAS处理。然后使用四个计算程序(VBC、VBP、RBC和RBP)对得到的数据进行分析,对snp进行排序。SNPs是根据小于集合的体素数量来选择的p以VBP为对照组,根据阈值对SNPs进行过滤p对应于给定数量的体素的值。VBP的主要目的是在VBC中找到“缺少的SNP”。如图1中所示。1,前9个SNPs相同,VBC和VBP中有一些SNPs不同。的差异pSNPs体素值是主要原因。在RBC和RBP中,选择影响roi并在体素水平上与选择的SNPs不同的SNPs是主要目标。在VBC的基础上,增加RBC的ROI覆盖率作为附加条件。与RBC类似,将给定的体素数量改为ROI的集合数量,在RBP中增加ROI的覆盖率。从其他条件中挑选snp并与RBC中的snp进行比较是RBP的主要目的。在体素水平和ROI水平上观察到相似的snp差异,并与ROI覆盖率的增加直接相关。

根据这四个不同的程序,显示了不同的排名,并发现了几个缺失的SNPs。这些都强调了使用多种程序来获得最佳SNPs的必要性。SNPs的频率可以通过数字直接观察到,较低的值表示“缺失的SNPs”已经被恢复。

当选择的SNP集数量大于等于3时,SNP集的数量达到9亿个,穷举策略的时间呈指数增长。因此,提出了缩短时间或减少数据集的算法。遗传算法适用于解决这一问题。遗传算法的初始种群可以看作是一个简化的数据集,交叉继承后的后代可以看作是一个不断变化的新数据集。重要的是,当一个分数较大的子代出现时,数据集将迅速收敛到这个分数,大大缩短了选择时间。如图1所示。4,得分的戏剧性变化约为3.5和2.8,并且在该价值下的高原之后的分数。并且1000种进化产生的时间可以缩短到小于20分钟。

在单标分析中,从分析中识别的最明显的SNP是RS6092321(内RTF220号染色体上的基因)。SNP rs6092321 (RTF2)具有高覆盖率,留下末端,右旋肌直肌,左基因皮层,右敌机皮质和禁虫。左旋转肌和右旋转肌的特定功能尚未带到光线。然而,亚组分析显示出对语言和记忆召回类别的回归直肠切除的负面影响[21]。Ballmaier M.等人曾报道,在直回中观察到非常显著的强烈灰质缺陷[22]。进展性(阿尔茨海默病)和稳定的轻度认知患者的左内嗅皮层体积是不同的[23]。MRIS表明,戈麦斯 - 洛佩兹 - 埃尔南德综合征的特征是小脑骶骨损失或部分小脑损失和不同程度的小脑融合[1]。在图像方面,通过计算rs6092321 (RTF2)和特征(海马、记忆、记忆和扬声器),我们发现rs6092321 (RTF2)与海马,记忆,记忆和扬声器(附加文件1)呈正相关。这给出了RS6092321对上述乐队的影响。

在SNP-SNP分析中,rs700319(在CNTNAP27号染色体基因)和rs6092321 (RTF2)由于700319的频率,成对出现了最高频率(CNTNAP2)的单标记分析结果不高。rs6092321解释的方差(RTF2) - rs700319 (CNTNAP2)单独大于rs6092321。结合额外的文件1,这些给出的证据,rs700319 (CNTNAP2)是另一个重要的苏格兰民族党。与rs6092321 (RTF2), rs6092321 (RTF2) - rs700319 (CNTNAP2)与记忆和海马呈正相关,与记忆负相关(表2)。

虽然通过遗传算法获得的结果不是全球最佳解决方案,但运行时间大大减少。结果达到了运行时间的增加,实现了改善。在AR中,考虑到rs6092321解释的差异(RTF2)及rs6092321 (RTF2) - rs10500192 (CNTNAP2) - RS4811693(FAM210B.)和附加文件1,rs10500192 (CNTNAP2)及rs4811693 (FAM210B.)是基因对神经解剖覆盖的影响的“缺失snp”。

在SR中,我们发现rs429358 (APOE)。一项荟萃分析估计纯合子rs429358 (C;C)个体与更常见的ApoE3 / ApoE3纯合子的比率是晚发型阿尔茨海默病的12倍,早发型阿尔茨海默病的61倍[24]。这些结果证实了我们的预测,并证明了我们选择的候选snp将提供更有价值的信息。对于包含rs429358 (APOE), SNP集与特征(海马、记忆和记忆)的pearson相关性表明,SNP集与这些特征呈正相关。这表明SNP组对海马体和记忆有意义,也与我们最初的视觉一致。考虑包括rs429358 (APOE)和附加文件1,rs12539907 (CNTNAP2)是海马体的“缺失SNP”。

基于上述内容,在我们的分析中确定了包括“缺失的SNP”的基因位CNTNAP2FAM210B.CNTNAP2在维持正常的神经网络活动和突触传递中起着关键作用。跨突触桥由CNTNAP2在突触前膜上CNTN2在突触后膜上可以跨越突触间隙[25,26,27]。树突状枝状突起及兴奋性突触、抑制性中间神经元、抑制性突触数量均因缺失而减少CNTNAP2(28,29,30.]。CNTNAP2引导神经元的细胞迁移到大脑中的正确位置[28,31]。的影响CNTNAP2在神经元的细胞迁移、突触发育、突触通信等方面,它在脑功能中起着关键作用。FAM210B.能促进原卟啉原IX (PPIX)向FECH的转移,通过与PPOX和FECH形成低聚物促进铁的引入和血红素的合成,增强线粒体铁的引入和血红素的合成[32]。铁硫簇结合引起的FECH蛋白的稳定性[33或FECH mRNA转录增加[34]导致红细胞酶蛋白表达在促红细胞生成期间增加。FAM210B可以有效地运输熨斗来精致,和/或影响精明酶的变构激活[32]。这背后可能的机制APOE-CNTNAP2RTF2-CNTNAP2值得进一步调查。

总之,我们分析中发现的一些snp和基因与现有文献的先验知识中神经解剖学覆盖的遗传效应有有趣的关联,如rs6092321、rs429358、RTF2,APOECNTNAP2。附加文件1显示了识别的SNP,SNP对和SNP集的大脑结构与SNP集之间的相关性,并且通过[20.]。这些结果非常令人鼓舞,并证实了分析是成功的,因为它能够识别“缺失的SNPs”和具有最大神经解剖学覆盖的顶级SNPs。此外,我们在研究中发现的大量SNP、SNP对和SNP集具有遗传效应,值得在今后的研究中进一步研究或复制。

本研究的局限性如下:(1)我们检测了1784个SNPs。我们还需要使用更多的SNPs来分析。(2)利用遗传算法分析多个SNPs的影响。其结果是一个局部最优解,在多个SNPs中仍需要开发更有效的策略。(3)与穷举搜索相比,采用遗传算法可以在更短的时间内得到更好的结果。但是随着时间的推移,结果会越来越好,用户仍然需要等待很长时间才能得到更好的结果。(4)当一组更好的snp出现时,后代将被困在这种组合中。

结论

为了研究单核苷酸多态性与大脑结构之间的关系,我们采用ADNI数据库中1515个样本进行了基于ROI和体素的体素GWAS和单核苷酸多态性分析,以发现影响大脑更多区域的单核苷酸多态性。单标记分析确定了snp rs6092321和rs6024860,它们在所有情况下对神经解剖覆盖的遗传效应最高。SNP - SNP分析在单标记分析中发现了新的SNP对,包括rs6092321,显示出与神经解剖学覆盖度有很强的相关性。这是rs6092321和rs700319。n SNPs分析确定了一些新的发现,显示更高的与整个大脑或海马体的联系。也许在这项研究中更重要的是发现了在常规GWAS研究中尚未发现的与阿尔茨海默病(AD)相关的snp。基于体素级GWAS, n个snp和SNP-SNP的影响比单标记效应具有高的统计学意义。这些可能有助于解决部分缺失的snp和脑集群。虽然本研究的重点是snp效应,但结果很可能表明,遗传算法是检测n个snp效应的一种有趣的方法。

除了上述有趣的发现外,我们的体素全基因组关联研究和神经解剖学覆盖的遗传效应研究还有以下优势。(1)据我们所知,这是基因对神经解剖学覆盖的影响的第一次研究。(2)采用体素体积测量作为表型具有比传统表型更高的统计力,能够找到“缺失的snp”。(3)本研究的样本包括HC、SMCI、EMCI、LMCI和AD,从而提供了疾病进展的分级谱。(4)我们的方法比穷举策略具有更高的计算效率,有助于全基因组snp效应的分析。

方法

我们首先描述在这项工作中使用的成像和基因型数据,然后提出我们的方法。

成像和基因型数据

1515名非西班牙裔白人受试者的图像和基因型数据下载自http://adni.loni.usc.edu。在这项研究中,我们分析了MRI扫描和基因分型数据,包括353名健康对照(HC)、89名显著记忆问题(SMC)、273名早期MCI (EMCI)、504名晚期MCI (LMCI)和296名AD参与者。这1515名受试者的特征如表所示2

表2参与者特征

预处理的t1加权体积MRI扫描与每个参与者的相同访问扫描对齐,并归一化到蒙特利尔神经学研究所(MNI)空间。基于体素的形态测量(VBM)应用欧宝直播官网app于MRI扫描,提取体素级的体积测量值。简单地说,将扫描图像对准t1加权的模板图像,分割成灰质、白质和脑脊液地图,然后归一化到MNI空间。采用8mm半whm核提取并平滑灰度图。然后将得到的GMD图像降采样到一个维数\(61 \乘以73 \乘以61\)(即,含有271,633个体素)以减少随后分析中的计算成本。使用自动解剖标记(AAL)ATLAS进行解剖学定义116 rois及其坐标[35],并在下采样的图像中注册。

基因分型数据的处理方法见[36,37,结果为所有1515名参与者产生了565,373个snp。来自先前大规模GWAS荟萃分析的24个AD候选基因列表[38]进行了分析。我们提取了位于\ 20下午(\ \)在我们的成像遗传关联分析中,最终包含了1784个SNPs。

总体战略

如图1所示。4该研究的第一步是对1515名受试者进行两两单变量体素遗传关联分析,以检测1784个snp对大脑271633个体素的变异效应。的p首先对每个SNP的所有体素进行遗传关联,得到每个SNP-体素对的值。使用这些体素级SNP结果,我们实现了以下四种策略来识别在体素或ROI基础上影响神经解剖学最大部分的顶级SNP或SNP对。

  1. 1

    VBC:给定p阈值,根据重要体素的数量对snp进行排序。

  2. 2

    VBP:给定Voxel编号阈值,根据最小所需的P阈值等级SNP。

  3. 3.

    加拿大皇家银行:给定p阈值和ROI覆盖阈值,根据足够数量的重要体素覆盖的ROI数量对snp进行排序。

  4. 4

    RBP:给定ROI数阈值和ROI覆盖率阈值,根据最低要求p阈值对snp进行排序。

尽管穷举搜索策略可以用于识别顶级SNP或SNP对,但由于计算成本呈指数级增长,它无法识别包含三个或更多SNP的SNP集(为方便起见,记为高阶SNP集)。为了解决这一挑战,我们提出了一种更有效的遗传算法来识别顶级高阶snp集,其影响具有最大的神经解剖学覆盖范围。

图6
figure6

工作流程的原理图设计。VBC =根据覆盖体素的数量对snp进行排序;VBP =根据最小要求p阈值对snp进行排序;RBC =根据roi的个数对SNPs进行排序;RBP =根据最小要求p阈值对SNPs进行排序;AR =根据最小p阈值对SNPS进行排序,覆盖所有roi;SR =根据最小p阈值对覆盖特定ROI的SNPS进行排序;top SNPs、SNP pairs和SNP sets =已识别的具有最大神经切面覆盖或特定ROI的遗传效应的top SNPs、SNP pairs和SNP sets

数字6显示了我们的分析工作流程的原理图设计。在下面的小节中,我们将更详细地描述这些分析。

单标记效应的识别和优先级

VBC:根据覆盖体素的数量对snp进行排序。为了获得体素的数量,我们将每个SNP的得分定义为拥有p值小于阈值。然后我们得到了一个SNPs列表,按照覆盖体素的数量降序排列(图。7)。为了避免意外的snp,我们设置了多个阈值。结果中出现频率最高的10个SNPs见图。1

VBP:根据最小值对snp进行排序p阈值。求最小值p在此准则中,每个SNP的值,我们设置一个限制体素数量的条件(图。8)。数字1显示了受一些阈值限制的结果的前10个SNPs。

图7
figure7

根据覆盖体素数排列SNP的示意图。1.计算体素数量p值小于各SNP中设置的阈值;2.根据数字对snp进行排序

图8
figure8

根据最小值排列SNP的示意图p阈值。1.根据。排列体素p价值;2.计算p每个SNP中的集体素节点上的值;3.根据依据排名SNPp价值

为了确定代表ROI的体素联合,一种方法是计算ROI的加权平均值,另一个方式是选择超过一定阈值的体素[39]。在我们的研究中,我们使用百分位数(至少20%)和p值(\ \ (p < 0.05)。)体素作为阈值。

RBC:根据覆盖的roi数量对SNPs进行排序。和VBC一样,为了得到覆盖的ROI的数量,我们定义了一个SNP如何影响一个ROI。以类似的方式,给出一个门槛p值时,如果一个SNP覆盖该ROI的20%体素,则认为该SNP影响该ROI。每个SNP根据其影响的roi的数量进行排序(图。9)。数字1显示了前10个SNPs。

RBP:根据最小值排名SNPp阈值。本节的目标是获得最小值p基于ROI的价值。每个SNP按照最小值进行排序p价值覆盖了给定数量的roi。在我们的实验中,在覆盖感兴趣区域的体素超过20%的情况下,设置感兴趣区域的数量,可以选取一个SNP(图1)。10)。图2中示出了具有最高频率最高的前10个SNP。1

SNP-SNP效应的识别和优先排序

对于SNP-SNP,引入了一个新的概念来确定p取值范围内的SNP-SNP效应。获得可操作的p的值,取最小值p因为我们使用了单一标记效应,所以作为结果的SNP-SNP在一个体素上的值。SNP-SNP效应的主要策略与VBC、VBP、RBC和RBP相似。

图9
figure9

根据覆盖roi的数量对SNPs进行排序的示意图。1。计算体素的百分比p比每个ROI中的设定阈值小值;2。按百分比对roi进行排名;3.。计算每个SNP中体素百分比大于设定值的roi数量;4。根据数字对snp进行排序

图10
图10.

根据最小值排列snp的示意图p阈值。1.根据对体素排序p每个ROI中的值;2.计算p设置体素节点上的值;3.roi排名根据p价值;4.计算p值在每个SNP的集合ROI节点上;5.根据p价值

三种SNP效应的识别和优先排序

AR:根据最小值对snp进行排序p价值覆盖了所有roi。在这三个snp的影响下,彻底搜索可能需要超过30天。因此,我们对遗传算法进行了改进,使其更适合我们的实验。遗传算法主要有四个步骤。11)。

图11
图11.

遗传算法的工作流程。编码= SNP将编码设置为3位码;初始化=生成初始数据集;竞赛策略=从一组代码中挖掘出最佳代码;交集=在随机地点交换父母的代码;突变=生成一个新的3位代码;后代=交集或突变的结果;适应度函数=基于p3 SNP的值影响116 ROI或特定的ROI,SNPS设置最小p价值作为父母挑选出来;解码= 3位码解码到相应的SNP集中

步骤1,编码和初始化。

步骤2,适应度函数和选择。

第三步,交叉和变异。

第四步,解码。

为了便于分析,最小p将三个SNPs的值设置在一个体素上,作为两个SNPs实验标准相同的结果。

在步骤1中,考虑集p在1784 SNPs的271633体素上,建立了编码策略和译码策略。由于是三个SNPs的影响,编码策略确定为3位码,每个位为1 ~ 1784。

在步骤2中,为了过滤出父元素,本节介绍了比赛策略。为了在竞赛策略中选择父策略,定义了适应度函数:基于p对影响116个roi的3个SNPs的取值,选取得分较大的SNPs集作为父SNPs。分数定义在公式中1。我们首先考虑pSNP的值,然后计算ROI中SNP的覆盖范围。因此,什么时候\(p值> 0.05\),占p价值是0.什么时候\ (p = 0.05 \),覆盖率的比例和p价值是一样的。当\ \ (p < 0.05)。,占p价值大于覆盖范围。

$ $ \{对齐}开始得分={\左\{\{数组}{你}-开始\日志_ {10}(p) + \压裂{-log_ {10} (x)} {log_ 0.2 {0.05}}, le 0.05 & p{} \ \ \ \压裂{-log_ {10} (x)} {log_ 0.2 {0.05}}, & {} p > 0.05 \ \ \{数组}\右结束。} \{对齐}$ $
(1)

在哪里p是最大的pvalue3个snp。是116个roi的最大覆盖范围。\(日志0.2 _ {0.05}}{\ \)是用来修改评分的覆盖率吗20 \ % \ \ (=)\({- 0.05 \日志_ {10}}\)

在步骤3中,为了产生后代群体,定义了称为交叉点概率的随机参数。如果是小于\ (P_c \),从3位码中选择一个随机位置作为交点进行交叉操作。为了避免组合中的数据锁定,另一个称为变异概率的参数被随机生成,并与\(下午\)。如果是小于\(下午\),进行变异操作。

利用公式确定了Pc和Pm的适应值23.(40]。

$ $ \{对齐}开始P_c = &{}{\左\{\{数组}{你}开始k_1 \离开(f{马克斯}- f ^{} \右)/ \离开(f{马克斯}-{\眉题{f}} \右),& f ^{}{'} \通用电气{\眉题{f}} \ \ k_3 & f ^{'}{} <{\眉题{f}}{数组}\ \ \ \端。} \{对齐}$ $
(2)
$$ \ begin {对齐} p_m =&{\ left \ {\ begin {array} {ll} k_2 \ left(f_ {max} - f \ light)/ left(f_ {max} - {\ overline{f}} \&{} f \ ge {\ overline {f}} \\ k_4,&{} f <{\ overline {f}} \\ \ end {array} \ revally。} \{对齐}$ $
(3)

在哪里\(k_1, k_2, k_3, k_4 \le 1.0\)\ (f{马克斯}\)是总体得分的最大值。\ (f ^ {} \)是两个相交个体的较大分数。\({\眉题{f}} \)是人口的平均分数。f是后代的分数。

在步骤4中,将结果解码为相应的SNP集。

SR:按照最小值对snp进行排序p值覆盖了特定的roi。第二步的适应度函数定义为:基于p当3个SNPs的值影响一个特定的ROI(覆盖率> 20%,其他ROI的最大覆盖率< 15%)时,SNPs设置为最小pValue被选为父。SR的其他策略与AR类似。

可用性数据和材料

本文中使用的数据是从ADNI数据库(http://adni.loni.usc.edu)。任何人都可以在以下网站申请访问ADNI数据http://adni.loni.usc.edu/data-samples/access-data/

缩写

AAL:

自动解剖标记

广告:

阿尔茨海默病

ADNI:

阿尔茨海默氏病神经成像计划

基于“增大化现实”技术:

所有的roi

EMCI:

早期轻度认知投诉

FGWAS:

功能基因组 - 范围协会研究

GMD:

灰质密度

GWAS:

Voxelwise全基因组关联研究

HC:

健康的控制

LMCI:

晚温度认知投诉

MCI:

轻度认知障碍

MNI:

蒙特利尔神经学研究所

核磁共振成像:

磁共振成像

宠物:

正电子发射断层扫描

PPIX:

Protoporphyrinogen第九

加拿大皇家银行:

ROI-based覆盖

RBP:

ROI-basedp价值

投资回报:

兴趣区域

SMC:

重要的内存问题

单核苷酸多态性:

单核苷酸多态性

SR:

具体的roi

VBC:

分布范围

VBM:

分布形态测量学欧宝直播官网app

VBP:

voxel为基础p价值

vGWAS:

voxelwise gwas.

参考

  1. 1.

    牛顿-切,赫施霍恩。复杂性状的遗传关联研究:设计与分析

  2. 2.

    Stein JL, Hua X, Lee S, Ho AJ, Leow AD, Toga AW, Saykin AJ, Shen L, Foroud T, Pankratz N. Voxelwise全基因组关联研究(vgwas)。神经53 (3):1160 - 1174

  3. 3.

    Hibar DP, Stein JL, Kohannim O, Jahanshad N, Saykin AJ, Shen L, Kim S, Pankratz N, Foroud T, Huentelman MJ。Voxelwise全基因关联研究(vgenewas):在731名老年受试者中进行基于多变量基因的关联检测。神经影像学56 (4):1875 - 1891

  4. 4.

    关键词:功能基因组,泛关联分析,泛关联分析神经;2017.p。159。

  5. 5.

    关键词:神经影像,遗传关联,稀疏降阶回归,高维神经影像神经53 (3):1147 - 1159

  6. 6.

    Braskie MN、Jahanshad N、Stein JL、Barysheva M、McMahon KL、de Zubicaray GI、Martin NG、Wright MJ、Ringman JM、Toga AW。clu基因中常见的阿尔茨海默病风险变异影响年轻人的白质微结构。神经科学杂志31(18):6764-6770

  7. 7.

    Hibar D, Stein J, Jahanshad N, Kohannim O, Hua X, Toga A, McMahon K, de Zubicaray G, Martin N, Wright M, Weiner M, Thompson P.全基因组相互作用分析揭示了大脑结构重复的上位性效应。一般人衰老。2015;36:151-8。

    文章谷歌学者

  8. 8.

    刘建军,刘建军。影像学遗传学中多变量分析的研究进展。Neuroinform前面。2014;8:29。

    PubMed公共医学中心谷歌学者

  9. 9.

    Koo CL, Liew MJ, Mohamad MS, Mohamed Salleh AH。基因流行病学中使用机器学习方法检测基因-基因相互作用的综述。生物医学研究。2013;1 - 13。https://doi.org/10.1155/2013/432375

    CAS文章谷歌学者

  10. 10.

    关键词:神经网络,基因-基因交互作用,神经网络,关联研究BMC麝猫。2009;10(1):87。https://doi.org/10.1186/1471-2156-10-87

    CAS文章PubMed公共医学中心谷歌学者

  11. 11.

    关键词:全基因组关联数据,随机森林,关联规则,SNP-SNP互作见:2018年第12届软件、知识、信息管理与应用国际会议,第1-7页(2018)。IEEE伊斯兰堡教派;Glink;聪明的联系;领袖

  12. 12.

    方永红,王建辉,熊ca . Tsgsis:一种检测全基因组snp-snp相互作用的高维分组变量选择方法。生物信息学。2017;33(22):3595 - 602。https://doi.org/10.1093/bioinformatics/btx409

    CAS文章PubMed谷歌学者

  13. 13.

    吴晓,董华,罗磊,朱勇,彭刚,Reveille JD,熊敏。一种新的全基因组相互作用分析统计方法。公共科学图书馆麝猫。2010;6(9):1001131。https://doi.org/10.1371/journal.pgen.1001131

    CAS文章谷歌学者

  14. 14.

    关键词:蚁群算法,snp-snp交互,遗传算法见:智能计算方法,第9773卷(2016)。施普林格

  15. 15.

    acta photonica sinica, 2011, 40(5): 689 - 693 .万鑫,杨超,杨青,薛辉,唐立林,于伟:一种检测疾病易感基因多态性的学习方法。BMC Bioinform。2009;10(1):13。https://doi.org/10.1186/1471-2105-10-13

    CAS文章谷歌学者

  16. 16.

    沉L,汤普森下午。脑成像基因组学:综合分析与机器学习。proc ieee。2020; 108(1):125-62。

    文章谷歌学者

  17. 17.

    Saykin AJ, Shen L, Yao X, Kim S, Nho K, Risacher SL,等。ADNI中MCI和AD表型的定量遗传学研究:进展、机会和计划。老年痴呆症痴呆症。2015;11(7):792 - 814。

    文章谷歌学者

  18. 18.

    …Shen L, Thompson PM, Potkin SG, Bertram L, Farrer LA, Foroud TM, Green RC, Hu X, Huentelman MJ, Kim S, Kauwe JS, Li Q, Liu E, Macciardi F, Moore JH, Munsie L, Nho K, Ramanan VK, Risacher SL, Stone DJ, Swaminathan S, Toga AW, Weiner MW, Saykin AJ。阿尔茨海默病神经影像学I. ad和mci定量表型的遗传分析:影像学、认知和生物标志物脑成像研究进展[j] .中国生物医学工程学报,2014;

    CAS文章谷歌学者

  19. 19.

    Shen L, Kim S, Risacher SL, Nho K, Swaminathan S, West JD, Foroud T, Pankratz N, Moore JH, Sloan CD, Huentelman MJ, Craig DW, Dechairo BM, Potkin SG, Jack JCR, Weiner MW, Saykin AJ。阿尔茨海默病神经成像,I:全基因组关联研究,用于识别mci和ad的数量性状位点:adni队列的研究。53杂志。2010;(3):1051 - 63。

    CAS文章谷歌学者

  20. 20.

    Wager T. Neurosynth:一个大规模自动合成人类功能神经成像数据的新平台。Neuroinform前面。2011;5(6):799 - 801。

    谷歌学者

  21. 21.

    [10]张国平,张国平,张国平。前交通动脉瘤破裂术后脑直回切除与认知功能损害的关系。脑血管内神经外科杂志。2016;18(3):223-8。

    文章谷歌学者

  22. 22.

    老年抑郁症患者的前扣带回、直回和眶额部异常:基于mri的前额叶皮层包裹。精神病学杂志161(1):99-108

  23. 23.

    Lopez ME, Bruna R, Aurtenetxe S, Pineda-Pardo JA, Marcos A, Arrazola J, Reinoso AI, Montejo P, Bajo R, Maestu F. Alpha-band超同步化治疗进展性轻度认知障碍的脑磁图研究神经科学杂志34(44):14551-14559

  24. 24.

    Rubinsztein DC, Easton DF。载脂蛋白基因变异与阿尔茨海默病。老年痴呆的认知障碍。1999;10(3):199-209。

    CAS文章谷歌学者

  25. 25.

    自闭症谱系障碍中接触蛋白相关蛋白样2的分子细胞遗传学分析和重测序。Am J Human Genet 2008;82(1): 165 - 173

  26. 26.

    在海马细胞培养中,抑制性轴突被抗caspr2自身抗体所靶向,与边缘脑炎相关。前细胞神经科学。2015;9:265。

    文章谷歌学者

  27. 27.

    Varea O,Martin-de-Saavedra MD,Kopeikina Kj,Schürmannb,弗莱明HJ,Fawcett-Patel JM,Bach A,Jang S,Peles E,Kim E.突触异常和细胞质谷氨酸受体含量在相关的蛋白质相似蛋白/ Caspr 2敲除神经元。PROC NAT ACAD SCI USA。2015; 112(19):6176-81。

    CAS文章谷歌学者

  28. 28.

    Peñagarikano O, Abrahams B, Herman E, Winden K, Gdalyahu A, Dong H, Sonnenblick L, Gruver R, Almajano J, Bragin A, Golshani P, Trachtenberg J, Peles E, Geschwind D. cntnap2缺失导致癫痫、神经元迁移异常和核心自闭症相关缺陷。细胞。2011;147:235-46。

    文章谷歌学者

  29. 29.

    Anderson GR, Galfin T, Xu W, Aoto J, Malenka RC, Sudhof TC。自闭症候选基因筛选确定了细胞粘附分子caspr2在树突分枝和脊柱发育中的关键作用。中国科学院学报,2012;

    CAS文章谷歌学者

  30. 30.

    AMOS G,Maria L,Olga P,Peyman G,Trachtenberg JT,Gescwind DH,Anna D.自闭症相关蛋白质接触蛋白样蛋白样2(CNTNAP2)稳定新刺:体内小鼠研究。Plos一个。2015; 10(5):0125633。

    谷歌学者

  31. 31.

    Strauss KA, Puffenberger EG, Huentelman MJ, Gottlieb S, Dobrin SE, Parod JM, Stephan DA, Morton DH。隐性症状性局灶性癫痫和突变接触素相关蛋白样2 - nejm。世界医学文摘2006;354(13):1370-7。

    CAS谷歌学者

  32. 32.

    Yien YY, Shi J, Chen C,张JTM, Grillo AS, Shrestha R, Li L, Zhang X, Kafina MD, Kingsley PD,等。Fam210b是一个促红细胞生成素靶点,通过控制线粒体铁输入和铁螯合酶活性来调控红细胞血红素的合成。生物化学杂志。2018;293(51):19797-811。

    CAS文章谷歌学者

  33. 33.

    刘宁B, G,刘Y,苏X,安德森GJ,郑X, Y Chang,郭M,刘Y, Y, et al。5-aza-2脱氧胞苷通过增加原癌基因激活铁吸收和血红素生物合成核本地化和绑定的e-boxes转铁蛋白受体1 (tfr1)和亚铁螯合酶基因(进来)。生物化学杂志。2011;286(43):37196-206。

    CAS文章谷歌学者

  34. 34.

    Crooks DR, Ghosh MC, Haller RG, Tong W-H, Rouault TA。血红素生物合成酶铁螯合酶的翻译后稳定性依赖于铁可用性和完整的铁硫簇组装机制。血。2010;115(4):860 - 9。

    CAS文章谷歌学者

  35. 35.

    Tzourio-Mazoyer N, Landeau B, Papathanassiou D, Crivello F, Etard O, Delcroix N, Mazoyer B, Joliot M.使用mni核磁共振单一受试者大脑的宏观解剖分割自动解剖标记spm的激活。科学杂志。2002;15(1):273 - 89。

    CAS文章谷歌学者

  36. 36.

    姚晓霞,Cong S, Yan J, Risacher SL, Saykin AJ, Moore JH, Shen L.区域成像成因富集分析。生物信息学》2019。

  37. 37.

    姚X,等。脑血流显像表型的靶向遗传分析暗示INPP5D基因。一般人衰老。2019;81:213-21。

    CAS文章谷歌学者

  38. 38.

    Lambert JC, Ibrahimverbaas CA, Harold D, Naj AC, Sims R, Bellenguez C, Jun G, Destefano AL, Bis JC, Beecham GW。对74,046名患者的荟萃分析发现了11个新的阿尔茨海默病易感性位点2013;9(4):1452-8

  39. 39.

    Mitsis GD, Iannetti GD, Smart TS, Tracey I, Wise RG。药理学功能磁共振感兴趣的区域分析:定义标准如何影响推断结果?神经40 (1):121 - 132

  40. 40.

    Srinivas M, Patnaik M。遗传算法中交叉和变异的自适应概率。中国生物医学工程学报。1994;24(4):656-67。https://doi.org/10.1109/21.286385

    文章谷歌学者

下载参考

确认

完整的ADNI确认可于http://adni.loni.usc.edu/wp-content/uploads/how_to_apply/ADNI_Acknowledgement_List.pdf

资金

国家自然科学基金项目(no . 201806680080);国家自然科学基金项目(no . 61773134、no . 61803117);黑龙江省自然科学基金项目(no . YQ2019F003);黑龙江省自然科学基金资助项目(QC2018080);教育部人文社会科学基金资助项目(19YJCZH120);国家自然科学基金资助项目(61901063)。该项目的数据收集和共享由阿尔茨海默氏病神经成像计划(ADNI)(美国国立卫生研究院拨款U01 AG024904)和国防部ADNI(国防部拨款编号W81XWH-12-2-0012)资助。ADNI由国家老龄问题研究所、国家生物医学成像和生物工程研究所资助,并通过以下机构的慷慨捐助:艾伯维,阿尔茨海默病协会;阿尔茨海默病药物发现基金会;Araclon生物技术;BioClinica有限公司;生原体;百时美施贵宝公司;CereSpir有限公司; Eisai Inc.; Elan Pharmaceuticals, Inc.; Eli Lilly and Company; EuroImmun; F. Hoffmann-La Roche Ltd and its affiliated company Genentech, Inc.; Fujirebio; GE Healthcare; IXICO Ltd.; Janssen Alzheimer Immunotherapy Research & Development, LLC.; Johnson & Johnson Pharmaceutical Research & Development LLC.; Lumosity; Lundbeck; Merck & Co., Inc.; Meso Scale Diagnostics, LLC.; NeuroRx Research; Neurotrack Technologies; Novartis Pharmaceuticals Corporation; Pfizer Inc.; Piramal Imaging; Servier; Takeda Pharmaceutical Company; and Transition Therapeutics. The Canadian Institutes of Health Research is providing funds to support ADNI clinical sites in Canada. Private sector contributions are facilitated by the Foundation for the National Institutes of Health (www.fnih.org)。受资助的组织是北加州研究与教育学院,该研究由加州大学圣地亚哥分校的阿尔茨海默氏症合作研究中心协调。ADNI数据由南加州大学神经成像实验室发布。

作者信息

从属关系

作者

贡献

j.l.、S.F.和H.L.领导并指导了这项研究。J.L., W.L., H.L., S.F., H.L.设计了研究并撰写了文章。W.L.进行了数据处理、结果可视化、系统开发、SNP分析和基因分析。f.c.、h.l.、p.b.、y.l.、H.J.和Y.G.提出了脑图像分离与匹配的建议。S.F.和H.L.就ADNI数据、数据预处理、质量控制、GWAS协议和基因分析的基因分型和生物标志物细节提供指导和咨询。所有作者对稿件进行了审阅、评议和审定。

相应的作者

对应于Shiaofen方

道德声明

伦理批准并同意参与

研究程序由所有参与中心的机构审查委员会批准(http://adni.loni.usc.edu/wp-content/uploads/how_to_apply/ADNI_Acknowledgement_List.pdf),并获得所有参与者或其授权代表的书面知情同意。伦理审批获得了各相关机构的机构审查委员会的批准:俄勒冈健康与科学大学;南加州大学;加州大学圣地亚哥分校;密歇根大学;梅奥诊所,罗彻斯特;贝勒医学院;哥伦比亚大学医学中心;圣路易斯华盛顿大学;阿拉巴马大学伯明翰分校; Mount Sinai School of Medicine; Rush University Medical Center; Wien Center; Johns Hopkins University; New York University; Duke University Medical Center; University of Pennsylvania; University of Kentucky; University of Pittsburgh; University of Rochester Medical Center; University of California, Irvine; University of Texas Southwestern Medical School; Emory University; University of Kansas, Medical Center; University of California, Los Angeles; Mayo Clinic, Jacksonville; Indiana University; Yale University School of Medicine; McGill University, Montreal-Jewish General Hospital; Sunnybrook Health Sciences, Ontario; U.B.C.Clinic for AD & Related Disorders; Cognitive Neurology-St. Joseph’s, Ontario; Cleveland Clinic Lou Ruvo Center for Brain Health; Northwestern University; Premiere Research Inst (Palm Beach Neurology); Georgetown University Medical Center; Brigham and Women’s Hospital; Stanford University; Banner Sun Health Research Institute; Boston University; Howard University; Case Western Reserve University; University of California, Davis-Sacramento; Neurological Care of CNY; Parkwood Hospital; University of Wisconsin; University of California, Irvine-BIC; Banner Alzheimer’s Institute; Dent Neurologic Institute; Ohio State University; Albany Medical College; Hartford Hospital, Olin Neuropsychiatry Research Center; Dartmouth-Hitchcock Medical Center; Wake Forest University Health Sciences; Rhode Island Hospital; Butler Hospital; UC San Francisco; Medical University South Carolina; St. Joseph’s Health Care Nathan Kline Institute; University of Iowa College of Medicine; Cornell University; and University of South Florida: USF Health Byrd Alzheimer’s Institute.

同意出版

不适用。

相互竞争的利益

作者不存在实际或潜在的利益冲突,包括与他人或组织的任何财务、个人或其他关系,可能不适当地影响(偏见)我们的工作。

额外的信息

出版商的注意

欧宝体育黑玩家《自然》杂志对已出版的地图和附属机构的管辖权主张保持中立。

补充信息

额外的文件1。

SNP,SNP对或SNP组的Pearson相关性和3168个功能。

权利和权限

开放获取本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。“创作共用公共领域”豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

再版和权限

关于这篇文章

通过十字标记验证货币和真实性

引用这篇文章

李军,刘伟,李洪平。等等。基于基于基于变异的基于变异的遗传效应研究,具有最大的神经肿瘤覆盖率。欧宝娱乐合法吗22日,223(2021)。https://doi.org/10.1186/s12859-021-04145-0

下载引用

关键词

  • 影像遗传学
  • 大脑
  • 体素
  • 单核苷酸多态性
  • GWAS
  • 遗传算法
\