资源类型:
申请人:
云南省第一人民医院
;
上海亿康医学检验所有限公司
;
当前专利权人:
云南省第一人民医院
;
上海亿康医学检验所有限公司
;
申请号:
申请日期:
授权年份:
公开号:
公开日:
法律状态:
主分类号:
分类号:
摘要:
本发明公开了一种定位Alpha地贫SEA突变链的方法及装置,该方法包括:根据采集的全基因组芯片检测数据,确定每个家系成员的Alpha地贫SEA突变链和正常链;计算每个SNP位点在所有Alpha地贫SEA突变链和所有正常链的碱基使用频数差异的P值;根据P值,筛选SNP位点,以形成Alpha地贫SEA突变链的祖先单体型;根据祖先单体型的SNP位点的多种碱基的占比,形成相似性矩阵;在获得待测样品后,根据相似性矩阵,计算待测样品的每条链的单体型与祖先单体型的相似性数值,以从待测样品的两条链中确定Alpha地贫SEA突变链。本发明能无需家系连锁分析鉴定出Alpha地贫SEA突变链。
主权项:
1.一种定位Alpha地贫SEA突变链的方法,其特征在于: S1,采集含有Alpha地贫SEA突变的多个家系的家系成员的全基因组芯片检测数据,利用单体型定相的方法,构建每个家系的 Alpha 地贫 SEA 突变所在染色体的单体型,并通过家系连锁分析确定每个家系成员的Alpha 地贫 SEA 突变链和正常链; S2, 计算每个SNP位点在所有Alpha地贫SEA突变链和所有正常链的碱基使用频数差异的P值; 所述P值按照下述方法获得: S21, 汇总所有Alpha地贫SEA突变链,得到Alpha地贫SEA突变链集合,统计每个SNP位点在Alpha地贫SEA突变链集合中的碱基使用频数P1; S22, 汇总所有正常链,得到正常链集合,统计每个SNP位点在正常链集合中的碱基使用频数P2; S23, 对每个SNP位点,计算Alpha地贫SEA突变链集合和正常链集合的碱基使用频数差异的P值,P=| P1-P2| S3,根据S2中的P值筛选SNP位点,并根据筛选出的SNP位点形成Alpha地贫SEA突变链的祖先单体型; S4, 形成相似性矩阵, 根据所有Alpha地贫SEA突变链中祖先单体型的SNP位点的多种碱基的占比,形成相似性矩阵; S5, 在获得待测样品后,根据相似性矩阵,计算待测样品的每条链的单体型与祖先单体型的相似性数值; 所述待测样品的单体型与祖先单体型的相似性计算方法如下: S51,根据S3方法获得待测样品每条链的单体型的所有SNP位点,所有SNP位点中有效SNP位点数大于等于6; S52,获得该条链的单体型的有效SNP位点上的碱基在相似性矩阵中对应SNP位点的对应碱基的占比值,将所述占比值作为每个SNP位点的相似性数值; S53,将该条链的单体型有效SNP位点的相似性数值的总和与所有SNP位点数的比值,作为该条链的单体型与祖先单体型的相似性数值; S6,根据每条链对应的相似性数值,从待测样品的两条链中确定Alpha地贫SEA突变链;若待测样品的一条链对应的相似度数值大于第一阈值,且该条链与待测样品的另一条链的相似度数值的差值大于第二阈值,确定该条链为Alpha地贫SEA突变链; 所述第一阈值为所有 Alpha地贫 SEA 突变链对应的相似性数值的平均值; 所述第二阈值为所有正常链对应的相似性数值的平均值与第一阈值的差值。