什么是变异检出
遗传变异是一种可遗传给后代的变异,由生物体遗传物质的改变引起。正是这种变异导致生物体在不同水平上表现出遗传多样性。遗传多样性是人类社会和植物生存和发展的物质基础。遗传变异的类型有很多,从肉眼可见的染色体倒位到单核苷酸突变。随着基因组学的发展,遗传变异信息变得更加全面,包括苏格兰民族党、InDel、SV、CNV和转座子突变等。
变异检出是指利用高通量测序技术对一个物种的个体或群体的整个基因组进行测序和分析,以获得大量的遗传变异信息,例如单核苷酸多态性(SNP)、插入和删除位点(InDel)和结构变异位点(SV)、拷贝数变异(CNV)等信息。变异检出可以为后续的功能基因精细定位提供最基本、最全面的数据基础,快速、准确、高效地分析基因组之间的差异,分析全基因组的每个碱基,获得最广泛的分子标记。
变异检出的优势和特点
- 丰富性:深入分析遗传变异的各个方面,包括SNP、InDel、SV、SNV、新基因等。
- 灵活性:有无参考均适用
- 准确性:可根据不同材料应用不同的测序方法
变异检出工作流程

测序技术流程

服务规格
样品要求
|
|
测序
|
|
| 生物信息学分析 我们提供定制的生物信息学分析,包括:
交付
|
参考文献:
- Jansen S,Aigner B,Pausch H,等。通过在低到中等覆盖率下对关键动物进行重新测序来评估牛种群的基因组变异[J]。BMC基因组学,2013,14(1):1。
- 郑,郭,何,等.甜高粱和高粱全基因组遗传变异模式[J]。基因组生物学,2011,12(11):287-302。
结构变异(SV)对基因结构和基因表达的影响
在2020年一篇关于“白菜”的在线出版物中1.,对三种白菜类型之间的变异进行了比较分析,包括基因间的存在/缺失变异(PAV)、基因组内的结构变异(SV)和单核苷酸多态性(SNP),揭示了重要的见解。具体而言,在三种形态类型中观察到叶形基因(例如,来自GARP转录因子主页族的KAN)内SV的差异以及开花相关基因(例如,MAF4、SVP)的抑制作用(如图1左侧所示)。这些发现对于揭示白菜及相关蔬菜作物中器官形态发生和开花的分子机制以及遗传改良具有至关重要的意义。
图1:白菜基因组中的PAV和特异性SV1.
为了验证SV分析的适用性并探索其在群体进化研究中的应用,2020年一篇关于“番茄”的在线出版物2.进行了一项调查。研究人员基于来自短读长测序数据的800多种材料的SNP获得了系统的进化树(图2A)。随后,他们从7个谱系中选择了一组代表性的100种材料,并收集了长读长测序数据,以基于SV数据构建树状图(图2B)。
结果表明,所选材料分布在其已知的分类群内,与基于SNP的分类一致。这证明了SV适用于遗传群体分析。
图2:番茄系统进化树2.
在2020年一篇关于“水稻”的在线出版物中3.,研究人员基于SNP数据(图3A)和SV数据(图3B)构建了群体结构图。SNP分析显示,该群体大致分为六组,粳稻和籼稻品种之间有明显的区别。有趣的是,SV分析得出了高度一致的结果,进一步支持了SNP分析中观察到的差异。
图3:水稻的遗传结构3.
群体SV突变频率谱
为了研究有害变异的显著影响,2020年关于水稻的出版物3.计算了不同群体中非编码位点的频率谱(图4-A、B、C)。每个SFS包括五种SV类型(DUP、DEL、TRA、MEI和INV)和两种SNP类型(Syn、Nsyn),并揭示了三个显著特征:
不同群体之间存在显著差异,这与驯化瓶颈期间遗传漂变增强和交配系统变化一致。
固定SV的比例低于固定同义SNP和非同义SNP的比例。SV在基因组中的频率较低,突变后更容易被清除,表明SV具有更高的危害可能性。
INV事件表现出最极端的SFS,在每个组中,超过90%的INV事件在三个或更少的个体中被发现,这意味着INV事件在进化过程中可能受到强烈的选择。
研究人员对SV和SNP在染色体上的位置进行了统计分析,测试结果表明染色体窗口中SV和SNP的多样性之间存在显著相关性(图4-D)。这表明SV提供的群体遗传信息与SNP基本一致。
图4:SV频率谱3.
SV的连锁不平衡分析
在[水稻]研究中3.,使用SNP、SV和SNP+SV数据计算了三个不同群体组的LD(连锁不平衡)。由于其潜在的有害影响,SV通常表现出比SNP更低的群体频率,并且可能随着物理距离的增加而经历更快的LD衰减(图5)。SNP数据显示,在大约100 kb内,粳稻SNP的r2保持在0.2左右,而籼稻则约为0.1。在相同的物理距离内,野生稻的r2小于0.05。然而,在所有���体组中,SV的r2值均低于SNP,仅在非常短的距离内(<15 kb)值超过0.1。
图5:连锁不平衡分析3.
群体驯化研究
在对水稻进行的研究中3.,对单核苷酸多态性(SNP)和结构变异(SV)之间的基因组差异进行评估后发现了一个显著的区别。研究观察到,与SV相比,SNP的平均FST估计值明显更高。这一发现表明,与SNP相比,SV通常表现出较低的群体频率。
将这些数据与已确定的驯化和改良基因相结合后,研究再次证实了这些基因在前1%和10%的FST区间内显著富集。因此,这为与生理过程、形态特征和食品质量相关的功能基因提供了宝贵的见解(图3)。
图6:与驯化相关的SV特征3.
全基因组关联��析
在2020年关于[油菜]的出版物中4.,使用从八个油菜品种中鉴定出的PAV进行了GWAS(全基因组关联研究)。该分析揭示了PAV与角果长度、种子重量和开花时间等性状之间的因果关系。有趣的是,这些重要的发现在SNP-GWAS结果中被忽略了(图7)。
同样,在2021年关于[桃]的出版物中5.,观察到与果实早熟、核周果皮颜色、果实形状和扁平形状形成等性状相关的候选SV(图8)。
油菜PAV_GWAS分析结果4.
图8:桃SV_GWAS分析结果5.
参考文献:
- 李平,苏T,赵X,等。非结球白菜基因组组装及与结球大白菜和油籽黄菜基因组的比较。 植物生物技术杂志, 2020.
- Alonge M,Wang X,Benoit M,等。广泛的结构变异对番茄基因表达和作物改良的主要影响。 细胞, 2020.
- Yixuan K,Yi L,Tuomas T,等。亚洲水稻(Oryza sativa)驯化结构变异的进化基因组学。 分子生物学与进化, 2020.
- Song J,Guan Z,Hu J,等。八个优质基因组揭示了甘蓝型油菜的泛基因组结构和生态型分化。 植物, 2020.
- Jiantao G,Yaoguang X,Yang Y,等。桃基因组结构变异分析揭示了种群动态和1.67Mb的果形因果倒置。 基因组生物学, 2021.