HGVS命名法
随着基因检测技术的不断发展和在临床实践中的广泛应用,越来越多与疾病相关的基因和变异被发现。然而,在过去,这些变异的命名方式千差万别。为了实现对变异的注释自动化、变异文献检索的全面性以及变异描述的标准化,建立统一且通用的变异命名规则变得非常重要。为此,人类基因组变异协会(Human Genome Variation Society,HGVS)于2000年提出了一套统一且 通用的序列变异命名系统,该系统已被国际广泛采用。
通常,HGVS命名由三个部分组成:参考序列、基因水平变化和蛋白水平变化(如图1所示)。下面将逐一介绍各部分的命名规则。
图1. 基因变异HGVS命名
一、参考序列
参考序列是用作比较和分析其他个体基因组序列的标准基因组序列。参考序列命名通常包含3部分:参考序列类型+编号+版本。比如NM_005228.5,其中“NM_”代表参考序列类型,“005228”代表参考序列编号,“.5”代表版本号。根据参考序列类型的不同,分别用不同的字母表示,具体如下:
- NC_:基于染色体位置的参考序列;
- NG_:基于基因或基因组位置的参考序列;
- LRG_:基于基因座位置的参考序列;
- NM_:基于mRNA位置的参考序列;
- NR_:基于非编码RNA位置的参考序列;
- NP_:基于蛋白质氨基酸排列位置的参考序列。
二、基因水平变化
指对变异在基因水平的位置及类型进行描述,变异的描述通常包括3部分:前缀+基因位置+变异类型。例如:c.4375C>T,其中“c.”是前缀,代表参考序列类型;“4375”是位置,代表变异发生的位置;而“C>T”代表变异的类型;下面分别从前缀、位置、变异类型进行介绍:
2.1 前缀
前缀表示参考序列的类型,具体如下:
- “g.”:代表基因组参考序列;
- “c.”:代表编码DNA参考序列;
- “n.”:代表非编码DNA参考序列;
- “r.”:代表RNA参考序列;
- “p.”:代表蛋白质参考序列;
- “m.”:代表线粒体参考序列;
- “o.”:代表环状基因组DNA参考序列;
2.2 变异位置
指变异发生的位置,不同类型参考序列的描述有所不同,以下以临床上常用的编码DNA参考序列(“c.”)为例介绍。
2.2.1 在编码区(CDS)发生的变异定位(如图2绿色 )
从起始密码子(ATG)的第一个碱基A为起点,以终止密码子(TGA,TAG,TAA)的最后一个碱基为终点进行计数,如“c.1、c.2、c.3。。。。。。c.26、c.27”。
2.2.2 在内含子区(Intron)发生的变异定位(如图2黄色 )
内含子区变异的定位是根据相邻外显子的位置进行编号。
- 变异靠近内含子的5'端,则在上游外显子最后一位碱基编号的基础上,用“+数字”号表示,如“c.14+1、c.14+2。。。”;
- 变异靠近内含子的3'端,则在下游外显子第一位碱基编号的基础上,用“-数字”号表示,如“c.15-1、c.15-2。。。”;
2.2.3 在非编码区(UTR区)发生的变异位点(如图2蓝色 )
- 变异位于编码序列之前(5’UTR区),用“-数字”表示,如“c. -1,c. -2,c. -3。。。”;
- 变异位于编码序列之后(3’UTR区),用“*数字”表示,如“c. *1,c. *2,c. *3。。。”;
图2.基因水平不同区域变异位置的描述
2.3 常见变异类型
图3.常见变异类型示例
三、蛋白水平变化
指对变异在氨基酸水平的位置及类型进行描述,变异的描述通常包括3部分:前缀+变异氨基酸位置+变异类型。根据变异类型的不同,变异描述有所不同:
四、变异命名的优先原则
4.1 3’规则
当一种基因变异的位置可以描述成多个位置时, 3'原则,即使用靠近3'端位置的核苷酸变化编号。例如:“ATCTAGGGACAT”变为“ATCTAGGACAT”;应该描述为c.8del,而不是c.6del或c.7del;
4.2 变异优先级
为了更好地理解和组织基因变异的信息,当一种变异可以描述成多种变异类型时,须按照以下优先级顺序描述:
替换>缺失>倒位>重复>转换>插入
五、顺反式变异的命名
在顺反式变异命名中,用“[]”来代表等位基因,用“;”来分割两个变异。如g.[257A>G;289G>C]代表顺式变异,而g.[257A>G];[289G>C]代表反式变异。
请关注微信公众号,更多精彩内容实时更新中
本网站发布所有原创内容,版权归属尖端生物及相关版权方,内容仅供学术交流,如有侵权请联系删除。未经授权的转载是侵权行为,版权方保留追究法律责任的权利。投稿,转载或版权问题,请联系:submit@advanced-biotech.cn;商务合作请联系:cc@advanced-biotech.cn
- 2024-08-15
- 2024-08-13
- 2024-08-05
- 2024-07-24
- 2024-07-23
- 2024-07-22
- 2024-07-18
- 2024-07-10