水稻基因命名

来源:互联网 发布:历年固定资产投资数据 编辑:程序博客网 时间:2024/03/28 22:08
RGAP:基因命名法 
 
在访问水稻基因组注解计划的FTP地址或网页上的模拟分子数据时,会见到其内部使用的术语,如TU和基因模块。这篇文章旨在解释此计划的命名法,并且将其与生物学家普遍使用的命名法联系起来。 
转录单位: 
一个转录单位相当于一个基因或模拟分子上的一个基因座。转录单元以一种精确的命名规则储存在数据库中,合适名字如:x.tyyyyy 。其中,x指的是BAC或模拟分子的收录编号,yyyyy是转录单位的特异标识符。 
位点标识符: 
对于最终的用户,上面命名规则介绍的复杂在于转录单位的合适名字可在版本之间转换。为了避免这个问题,基因的位点标识符已经在模拟分子的这个版本中被实施了。和拟南芥基因组命名使用的约定一样,对更大的水稻基因组也只有较小的改变。每个细胞核基因被标记为LOC_OsXXg#####,其中LOC_Os代表水稻的座点,XX表示染色体编号01-12,g代表基因,5个#####表示基因在染色体上的顺序。LOC_Osp#g#####是用于质体基因,对于线粒体基因是使用LOC_Osm#g#####。基因(基因座)的编号是沿着染色体或细胞器的基因组,按顺序每隔10个编号的,这是考虑到了将来新基因座的插入。在编号系统中提供了足够的空间用于物理间隔,在序列上允许已经在物理间隔上填满的新基因的插入。为了促进基因的新位点标识符在以前两种表示方式中的整合,我们已经开发了一个版本转换器,允许使用者容易地找到以前的基因和模块所对应的新位点标识符,这些以前的基因和模块是根据合适名字被标志的 
基因模块: 
一个基因模块是代表一个转录单位的mRNA转录物,因此它包含着转录本的特征信息,如内含子和外显子的边界、剪切位点和非翻译序列等。由于mRNA转录物的可变剪切,一个转录单位可以产生不止一个基因模块。基因模块在数据库中有唯一的合适名字,并且它们和相应的转录单位也被连接起来。合适名字采取x.myyyyy的形式,其中x代表BAC或者模拟分子收录ID,yyyyy是指基因模块独特的标识符。 
其中Pseudomolecule:模拟分子;feat_name:合适名字。感觉还是不对,但是找不到合适的词来表示了! 
RAP-DB:水稻基因命名法 
 
自从国际水稻基因组测序计划完成了水稻日本晴的基因组测序,其希望以此解密基因组的所有基因区。系统的基因座标识符被指定到IRGSP基因组汇编的RAP中。一个ID(OsXXg#######)包括物种名(Os代表水稻),一个表示染色体的两位数,标识符的类型(g表示基因)和一个表示在染色体上相应顺序的七位数。这种命名是由基因标记命












名与联合委员会在第一、二届水稻注解计划大会上提出的。通过集中讨论基础上的改良,最终被IRGSP/RAP认定。水稻标识符的RAP注解以AP008207-AP009218 的登录号被递交至DDBJ/EMBL/Genbank,并且在RefSeq中使用。水稻的代码也在UniProtKB/Swiss-Prot 中作为位点标识符使用。
原创粉丝点击