基因组信息学小笔记

来源:互联网 发布:网络直播电视 编辑:程序博客网 时间:2024/05/20 06:08

遗传图:亦称连锁图,基因或DNA标志在染色体上的相对位置与遗传距离。

(与物理图、序列图、转录图一起并称为人类基因组计划绘制的人类基因组四张图)

遗传距离通常以基因或DNA片段在染色体交换过程中的分离频率里摩(cM)来表示。

①cM值越大,两者之间的距离越远

②一般可由遗传重组检测结果推算

 

物理图:标明一些界标(例如:限制酶切位点、基因等)在DNA上的位置,图距以物理长度为单位,例如染色体的带区、核苷酸对数目等。

人类基因组计划(HGP)的研究目标是,构建人的每条染色体的STS图,标记之间相距约100kb。获得一组组DNA片段的克隆,组内两两片段之间有共同的重叠序列;或是获得标记按正确次序排列、相互毗邻的片段,其连续长度超过2000kb,以便把染色体分段进行研究。

 

为什么要进行物理作图?

与遗传图的对比。

①遗传图的分辨率有限                                  基因组规模子代数量

②遗传图的覆盖较低(随机)                    随机交换

③遗传图分子标记有时会出现差错           随机取样

 

物理作图的方法:

①限制性酶切作图

②基于克隆的基因组作图

③染色体细胞图

④STS作图(Sequence-tagged site,STS mapping)

⑤大规模基因组物理图的主流技术

⑥辐射杂交作图(Radiationhybrid,RH mapping)                 X-raybreakage

 

基因组作图

遗传图与物理图的比较:

遗传图——遗传学方法——连锁分析——里摩cM,1%交换率

物理图——分子生物学技术—— 辐射杂交(里镭cR)限制性片段(碱基对bp)克隆作图

 

动态规划算法>> 全局联配工具Clustal Omega

 

从头计算鉴别新基因:

遮蔽重复序列;密码子偏好性检测;探测DNA中的功能性位点(启动子序列特征、外显子内含子剪切识别位点);复合的基因语法分析;搜寻tRNA基因

 

工具:

UCSC Gene Sorter查找相似的基因:

http://genome.ucsc.edu/cgi-bin/hgNear

UCSC In-Silico PCR输入引物,看看能PCR出来什么:

http://genome.ucsc.edu/cgi-bin/hgPcr

UCSC VisiGeneImage Browser显示与某一基因相关的图片

http://www.genome.ucsc.edu/cgi-bin/hgVisiGene

 

启动子:RNA聚合酶特异性识别和结合的DNA序列。 启动子是基因(gene)的一个组成部分,控制基因表达(转录)的起始时间和表达的程度。

转录因子:真核生物转录起始十分复杂,往往需要多种蛋白因子的协助,转录因子与RNA聚合酶Ⅱ形成转录起始复合体,共同参与转录起始的过程。

PASC (PAirwiseSequence Comparison) is a web tool for analysis of pairwise identitydistribution within viral families. The identities are pre-computed for everypair within the families and with distribution plotted in a form of histogramwhere each bar corresponds to an interval of identities.

转录因子数据库:

ENCODE:Encyclopedia of DNA Elements:https://www.encodeproject.org/

TRANSFAC database:http://gene-regulation.com/cgi-bin/pub/databases/transfac/search.cgi

Promoter预测工具:

http://molbiol-tools.ca/Promoters.htm

http://bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html

softberry官网:TSSW、TSSP、TSSG、FPROM都是softberry提供的启动子预测工具

http://www. softberry.com/berry.phtml?topic=index&group=programs&subgroup=promoter

http://linux1.softberry.com/berry.phtml?topic=tssg&group=programs&subgroup=promoter

http://linux1.softberry.com/berry.phtml?topic=fprom&group=programs&subgroup=promoter

http://www.cbs.dtu.dk/services/Promoter/

http://www.fruitfly.org/seq_tools/promoter.html

 

调控元件预测:Cister: Cis-element Cluster Finder Instructions

Cister:http://zlab.bu.edu/~mfrith/cister.shtml

TFSEARCH:http://diyhpl.us/~bryan/irc/protocol-online/protocol-cache/TFSEARCH.html

比较基因组学:

可视化网站:https://ecrbrowser.dcode.org/

 

基因组规模的增大和新基因的产生:

基因组复制(WholeGenome Duplication)(多倍体polyploidy)

转座子元件(TransposableElement)

基因复制(GeneDuplication)重组(Recombination)逆转录转座子(Retrotransposition)

 

VISTA序列比对工具 :http://genome.lbl.gov/vista/index.shtml

CoGe :https://genomevolution.org/CoGe/

DCODE:https://www.dcode.org/

http://paup.csit.fsu.edu/

算法原理

Distance:neighbor-joining、UPGMA

Evolution:Maximum parsimony、Maximum likelihood

 

RNA相关数据库:

RNAdb(http://research.imb.uq.edu.au/RNAdb)打不开

Noncoding RNAdatabase(http://biobases.ibch.poznan.pl/ncRNA/)

BiomedicalDatabases : RNA Databases(http://www.science.co.il/biomedical/databases/RNA-databases.php)

EMBL-EBI:RAM(http://rfam.xfam.org/)

The RNA Institute(http://mods.rna.albany.edu/)

miRBase(http://www.mirbase.org/)

 

RNA结构预测工具:

RNAStructure

OligoWalk

tRNAscan-SE

RNAfold WebServer(http://nhjy.hzau.edu.cn/kech/swxxx/jakj/dianzi/Bioinf4/miRNA/miRNA1.htm):最小自由能、热力学稳定、重心结构

miRNA靶标预测RNA22:(https://cm.jefferson.edu/rna22v2/)https://cm.jefferson.edu/rna22/Interactive/

密码子优化

Jcat:http://www.jcat.de/

OPTIMIZER:http://genomes.urv.cat/OPTIMIZER/

siRNA设计:http://www.imtech.res.in/raghava/desirm/index.html

RNA相关计算工具集合:http://www.rna.uni-jena.de/en/the-rna-world-website/

 

肿瘤相关数据库:

dbVar:基因组结构变异数据库(插入、缺失等),≧50种核酸         https://www.ncbi.nlm.nih.gov/dbvar

dbGap:基因型和表型数据库     https://www.ncbi.nlm.nih.gov/gap

ICGC:https://icgc.org/

TCGA:https://cancergenome.nih.gov/

CGAP:https://cgap.nci.nih.gov/

CGP:http://cgp.iiarjournals.org/

COSMIC:http://cancer.sanger.ac.uk/cosmic

 

原创粉丝点击