蛋白质多序列CD-HIT处理
来源:互联网 发布:软件工程项目实例航空 编辑:程序博客网 时间:2024/04/28 23:02
流程:
1:蛋白质去除标签,筛选为单一标号(GI、ACESSION)
2:登录批量下载蛋白质地址https://www.ncbi.nlm.nih.gov/sites/batchentrez?db=Protein,上传文件,点击RETRIEVE按钮开始匹配
3:点击右上角SEND TO:选项进行下载,注意选择保存格式(保存为FASTA格式)
4:打开CD-HIT官网http://weizhongli-lab.org/cd-hit/,选择网页服务,根据需要选择CD-HIT类型
5:选择底端CD-HIT UCSC,根据需求选择,设置阈值,提交
6:页面自动跳转,可手动刷新
7:建议先预览文件,避免结果错误
8:下载名称为xxxx,fasta.1文件,即处理后文件
9:将文件重命名为xxxxx.fasta,即为正常可打开的fasta文件
阅读全文
0 0
- 蛋白质多序列CD-HIT处理
- 数据处理(蛋白质序列)
- 一些关于蛋白质序列分类的总结
- Moderate 猜测序列hit或是pseudo-hit @CareerCup
- 蛋白质序列序列特征段神经网络训练集的提取
- 灰指甲患者需多补充蛋白质
- 目录处理命令cd
- perl从文件中读取数据,然后输出,附一个蛋白质序列的读取
- perl应用:DNA序列翻译为蛋白质的完整程序(中)
- Java 实现PDB数据库中蛋白质部分序列与Uniport数据库中相应的全长序列的最优匹配
- perl应用:DNA序列翻译(下):从fasta格式中读取序列,然后输出蛋白质序列,以及fasta格式的介绍
- ..CD..
- CD
- cd
- cd
- cd
- cd
- cd
- C++随记(十)--类与对象(1)
- 实现AJAX的基本步骤
- Java并发编程的艺术
- tensorflow高阶API
- java 关于正则表达式的基本知识
- 蛋白质多序列CD-HIT处理
- 3929_创世纪_拓扑排序+搜索
- 使用原生JS写五子棋
- 基于ARM--s3c2451的函数封装---GPIO口的封装
- 安卓JDK环境变量配置
- HDU 1075 What Are You Talking About (字典树)
- CCF-GAIR人工智能峰会感悟
- Android手势
- WEB-INF