RNA的.fasta数据转换为数字数据
来源:互联网 发布:数据大魔王 编辑:程序博客网 时间:2024/05/22 06:35
特征转换:.fasta->.numerical
将.fasta格式的数据转换为数字格式的数据
- 特征转换fasta-numerical
- fasta格式1
- RNA_m5c数据集
- 手动将fasta数据集转换为csv格式
- 使用Anaconda_Spyder_python实现数据转换
.fasta格式1
在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。— [百度百科]
RNA_m5c数据集
Supporting Information S1. The benchmark dataset consists of a positive dataset and a negative dataset. The former contains 120 true m5C site containing sequences with the m5C site in the center, while the latter contains 120 false m5C site containing sequences. Each of these segments is 41-bp long.
- m5c_P.fasta
- I. 120 true m5C site containing sequences
P_1
CGCCUCCCACGCGGGAGACCCGGGUUCAAUUCCCGGCCAAU
P_2
CCGGGUUCAAUUCCCGGCCACUGCACGUGGUUGUUUUUCAC
P_3
GGCCGUGGGUGUGUAGAGGCCUUGGUGGUGCAGUGGUAGAA - m5c_N.fasta
- II. 120 false m5C site containing sequences
N_1
GGGAGUGGGAACAGGAUUUGCAAGACUCCUAGUACCUAAAU
N_2
GAAAUGGCCUCAUUUGAUAACUAGUAGGUUUUACACAGUGU
N_3
GGGCAGCCUCCUUCUUGUCUCUGUUGUUGAGGAGUGGAAUG
手动将.fasta数据集转换为.csv格式
只保留.fasta数据集中的RNA序列,并且添加标签“serial”,方便进行下一步数据转换,生成m5c_N.csv和m5c_P.csv两个文件
使用Anaconda_Spyder_python实现数据转换
import pandas as pdimport csvm5c_N_data=pd.read_csv('.\\m5c_N.csv')m5c_P_data=pd.read_csv('.\\m5c_P.csv')csvfile=file('.\\data.csv','wb')writer=csv.writer(csvfile)data=[]for i in range(120): temp=[] for j in range(41): if m5c_N_data['serial'][i][j]=='A': temp.append(0) elif m5c_N_data['serial'][i][j]=='C': temp.append(1) elif m5c_N_data['serial'][i][j]=='G': temp.append(2) else: temp.append(3) temp.append(0) data.append(temp)for i in range(120): temp=[] for j in range(41): if m5c_P_data['serial'][i][j]=='A': temp.append(0) elif m5c_P_data['serial'][i][j]=='C': temp.append(1) elif m5c_P_data['serial'][i][j]=='G': temp.append(2) else: temp.append(3) temp.append(1) data.append(temp)writer.writerows(data)csvfile.close()
- http://baike.baidu.com/item/fasta%E6%A0%BC%E5%BC%8F ↩
0 0
- RNA的.fasta数据转换为数字数据
- 关于RNA-seq数据集的小结
- RNA-Seq数据分析
- Rosalind-DNA转换为RNA
- C# 控制台输入输出非字符串类型数据的方法[进制数字转换为八进制数字]
- NGS项目一:RNA-Seq数据的Workflow
- 将整形数据转换为反转数字字符串输出
- RNA-seq数据处理流程(以胶质瘤数据为例)
- RNA-Seq数据去接头(Adapter)
- 格式化的数据转换为图表
- 表单的数据转换为json对象
- Excel表格的数据转换为代码中的结构数据
- Java读取数据库的数据并转换为json数据
- 并行数据转换为串行数据的转换器
- python将mysql数据库的数据转换为json数据
- GridView表格字段显示不同数据库表的数据(如数字转换为对应的文字显示【不同数据库】)
- php 数组转换为xml数据,已针对数组键值为数字进行处理
- 基本数据型态转换成 String,String 转换成 数字的基本数据型态
- leetcode 36(后续继续更新)
- Ubuntu16.04字符界面ifconfig命令无网络接口ens33的解决方法
- C++中如何定义动态数组
- 刘汝佳《算法竞赛入门经典(第二版)》习题(二)
- MySQL
- RNA的.fasta数据转换为数字数据
- 对象类型转换
- 关于 redis、memcache、mongoDB 的对比
- 基于mysql数据库的Hibernate3的环境搭建
- linux 3.18 -- iic,input,misc,三轴加速度设备驱动(三)
- Python之创建tuple
- HTTPweb服务器——HTTP基本知识
- 【转】使用SYSTEMINFO类获取UNITY3D运行设备的各类信息(CPU类型,显卡类型等)
- Codeforces-798C-Mike and gcd problem(贪心+数论)