9月21号Python生物信息学数据管理

来源:互联网 发布:可靠性分析软件有哪些 编辑:程序博客网 时间:2024/05/22 05:00

第四章,基本没怎么看得懂.....

1.line.strip()表示去掉字符串前后的空格和换行符。

2,list:len()函数可以获得列表元素个数;索引是从0开始;负数表示倒过来索引。list.append()表从末尾添加元素。list.insert(1,‘XXX’)表插入到指定位置。删除list末尾元素用pop()方法,删除指定元素用pop(i)。把某个元素换成别的元素,直接赋值给对应的索引位置。

3,TUPLES:元组。

不可变有序对象序列圆括号表示,如:(a,b,c),没有append,insert等经典方法。定义一个元素的元组,元素后面要加逗号。

4,split()函数将字符串分割成序列。如不提供分隔符,程序会把空格作为分隔符。

5,for循环用在打开文件时,是以文件中行(转行符)为一行。

6,例4.3

genbank_file = open("genbank.txt")output_file = open("AY810830.txt","w")flag = False  #不懂for line in genbank_file:    if line[0:9] == 'ACCESSION':        accession = line.split()[1].strip()        output_file.write('>' + accession + '\n')    if line[0:6] == 'ORIGIN':         flag = True    #这边加标志变量没看懂    elif flag:        fields = line.split()        if fields != []:            seq = ''.join(fields[1:])            output_file.write(seq.upper() + '\n')            print(seq)            genbank_file.close()output_file.close()
从第二个if后面就看不大明白了。

例4.4 也是,这一章花了很多时间,但是一些细节的处理不是很明白,所以好多都不懂。

先往后面看。

原创粉丝点击