课题第一天

来源:互联网 发布:开淘宝网店怎么找货源 编辑:程序博客网 时间:2024/05/18 00:11

1. 得到了197个cmv的genbank文件,是一个合并的文件,要使用yanbo的gb2fas.py来进行各个cds的提取,首先需要将这些genbank文件进行拆分。


2. 自己编写了一个简单的biopython脚本来拆分,用这些genbank的描述来对拆分的文件进行命名,结果发现有多个描述完全一样,所以造成了同名文件覆盖,总是缺少一些文件。


3. 同名的文件进行了重新命名,在文件名的结果加上了duplicate关键字,以示区别。通过diff工具进行了鉴别,发现这些同名的文件其内容并不一样,所以都保留了。


4. 在用每个genbank文件的描述来命名时,发现带有"/"的描述不能用来命名,所以将这些"/"都换成了"-"。

0 0