课题第一天

来源：互联网发布：开淘宝网店怎么找货源编辑：程序博客网时间：2024/05/18 00:11

1. 得到了197个cmv的genbank文件，是一个合并的文件，要使用yanbo的gb2fas.py来进行各个cds的提取，首先需要将这些genbank文件进行拆分。

2. 自己编写了一个简单的biopython脚本来拆分，用这些genbank的描述来对拆分的文件进行命名，结果发现有多个描述完全一样，所以造成了同名文件覆盖，总是缺少一些文件。

3. 同名的文件进行了重新命名，在文件名的结果加上了duplicate关键字，以示区别。通过diff工具进行了鉴别，发现这些同名的文件其内容并不一样，所以都保留了。

4. 在用每个genbank文件的描述来命名时，发现带有"/"的描述不能用来命名，所以将这些"/"都换成了"-"。

0 0