注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Bioinformatics home

 
 
 

日志

 
 

一段简单读取GeneBank的fasta格式数据文件代码  

2009-07-19 12:00:16|  分类: 生物信息编程 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

一段简单读取GeneBank的fasta格式数据文件代码

之前写过一个很复杂的函数来读,感觉笨的要死,

换了个方法,很eazy

# >gi|58347402|gb|CZ179109.1|CZ17
# CCTTCGGCCCTCGCCGTTAAAGTTTGCCCATCCTTTTAATTCGTTGCTCTGCCGTTTAGATGGGTTGAAA
# GCTCGG
open $file,"sequences.fasta";
read($file,$str,10000000);
$sum=0;
while($str=~/>(.+?)\n([^>]+)/sg)  #得到序列
{

 $name=$1;
 $seq=$2;
 chomp($name);
 $seq=~s/\s//g;
 $seq=~s/\n//g;
  print $name;
  print "\n############################################\n";
  print $seq,"\n";
}
close $file;

  评论这张
 
阅读(1049)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017