注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Bioinformatics home

 
 
 

日志

 
 

remove varied splice protein from protein data of arabidopsis and oryza sativa  

2010-07-10 02:21:25|  分类: 生物信息编程 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
use FL;
my %hash;
my $fileName=shift;
my $outfileName=shift;
open $file, "$fileName";
open $out,">$outfileName";
read($file, $content,900000000);
while($content=~/>(.+?)\n([^>]+)/sg)  
{
   $title=FL::trim($1);
   $seq=FL::cleanSeq($2);
   #>AT1G50920.1 | Symbols:  | GTP-binding protein-related | chr1:18870555-18872570 FORWARD
   #>LOC_Os01g01010.1|13101.m00001|protein TBC domain containing protein, expressed
   if($title=~/^(.+?)\./)
   {
     $name=$1;
  if(not exists($hash{$name}))
  {
     print $out ">$title\n";
     print $out "$seq\n";
  }
  $hash{$name}=$name; 
   } 
}
close $file,$out;
  评论这张
 
阅读(568)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017