注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Bioinformatics home

 
 
 

日志

 
 

Tophat使用方法  

2012-05-04 05:02:48|  分类: 生物信息编程 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

tophat 下载地址  http://tophat.cbcb.umd.edu/ 

reference 文件下载地址, http://cufflinks.cbcb.umd.edu/igenomes.html   如果这里没有你做的物种,那么许多文件你只能运行获得了。

what is tophat?

通过RNA-seq 比对到基因组上来确定外显子的剪接和联结的软件。是在运行bowtie软件的基础上运行的。(当输入tophat命令时自动会首先运行bowtie,用户不需要事先运行bowtie)。 使用的系统:Linux 和 OS X.

需要安装的软件包括: tophat, SAM tool,

安装测试

Preparing your reference

1. 一个叫做a Bowtie index for the organism in your RNA-Seq experiment 的东西。装了bowtie的童鞋可以下载pri-built 的index 放到bowtie indexes文件夹中。下载地址:http://bowtie-bio.sourceforge.net/index.shtml 右边的pre-bulit indexes 中。如果下载了

http://cufflinks.cbcb.umd.edu/igenomes.html 里的数据, 里面就有bowtieinexes。

如果你做的物种没有pre-built的index,就需要自己运行一个啦.

2. a fasta file (.fa) for your reference.

有两种方法可以获得这个fa文件:1.)让tophat运行一个给你,然后把那个fa文件从输出文件夹中找出来移到bowtie indexes的文件夹中,这样下次就不需要重新产生了。2).http://cufflinks.cbcb.umd.edu/igenomes.html  下载的数据包里有genome.fa的文件,将它放到bowtie indexes 也可以了。

 

运行tophat

using the tophat junction mapper

Usage: tophat [options]* <index_base> <reads1_1[,...,readsN_1]> [reads1_2,...readsN_2]

tophat [选项/参数] [ewbt格式的reference文件路径] [fq或fa格式的序列(如果是pair-end reads,那么就是_1系列的文件)][fq或fa格式的序列(如果是pair-end reads,那么就是_2系列的文件)]

选项/参数:几个常用的说说

-o 设置输出文件夹的名字 默认的是在当前路径下的 tophat_out

-r pair-end序列必须设置的参数,没有默认值。 是一对序列中间间隔的距离。

-p 线程数,默认是1。多点跑的快。

--library-type 看你的是什么类型的数据。 我的illumina的 ,所以选的是 standard illumina

贴上我的命令 以备参考

tophat -r 200 -p 20 -o /home/tophat_out12 --library-type fr-unstranded /home/bowtie-0.12.7/indexes/hg19 /home/1_sequence.fq /home/2_sequence.fq 

  评论这张
 
阅读(6909)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017