注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Bioinformatics home

 
 
 

日志

 
 

三种分析蛋白结构域(Domains)的方法  

2009-09-24 23:55:50|  分类: 生物信息编程 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

三种分析蛋白结构域(Domains)的方法

1,SMART入门,蛋白结构和功能分析

SMART介绍

SMART (a Simple Modular Architecture Research Tool) allows the identification and annotation of genetically mobile domains and the analysis of domain architectures. More than 500 domain families found in signalling, extracellular and chromatin-associated proteins are detectable. These domains are extensively annotated with respect to phyletic distributions, functional class, tertiary structures and functionally important residues. Each domain found in a non-redundant protein database as well as search parameters and taxonomic information are stored in a relational database system. User interfaces to this database allow searches for proteins containing specific combinations of domains in defined taxa. For all the details, please refer to the publications on SMART.

SMART(http://smart.embl-heidelberg.de/),可以说是蛋白结构预测和功能分析的工具集合。简单点说,就是集合了一些工具,可以预测蛋白的一些二级结构。如跨膜区(Transmembrane segments),复合螺旋区(coiled coil regions),信号肽(Signal peptides),蛋白结构域(PFAM domains)等。

SMART前该知道的

1,SMART有两种不同的模式:normal 或genomic

主要是用的数据库不一样。Normal SMART, 用的数据库 Swiss-Prot, SP-TrEMBL 和 stable Ensembl proteomes。Genomic SMART, 用全基因组序列。详细列表:http://smart.embl-heidelberg.de/smart/list_genomes.pl

三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon

2,一些名词解释

http://smart.embl-heidelberg.de/help/smart_glossary.shtml

SMART进行时

可以直接用各个数据库蛋白的ID。如Uniprot/Ensembl  ID / Accession number (ACC)。或是直接蛋白序列。运行SMART也可选择signal peptides、PFAM domains等的预测,勾上就是。看下图

三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon

SMART结果

运行后的结果用图表表示。其实运行后的结果都有明确的解释。详细请看下面。

三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon

不同结构的预测由不同的工具完成。如果你想了解更多,可访问去该工具的网站。

  • 跨膜区(Transmembrane segments), TMHMM2 program 。(用 三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon表示 )
  • 复合螺旋区(coiled coil regions),Coils2 program。( 用三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon 表示)
  • 信号肽(Signal peptides),SignalP program。( 三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon )
  • 蛋白结构域(PFAM),PFAM
等等。。不止这几个的。其它不一一列举。因为都是详细的说明。点击图标链接,就能看到该区域的序列,或是一些详细的描述。如上图的跨膜区,点击进去就是该跨膜区从开始到结束的序列。

三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon

另外,不一定所有预测的区域都会用在图示里看到。一般SMART的显示顺序是SMART > PFAM > PROSPERO repeats > Signal peptide > Transmembrane > Coiled coil > Unstructured regions > Low complexity。另外其它不用图解显示的区域,在底下的表格也有详细说明。

2,Sanger的Pfam数据库

网址:http://pfam.sanger.ac.uk/

目前的版本:Pfam 23.0 (July 2008, 10340 families)

The Pfam database is a large collection of protein families, each represented by multiple sequence alignments and hidden Markov models (HMMs).

三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon

三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon

3,NCBI的CDD(Conserved Domain Database)数据库

网址:http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi

Proteins often contain several modules or domains, each with a distinct evolutionary origin and function. NCBI’s Conserved Domain Database is a collection of multiple sequence alignments for ancient domains and full-length proteins.

三种分析蛋白结构域(Domains)的方法 - xiaofeng1982 - Leon

最后,自己试验一下。上面两个图的结果的数据是用了NP_776850的蛋白序列。你也可以拿这个序列来运行一下看看。

  评论这张
 
阅读(9242)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017