生物信息学教学实习

蛋白质序列分析

一、          教学实习的目的

1.          掌握蛋白质序列的基本特性的分析方法

2.          掌握蛋白质序列一维序列、二级结构分析方法

3.          熟悉蛋白质结构数据库(PDB)的检索方法;

4.          掌握蛋白质序列三级结构的展示、标注方法;

5.          掌握基于GO数据库,进行蛋白质功能分类的方法;

6.          掌握基于KEGG数据库,进行蛋白质pathway定位的方法

二、          教学实习内容

  1. 蛋白质基本特性分析:用Protparam程序(http://web.expasy.org/protparam/ ),对如下任一蛋白质(P02754,P63326,AAM91227)的氨基酸序列的基本特性进行分析,包括氨基酸组成、分子量、等电点(PI)、疏水性等;
  2. SignaIPhttp://www.cbs.dtu.dk/services/SignalP/程序,对上述蛋白质进行信号肽预测分析;
  3. Tmpred(TMpred - Prediction of Transmembrane Regions and Orientation)程序http://www.ch.embnet.org/software/TMPRED_form.html,预测上述蛋白质的跨膜区;
  4. 蛋白质一维序列分析:用BLAST程序搜寻上述蛋白质的相似蛋白序列;用clustalw(http://www.ebi.ac.uk/Tools/msa/clustalw2/ )对这些相似蛋白序列进行多重比对分析,寻找其中共同的保守区段;
  5. 蛋白质二级结构分析:用interproscan程序(http://www.ebi.ac.uk/Tools/pfa/iprscan/ )预测上述蛋白质序列的motif;用SOPMA程序(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html )预测蛋白质的二级结构;
  6. 了解重要蛋白质分析网站:
    Expasy(http://www.expasy.org/tools/ ),
    CBS(http://www.cbs.dtu.dk/services/ ),
    PDB (http://www.rcsb.org )
    EBI(http://www.ebi.ac.uk/services/proteins )。
  7. 蛋白质三级结构分析:利用蛋白名称、所属物种信息,检索蛋白质(AAM91227)在PDB数据库(http://www.rcsb.org  )中是否存在已被解析的蛋白结构;若有下载其解析精度最高的蛋白结构文件(*.pdb);
  8. 用Swiss-PdbViewer软件,对上述下载的蛋白质结构进行展示;用条带图的显示方式展示蛋白结构,并标注出NAD+分子;Swiss-PdbViewer软件从网络教学平台中下载,在本机中解压后,直接点击spdbv.exe程序即可使用,无需安装;其使用说明参见(http://spdbv.vital-it.ch/main_guide.html );
  9. 蛋白质的功能分类:浏览GO数据库(http://www.geneontology.org/ );通过interproscan软件(http://www.ebi.ac.uk/Tools/pfa/iprscan/ )预测蛋白质(AAM91227)的GO功能分类号(molecular function, biological process);在GO数据库中进行浏览其条目。浏览wego程序(http://wego.genomics.org.cn/cgi-bin/wego/index.pl )。
  10. 蛋白质的pathway定位分析:基于KEGG数据库(http://www.genome.jp/kegg/ ),对蛋白质(AAM91227)进行BLAST搜索(http://www.genome.jp/tools/blast/ ),需要指定相应物种,获得该酶的信息,定位;展示相应pathway图。

三、          教学实习报告

1     用Protparam程序,对蛋白质(AAM91227)的基本特性进行预测,包括分子量、等电点(PI)、含量最高的三种氨基酸所占百分比;

2    用SignalP程序,预测蛋白质(P02754AAM91227)是否存在信号肽,若存在,具体区段在哪?

3    用Tmpred程序,预测蛋白质(AAM91227)的最可能跨膜区段。

4    用interproscan程序,预测蛋白质(AAM91227)是否存在NAD(P)结合区域,若存在,该区段在哪?

5    用SOPMA程序,预测蛋白质(AAM91227)的二级结构,其中α螺旋(Alpha helix)占该蛋白质序列全长的多大比例?

6    简述你用Swiss-PdbViewer软件展示蛋白(AAM91227)结构的方法;将上述interproscan软件预测的蛋白质(AAM91227)NAD(P)结合区域,在蛋白质结构中用不同颜色标注出;向实验指导老师现场展示该蛋白与NAD+分子结合的图形;

7    用Interproscan程序,预测蛋白质(AAM91227)的功能分类(用GO号表示);其biological process分类项在GO数据库中的父分类项有哪些(用GO号表示)?

8    基于KEGG数据库,对蛋白质(AAM91227)进行BLAST搜索(http://www.genome.jp/tools/blast/ ),该酶的酶分类号,定位于哪些pathway中?