生物信息学教学实习七
蛋白质序列分析
一、 教学实习的目的
1. 掌握蛋白质序列的基本特性的分析方法
2. 掌握蛋白质序列一维序列、二级结构分析方法
3. 熟悉蛋白质结构数据库(PDB)的检索方法;
4. 掌握蛋白质序列三级结构的展示、标注方法;
5. 掌握基于GO数据库,进行蛋白质功能分类的方法;
6. 掌握基于KEGG数据库,进行蛋白质pathway定位的方法
二、 教学实习内容
- 蛋白质基本特性分析:用Protparam程序(http://web.expasy.org/protparam/ ),对如下任一蛋白质(P02754,P63326,AAM91227)的氨基酸序列的基本特性进行分析,包括氨基酸组成、分子量、等电点(PI)、疏水性等;
- 用SignaIP(http://www.cbs.dtu.dk/services/SignalP/)程序,对上述蛋白质进行信号肽预测分析;
- 用Tmpred(TMpred - Prediction of Transmembrane Regions and Orientation)程序(http://www.ch.embnet.org/software/TMPRED_form.html),预测上述蛋白质的跨膜区;
- 蛋白质一维序列分析:用BLAST程序搜寻上述蛋白质的相似蛋白序列;用clustalw(http://www.ebi.ac.uk/Tools/msa/clustalw2/ )对这些相似蛋白序列进行多重比对分析,寻找其中共同的保守区段;
- 蛋白质二级结构分析:用interproscan程序(http://www.ebi.ac.uk/Tools/pfa/iprscan/ )预测上述蛋白质序列的motif;用SOPMA程序(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html )预测蛋白质的二级结构;
- 了解重要蛋白质分析网站:
Expasy(http://www.expasy.org/tools/ ),
CBS(http://www.cbs.dtu.dk/services/ ),
PDB (http://www.rcsb.org )
EBI(http://www.ebi.ac.uk/services/proteins )。 - 蛋白质三级结构分析:利用蛋白名称、所属物种信息,检索蛋白质(AAM91227)在PDB数据库(http://www.rcsb.org )中是否存在已被解析的蛋白结构;若有下载其解析精度最高的蛋白结构文件(*.pdb);
- 用Swiss-PdbViewer软件,对上述下载的蛋白质结构进行展示;用条带图的显示方式展示蛋白结构,并标注出NAD+分子;Swiss-PdbViewer软件从网络教学平台中下载,在本机中解压后,直接点击“spdbv.exe”程序即可使用,无需安装;其使用说明参见(http://spdbv.vital-it.ch/main_guide.html );
- 蛋白质的功能分类:浏览GO数据库(http://www.geneontology.org/ );通过interproscan软件(http://www.ebi.ac.uk/Tools/pfa/iprscan/ )预测蛋白质(AAM91227)的GO功能分类号(molecular function, biological process);在GO数据库中进行浏览其条目。浏览wego程序(http://wego.genomics.org.cn/cgi-bin/wego/index.pl )。
- 蛋白质的pathway定位分析:基于KEGG数据库(http://www.genome.jp/kegg/ ),对蛋白质(AAM91227)进行BLAST搜索(http://www.genome.jp/tools/blast/ ),需要指定相应物种,获得该酶的信息,定位;展示相应pathway图。
三、 教学实习报告
1. 用Protparam程序,对蛋白质(AAM91227)的基本特性进行预测,包括分子量、等电点(PI)、含量最高的三种氨基酸所占百分比;
2. 用SignalP程序,预测蛋白质(P02754、AAM91227)是否存在信号肽,若存在,具体区段在哪?
3. 用Tmpred程序,预测蛋白质(AAM91227)的最可能跨膜区段。
4. 用interproscan程序,预测蛋白质(AAM91227)是否存在NAD(P)结合区域,若存在,该区段在哪?
5. 用SOPMA程序,预测蛋白质(AAM91227)的二级结构,其中α螺旋(Alpha helix)占该蛋白质序列全长的多大比例?
6. 简述你用Swiss-PdbViewer软件展示蛋白(AAM91227)结构的方法;将上述interproscan软件预测的蛋白质(AAM91227)与NAD(P)结合区域,在蛋白质结构中用不同颜色标注出;向实验指导老师现场展示该蛋白与NAD+分子结合的图形;
7. 用Interproscan程序,预测蛋白质(AAM91227)的功能分类(用GO号表示);其biological process分类项在GO数据库中的父分类项有哪些(用GO号表示)?
8. 基于KEGG数据库,对蛋白质(AAM91227)进行BLAST搜索(http://www.genome.jp/tools/blast/ ),该酶的酶分类号,定位于哪些pathway中?