实验三:相似性搜索与序列比对

实验三:相似性搜索与序列比对

一:实验目的

1. 能够熟练使用NCBI网站的BLAST系列工具和EMBL的BLAST和FASTA工具,掌握一定的数据库搜索相似序列的技巧。 2. 能够熟练运用Clustalx软件进行双序列和多序列比对。 3. 学会使用EMBL上的Clustalw工具进行比对

二:实验内容及操作步骤

1. BLAST和FASTA的使用

Blastn

a) 进入NCBI主页下载关于H5N1核酸序列或其它你感兴趣的核酸序列(Fasta

格式)

b) 进入http://www.ncbi.nih.gov/BLAST/

c) 选择Nucleotide→Nucleotide-nucleotide BLAST (blastn)进行核酸相似性数

据库搜索

d) 在search对话框中粘贴入下载的H5N1核酸序列或其它你感兴趣的核酸序

列(Fasta格式)

e) 调整各参数值,直到获得最佳比对 f) 点击

进行比对

g) 点击Format!对结果进行格式化,可在下面的选项中自行设计结果的显示方

h) 查看比对结果,看在数据库中找到的序列与你的序列是否相似或相同

Blastp

a) 进入NCBI主页下载某一蛋白质序列(Fasta格式),如amine

b) 选择Protein→Protein-protein BLAST (blastp)进行蛋白质相似性数据库搜索 c) 在search对话框中粘贴入下载的蛋白质序列(Fasta格式) d) 调整各参数值,直到获得最佳比对 e) 点击

进行比对

f) 点击Format!对结果进行格式化,可自行设计结果的显示方式

g) 查看比对结果,看在数据库中找到的序列与你的序列是否相似或相同

Bl2seq

a) 进入NCBI主页下载某两条核酸或蛋白质序列(Fasta格式) b) 进入http://www.ncbi.nih.gov/BLAST/

c) 点击Special目录下的Align two sequences (bl2seq) d) 将两条序列分别输入Sequence 1和Sequence 2区域 e) 点Align进行比对

EMBL-BLAST

a) 进入http://www.ebi.ac.uk/

b) 点击ToolBox下的Blast2 - NCBI

c) 自行练习EMBL-BLAST,并比较与NCBI上的BLAST有何区别

FASTA

1. 进入EMBL主页:http://www.ebi.ac.uk/ 2. 点击Services, 点击ToolBox下的FASTA 3. 设置好参数点击Run

4. 点击结果中Summary Table下的按钮查看不同的结果显示

2. Clustalx软件和在线Clustalw的使用

使用Clustalx软件进行双序列比对:

a) 在NCBI中,搜索H5N1或任何你感兴趣的核酸或蛋白序列,选中两条序列,

并一起存为FASTA文件,文件名为newname.fasta, 文件内容例如:

>xxxx

ATTTCGGGTGCTCGATGCTAGG >xxxxx

ATATTATCATAGAGGGATACCCCCTGGGG

b) 点击软件的File→Load Sequences,加载保存的fasta文件 c) 点击Alignment→Do Alignment,进行默认参数的双序列比对

d) 将比对后的文件存到指定的目录,并用记事本打开并查看你保存的文件

e) 点击Alignment→Alignment Parameters→Pairwise Alignment Parameters,

设置各个参数,再进行第3步看结果有何不同

f) 点击Alignment→Output Format Options,将存储的文件格式进行修改(默

认为xxx.aln),执行c、d步骤,看不同文件格式的文件内容有何不同

使用Clustalx软件进行多序列比对:

a) 在NCBI中,搜索H5N1或任何你感兴趣的核酸或蛋白序列,选中三条或三条以上序列,并一起存为FASTA文件,文件名为newname.fasta, 文件内容举例如下:

b) c) d) e) a) b) c) d) e) f)

>xxxx

ATTTCGGGTGCTCGATGCTAGG >xxxxx

ATATTATCATAGAGGGATACCCCCTGGGG >xxxxx

ATATTATCATAGAGGGATACCCCCTGGGG ...…

点击软件的File→Load Sequences,加载我们存的fasta文件 点击Alignment→Do Alignment,进行默认参数的多序列比对 将比对后的文件存到指定的目录,并用记事本打开你保存的文件

点击Alignment→Alignment Parameters→Multiple Alignment Parameters,设置各个参数,再进行第c步看结果有何不同

使用EMBL的Clustalw工具进行多序列比对:

在NCBI中下载三条或三条以上核酸或蛋白质序列(Fasta格式) 进入EMBL主页:http://www.ebi.ac.uk/

点击Services, 点击ToolBox→Sequence Analysis→ClustalW

在对话框中输入下载的核酸或蛋白序列,点击Run进行默认参数的比对 点击查看Results of search下的内容

进入c步骤所在页面,修改Clustalw中的各参数并重复d步骤,看比对结果有何不同

g) 进入c步骤所在页面,在

择E-mail,查看邮箱中的结果

输入你的E-mail,并在选

三、作业

1.了解什么是BLAST,它有哪些应用。

2.请在NCBI中查找你感兴趣的某一基因或蛋白,通过BLAST工具检索与其高度相似的序列,并将你查到的这一基因或蛋白与你检索到的与其相似的序列(其中一条)的比对结果列出来,简单说明序列比对评分和检索过程。 3.理解BLAST不同参数的含义,以及如何调整和适用情况。 4.为什么要进行多序列比对,比对结果可以用于哪些分析。

5.请从NCBI上下载三条或三条以上你感兴趣的一类基因或蛋白(如血红蛋白家族)序列,通过Clustalx软件进行比对,列出比对结果。

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4