实验三:相似性搜索与序列比对
一:实验目的
1. 能够熟练使用NCBI网站的BLAST系列工具和EMBL的BLAST和FASTA工具,掌握一定的数据库搜索相似序列的技巧。 2. 能够熟练运用Clustalx软件进行双序列和多序列比对。 3. 学会使用EMBL上的Clustalw工具进行比对
二:实验内容及操作步骤
1. BLAST和FASTA的使用
Blastn
a) 进入NCBI主页下载关于H5N1核酸序列或其它你感兴趣的核酸序列(Fasta
格式)
b) 进入http://www.ncbi.nih.gov/BLAST/
c) 选择Nucleotide→Nucleotide-nucleotide BLAST (blastn)进行核酸相似性数
据库搜索
d) 在search对话框中粘贴入下载的H5N1核酸序列或其它你感兴趣的核酸序
列(Fasta格式)
e) 调整各参数值,直到获得最佳比对 f) 点击
进行比对
g) 点击Format!对结果进行格式化,可在下面的选项中自行设计结果的显示方
式
h) 查看比对结果,看在数据库中找到的序列与你的序列是否相似或相同
Blastp
a) 进入NCBI主页下载某一蛋白质序列(Fasta格式),如amine
b) 选择Protein→Protein-protein BLAST (blastp)进行蛋白质相似性数据库搜索 c) 在search对话框中粘贴入下载的蛋白质序列(Fasta格式) d) 调整各参数值,直到获得最佳比对 e) 点击
进行比对
f) 点击Format!对结果进行格式化,可自行设计结果的显示方式
g) 查看比对结果,看在数据库中找到的序列与你的序列是否相似或相同
Bl2seq
a) 进入NCBI主页下载某两条核酸或蛋白质序列(Fasta格式) b) 进入http://www.ncbi.nih.gov/BLAST/
c) 点击Special目录下的Align two sequences (bl2seq) d) 将两条序列分别输入Sequence 1和Sequence 2区域 e) 点Align进行比对
EMBL-BLAST
a) 进入http://www.ebi.ac.uk/
b) 点击ToolBox下的Blast2 - NCBI
c) 自行练习EMBL-BLAST,并比较与NCBI上的BLAST有何区别
FASTA
1. 进入EMBL主页:http://www.ebi.ac.uk/ 2. 点击Services, 点击ToolBox下的FASTA 3. 设置好参数点击Run
4. 点击结果中Summary Table下的按钮查看不同的结果显示
2. Clustalx软件和在线Clustalw的使用
使用Clustalx软件进行双序列比对:
a) 在NCBI中,搜索H5N1或任何你感兴趣的核酸或蛋白序列,选中两条序列,
并一起存为FASTA文件,文件名为newname.fasta, 文件内容例如:
>xxxx
ATTTCGGGTGCTCGATGCTAGG >xxxxx
ATATTATCATAGAGGGATACCCCCTGGGG
b) 点击软件的File→Load Sequences,加载保存的fasta文件 c) 点击Alignment→Do Alignment,进行默认参数的双序列比对
d) 将比对后的文件存到指定的目录,并用记事本打开并查看你保存的文件
e) 点击Alignment→Alignment Parameters→Pairwise Alignment Parameters,
设置各个参数,再进行第3步看结果有何不同
f) 点击Alignment→Output Format Options,将存储的文件格式进行修改(默
认为xxx.aln),执行c、d步骤,看不同文件格式的文件内容有何不同
使用Clustalx软件进行多序列比对:
a) 在NCBI中,搜索H5N1或任何你感兴趣的核酸或蛋白序列,选中三条或三条以上序列,并一起存为FASTA文件,文件名为newname.fasta, 文件内容举例如下:
b) c) d) e) a) b) c) d) e) f)
>xxxx
ATTTCGGGTGCTCGATGCTAGG >xxxxx
ATATTATCATAGAGGGATACCCCCTGGGG >xxxxx
ATATTATCATAGAGGGATACCCCCTGGGG ...…
点击软件的File→Load Sequences,加载我们存的fasta文件 点击Alignment→Do Alignment,进行默认参数的多序列比对 将比对后的文件存到指定的目录,并用记事本打开你保存的文件
点击Alignment→Alignment Parameters→Multiple Alignment Parameters,设置各个参数,再进行第c步看结果有何不同
使用EMBL的Clustalw工具进行多序列比对:
在NCBI中下载三条或三条以上核酸或蛋白质序列(Fasta格式) 进入EMBL主页:http://www.ebi.ac.uk/
点击Services, 点击ToolBox→Sequence Analysis→ClustalW
在对话框中输入下载的核酸或蛋白序列,点击Run进行默认参数的比对 点击查看Results of search下的内容
进入c步骤所在页面,修改Clustalw中的各参数并重复d步骤,看比对结果有何不同
g) 进入c步骤所在页面,在
择E-mail,查看邮箱中的结果
输入你的E-mail,并在选
三、作业
1.了解什么是BLAST,它有哪些应用。
2.请在NCBI中查找你感兴趣的某一基因或蛋白,通过BLAST工具检索与其高度相似的序列,并将你查到的这一基因或蛋白与你检索到的与其相似的序列(其中一条)的比对结果列出来,简单说明序列比对评分和检索过程。 3.理解BLAST不同参数的含义,以及如何调整和适用情况。 4.为什么要进行多序列比对,比对结果可以用于哪些分析。
5.请从NCBI上下载三条或三条以上你感兴趣的一类基因或蛋白(如血红蛋白家族)序列,通过Clustalx软件进行比对,列出比对结果。