实用生物信息技术课程第4次作业
BLAST数据库相似性搜索
姓名________ 学号______________ 组号_____ 日期________年___月___日
1. 2.
以人血红蛋白beta亚基(HBB_HUMAN)为检测序列,搜索Swiss-Prot数据库中所有哺乳动物的血红蛋白,找出前10个高分匹配,列表说明搜索结果。 以大鼠血红蛋白alpha亚基(HBA_RAT)为检测序列,用BlastP、PSI-Blast和DELTA-Blast分别搜索RefSeq数据库中大鼠珠蛋白基因家族成员(注意选择适当的计分矩阵、设置适当的E值)。
以大鼠血红蛋白alpha亚基(HBA_RAT)为检测序列,用tBlastN搜索RefSeq数据库中大鼠珠蛋白基因家族mRNA序列。参考Hardison论文和大鼠基因组数据库RGD中相关信息,下载非预测序列,提取其编码区序列,进行多序列比对,并构建系统发育树,分析结果。
搜索RefSeq数据库中人、小鼠和大鼠三个物种珠蛋白家族mRNA序列,下载非预测序列,提取其编码区序列;对上述三个物种所有珠蛋白基因编码区序列进行多序列比对,并构建系统发育树,分析结果。
以你课题相关的蛋白质为检测序列,搜索Swiss-Prot或RefSeq数据库,分析搜索结果,阅读相关文献,找出同一物种中可能的旁系同源序列和近缘物种中可能的直系同源序列。
从植物转录因子数据库(PlantTFDB)中下载玉米转录因子蛋白质序列和编码区序列数据,构建本地BLAST数据库。以拟南芥转录因子SPL3蛋白质序列为检索序列,用BLASTP和TBLASTN进行搜索,以拟南芥转录因子SPL3的编码区核苷酸序列为检索序列,用BLASTN、BLASTX、TBLASTX进行搜索。列表说明搜索结果,总结上述不同搜索程序的适用范围。(选做题)
3.
4.
5.
6.
1