如何使用Clustal进行多序列比对,相信很多没有经验的人对此无能为力。为此,本文总结了问题产生的原因和解决方法,希望大家可以通过本文来解决这个问题。
多序列比对在保守区鉴定、系统发育分析、基序鉴定等领域发挥着重要作用。它是生物信息学数据分析必不可少的基本技能之一。Clustal是一个经典的多序列比对工具,支持DNA、RNA和蛋白质的比对。
Clustal有两个版本。以前的版本提供了图形用户界面和命令行工具。GUI版本叫做ClustalX,命令行版本叫做ClustalW。最新的版本叫做Omega,只有命令行版本。
最新的omega比对更准确更快速,适用于上千个尺度的多序列比对。目前软件只提供命令行版本。在官方网站上,提供了源代码和编译的二进制文件。
通常直接下载相应的二进制可执行文件就足够了。软件的基本用法如下:
Clustalo-iseq.fastaalign.fa-i指定输入序列文件,默认输出结果打印在屏幕上,可以重定向到指定文件。该软件支持各种格式的输出。
fasta
clustal
多级闪蒸
phylip
selex
斯德哥尔摩
维也纳
默认输出格式是fasta,输出文件格式可以由-outmt参数指定。多序列比对与Blast的不同之处在于Blast是局部比对,而多序列比对是全局比对。全局比对意味着输入序列需要在同一水平上进行比对。通常,通过在输入序列中插入碱基来比对序列,如下所示。
ENA | CAA 23748 | CAA 23748.1人类珠蛋白
atggtgctgtctcg-ccgacaagaccacgtcaagccgcctggtaagtcgg
cgcgcacgctggcgaggtatggtgcggagccctggaggatgttcctgtccttccccacc
CACCAAGACCTACTTCCCGCACTTC-gacctgagccaccggctctgcccaagttatagg
cccggcaagaaggtggccgacgctgaccaacggtggcgcacgtggacgacatgcc
cacacgcgctgtccgccctgagcacctgcacgcacaagcttcgggtggacccggtcaa
cttcaagctcctaagccactcgcctgctggtgaccctggcccccccccccctccccgccgagtt
CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT-cctggcttctgtgagccgtgct
GACCTCCAAATACCGTTAA
ENA | CAA 24095 | CAA 24095.1家鼠-珠蛋白
atggtgcttctggggaacaaaag-cacatcaaggcctgcctgggaagattgg
tggccatggtgctgaatatggagctgaagccctggaagatgtttgctagcttccccac
caccaagacctactttcctactttgatgt-aagccacggcttgcccaggtcaaggg
tcacggcaagaggtcgccgatgctggccagtgctgcagccacctcgatgacctgcc
cggtgccttgtctgcttgagacctgcatgcccacaagctgcgtggatcccgtcaa
cttcaagctctcctgagcctgctggtgaccttggctagccaccctgccgattt
cacccgcggtacatgccttctggacaaatt-ccttgccttgagcaccgtgct
GACCTCCAAGTACCGTTAA
ENA | baa 20512 | baa 20512.1鲤-珠蛋白
atgagttctctctgatagacaagctg-CTGTGAAAGCCCTATGGGCTAAGATCAG
ccccaagccgatgatcggctgaagctctcggaatgctgaccgtctaccctca
gaccaagacctacttcgctaccgggatgatgagccctgggtccggtctcctgtgaa
gcatggcaagttatcatgggtgcagtggccgatgctttcaaaaaatagacgaccttgt
gggagggtctggtctctctgagcgaacttcatgcttccaagtgcgttgacccgcaa
cttcaagatcctcgcacacatgtcatcgtgcatcggcatctcttccctggagactt
ccccccgagggttcacatgtcagttgacaagtttttccagaac-ttggctcttggctct
CTCTGAGAAGTACCGCTAA通过插入序列来对齐序列。如果您不习惯命令行操作,也可以使用在线服务。EBI在线服务的网站如下
https://www.ebi.ac.uk/Tools/msa/clustalo/
使用起来非常简单。输入序列,调整参数设置,然后提交。在输出结果中,还提供了颜色标注、进化树可视化等功能。
通过Mview可视化多序列比对的结果,如下所示。
它还支持导出到Jalview软件进行可视化。
进化树的结果可以通过生理树查看,默认采用NJ方法,如下图。
你也可以通过发送到简单生理学创建一个进化树,支持NJ和UPGMA。
看完以上,你掌握了如何使用Clustal进行多序列比对了吗?如果您想学习更多技能或了解更多相关内容,请关注行业资讯频道,感谢您的阅读!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/80645.html