如何利用肌肉进行多序列比对,针对这个问题,本文详细介绍了相应的分析和解答,希望能帮助更多想要解决这个问题的朋友找到更简单易行的方法。
肌肉是最广泛使用的多序列比对工具之一。它的速度和准确性都比clustal好。它可以在几秒钟内对齐数百个序列,用法简单。
在下载页面上,提供了几种操作系统的可执行文件。
linux下安装的代码如下
wget https://www . drive 5.com/music/downloads 3 . 8 . 31/muscle 3 . 8 . 31 _ i86 Linus 64 . tar . gz
tarxzvfmuscle 3 . 8 . 31 _ i86 line x64 . tar . gz
mvmuscle 3 . 8 . 31 _ i86 line x64 muscle
Chmod xmuscle在这里因为解压后文件名太长而重命名了文件,然后添加了可执行权限。为了方便调用,您可以将该文件添加到PATH环境变量中。肌肉的基本用法如下
musk-inseqs . fa-outeqs . AFA的输入序列是FASTA格式。如果输入序列中存在间隙,将首先去除这些间隙,然后进行多序列比对。默认的输出比较结果也是fasta格式,也支持phylip、msf、clustalw等其他格式。
除了多序列比较,肌肉还可以构建进化树,支持以下两种取得成就的方式。
新泽西州
UPGMA
用NJ方法构造的进化树更可靠,而UPGMA更快。基本用法如下
肌肉生成树。AFA-outeqs . phy-cluster neiground-cluster参数指定构建树的方法,默认值为upgma。输出树文件格式为纽尼克格式。
肌肉的默认参数设置最大化了对齐的准确性。对于大序列,如果比对速度不理想,可以适当调整参数。
对于核酸和氨基酸序列,官方分别推荐最快的参数设置。
核酸
肌肉-inseqs . fa-outeqs。AFA-最大值1-诊断氨基酸
当肌肉收缩时。使用的是AFA-maximiter 1-diags-SV-distance 1k bit 20 _ 3,其默认参数设置可以满足大多数使用场景,而且只针对大的输入序列,需要调整参数。
EBI在以下网站提供肌肉在线服务
https://www.ebi.ac.uk/Tools/msa/muscle/
用法与clustal类似,这里不再赘述。对于数据少于500条、小于1Mb的序列,可以直接使用这项在线服务。
关于如何利用肌肉进行多序列比对的问题,我希望在这里分享答案。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/80646.html