怎么使用trim_galore对NGS数据进行质量过滤

技术怎么使用trim_galore对NGS数据进行质量过滤怎么使用trim_galore对NGS数据进行质量过滤,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题

如何使用trim_galore对NGS数据质量进行过滤,相信很多没有经验的人对此无能为力。为此,本文总结了问题产生的原因和解决方法,希望大家可以通过这篇文章来解决这个问题。

Cutadapt软件可以过滤NGS数据的质量,FastQC软件可以检查NGS数据的质量分布,trim_galore将这两个软件打包在一起,使用起来更加方便。

软件将在以下四个步骤中处理数据

1. 去除reads 3’端的低质量碱基

illumina平台测序数据,通常3’端质量较差。Trim_galore将首先在3’端过滤掉低质量的碱基,本质上是调用cutadapt的质量过滤算法。下图显示了过滤前后的基础质量分布。

怎么使用trim_galore对NGS数据进行质量过滤

可以看出,过滤掉低质量的碱基后,序列的整体质量显著提高。

00-1010在过滤掉低质量的碱基后,trim_galore将调用cutadapt在读取的3’端找到适配器序列并将其移除。通常,我们需要指定相应的适配器序列。如果没有规范,trim_galore会自动找到以下三种类型的适配器。

illumina a : agatcggaagagc

SmallRNA:TGGAATTCTCGG

Nextera:CTGTCTCTTATA默认读取前一百万个序列,通过这一百万个序列判断适配器属于以上三种类型中的哪一种,然后删除。如果不希望软件自动判断,也可以通过-illumina、-nextera、-small _ RNA参数指定对应的适配器类型。

00-1010经过以上两个步骤,有可能剩余的序列长度很短,而这个短序列也将被删除。默认情况下,如果序列长度小于20bp,序列将被丢弃。

2. 去除adapter序列

对于所有输入序列,以上三个步骤肯定会执行。此外,trim_galore还支持一些其他过滤措施,以满足个性化需求。

Hardtrim5参数用于从序列的3’端切割底部,如下所示。

在: cctaagaacaagtacactccacatgcata之前

-hardtrim520: cctaagaacaagtacact序列可以通过hardt rim 5参数截断为固定长度。相应地,还有一个hardtrim3参数,它从序列的5’端开始切割碱基,如下所示。

在: caaatgttatttaagaaatggaaaat之前

-hard trim 3203360 tttttaaaaaaatggaaat软件安装起来也非常方便。首先,需要确保安装了cutadapt和fastqc,并且可执行文件位于PAH环境变量定义的路径中。然后下载trim_galore的源代码包并解压。代码如下

wget https://github.com/FelixKrueger/TrimGalore/archive/0 . 5 . 0 . tar . gz

Tarxzvf0.5.0.tar.gz在软件的安装目录中有一个名为trim_galore的可执行文件。

对于单端测序数据,基本用法如下

trim _ galore-quality 20-aagatcggaggc-length 20-out _ dirinput . FQ对于双端时序数据,基本用法如下

Trim_galore-payed-quality 20-aagatcggagc-a2 agatcggagagc-length 20-out _ dirr1.fq.gzr2.fq.gz,看完上面的内容,你知道怎么用trim _ galore过滤NGS数据的质量吗?如果您想学习更多技能或了解更多相关内容,请关注行业资讯频道,感谢您的阅读!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/80650.html

(0)

相关推荐

  • 缓存层与数据库层数据同步

    技术缓存层与数据库层数据同步 缓存层与数据库层数据同步缓存层与数据库层数据同步问题
    在实际的业务开发中,为了避免大量请求直接操作数据库,我们会用redis做一个缓存层,用户的数据库请求先在redis中查

    礼包 2021年11月1日
  • MySQL DROP TABLE删除表报错'ERROR 1051 (42S02): Unknown table'怎么办

    技术MySQL DROP TABLE删除表报错ERROR 1051 (42S02): Unknown table怎么办这篇文章主要介绍了MySQL DROP TABLE删除表报错ERROR 1051 (42S02): U

    攻略 2021年11月2日
  • 怎么才能持久,如何才能获得长久的幸福

    技术怎么才能持久,如何才能获得长久的幸福美国著名的心理学家马丁塞利格曼
    说:幸福快乐的人生有三种怎么才能持久。
    第一种,是愉快的人生。
    这样的人生所拥有的快乐多得不能再多了,积极情绪多得不能再多了。学习快乐的技巧,在时间

    生活 2021年10月27日
  • react如何实现文件转base64

    技术react如何实现文件转base64小编给大家分享一下react如何实现文件转base64,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

    攻略 2021年11月26日
  • RAC安装时出现PRKC-1024错误怎么办

    技术RAC安装时出现PRKC-1024错误怎么办这篇文章给大家分享的是有关RAC安装时出现PRKC-1024错误怎么办的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Clusterware安装到

    攻略 2021年11月10日
  • js中生成器有什么用

    技术js中生成器有什么用小编给大家分享一下js中生成器有什么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!**生成器***生成器对象,可以由

    攻略 2021年11月23日