怎么使用trim_galore对NGS数据进行质量过滤

技术怎么使用trim_galore对NGS数据进行质量过滤怎么使用trim_galore对NGS数据进行质量过滤,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题

如何使用trim_galore对NGS数据质量进行过滤,相信很多没有经验的人对此无能为力。为此,本文总结了问题产生的原因和解决方法,希望大家可以通过这篇文章来解决这个问题。

Cutadapt软件可以过滤NGS数据的质量,FastQC软件可以检查NGS数据的质量分布,trim_galore将这两个软件打包在一起,使用起来更加方便。

软件将在以下四个步骤中处理数据

1. 去除reads 3’端的低质量碱基

illumina平台测序数据,通常3’端质量较差。Trim_galore将首先在3’端过滤掉低质量的碱基,本质上是调用cutadapt的质量过滤算法。下图显示了过滤前后的基础质量分布。

怎么使用trim_galore对NGS数据进行质量过滤

可以看出,过滤掉低质量的碱基后,序列的整体质量显著提高。

00-1010在过滤掉低质量的碱基后,trim_galore将调用cutadapt在读取的3’端找到适配器序列并将其移除。通常,我们需要指定相应的适配器序列。如果没有规范,trim_galore会自动找到以下三种类型的适配器。

illumina a : agatcggaagagc

SmallRNA:TGGAATTCTCGG

Nextera:CTGTCTCTTATA默认读取前一百万个序列,通过这一百万个序列判断适配器属于以上三种类型中的哪一种,然后删除。如果不希望软件自动判断,也可以通过-illumina、-nextera、-small _ RNA参数指定对应的适配器类型。

00-1010经过以上两个步骤,有可能剩余的序列长度很短,而这个短序列也将被删除。默认情况下,如果序列长度小于20bp,序列将被丢弃。

2. 去除adapter序列

对于所有输入序列,以上三个步骤肯定会执行。此外,trim_galore还支持一些其他过滤措施,以满足个性化需求。

Hardtrim5参数用于从序列的3’端切割底部,如下所示。

在: cctaagaacaagtacactccacatgcata之前

-hardtrim520: cctaagaacaagtacact序列可以通过hardt rim 5参数截断为固定长度。相应地,还有一个hardtrim3参数,它从序列的5’端开始切割碱基,如下所示。

在: caaatgttatttaagaaatggaaaat之前

-hard trim 3203360 tttttaaaaaaatggaaat软件安装起来也非常方便。首先,需要确保安装了cutadapt和fastqc,并且可执行文件位于PAH环境变量定义的路径中。然后下载trim_galore的源代码包并解压。代码如下

wget https://github.com/FelixKrueger/TrimGalore/archive/0 . 5 . 0 . tar . gz

Tarxzvf0.5.0.tar.gz在软件的安装目录中有一个名为trim_galore的可执行文件。

对于单端测序数据,基本用法如下

trim _ galore-quality 20-aagatcggaggc-length 20-out _ dirinput . FQ对于双端时序数据,基本用法如下

Trim_galore-payed-quality 20-aagatcggagc-a2 agatcggagagc-length 20-out _ dirr1.fq.gzr2.fq.gz,看完上面的内容,你知道怎么用trim _ galore过滤NGS数据的质量吗?如果您想学习更多技能或了解更多相关内容,请关注行业资讯频道,感谢您的阅读!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/80650.html

(0)

相关推荐

  • Django如何编写自定义manage.py命令

    技术Django如何编写自定义manage.py命令小编给大家分享一下Django如何编写自定义manage.py命令,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!python manage.py <c

    攻略 2021年11月20日
  • 十大经典排序算法

    技术十大经典排序算法 十大经典排序算法本文转载自https://www.cnblogs.com/onepixel/articles/7674659.html
    0、算法概述
    0.1 算法分类
    十种常见排序

    礼包 2021年12月14日
  • nodejs中的fs模块中的方法

    技术nodejs中的fs模块中的方法 nodejs中的fs模块中的方法nodejs中的fs模块
    引入模块
    const fs =require("fs")检测文件是否存在fs.stat(path,call

    礼包 2021年12月2日
  • Data Guard中Snapshot Standby Database配置是怎样的

    技术Data Guard中Snapshot Standby Database配置是怎样的Data Guard中Snapshot Standby Database配置是怎样的,相信很多没有经验的人对此束手无策,为此本文总结

    攻略 2021年11月12日
  • 如何理解C语言实现的操作系统银行家算法

    技术如何理解C语言实现的操作系统银行家算法如何理解C语言实现的操作系统银行家算法,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。一、选题背景这次课程设计要

    攻略 2021年10月27日
  • qt 绘制折线(qt地图绘制)

    技术Qt编写地图综合应用之如何绘制覆盖物折线这篇文章给大家分享的是有关Qt编写地图综合应用之如何绘制覆盖物折线的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。一、前言折线图目前应用最广的也是用来

    攻略 2021年12月25日