本期,边肖将为您带来关于如何使用ball loat进行成绩单水平的差异分析。文章内容丰富,从专业角度进行分析和描述。希望你看完这篇文章能有所收获。
分析常见转录组差异有两种策略。一种是基于原始计数的定量方法,如DESeq2、edgeR等。另一种是基于FPKM/RPKM的定量方法,如cuffdiff。
在前一篇文章中,我们还提到了基于FPKM值的管道从tophat袖扣cuffdiff升级到Hisat String Tieball Town。R包ball look也用于分析FPKM值表达式的差异。有两种方法可以获得成绩单级别的FPKM值。
1. stringTie
为了方便ball look的下游分析,可以通过在stringTie软件中直接添加-b参数来生成ball look的输入文件。基本用法如下
stringtie-p10\
-Ghg19.gtf\
-ooutput.gtf\
-bball袍_out_dir-e\
align . sorted . ba m
2. tablemaker
TableMaker软件也可以通过调用袖扣软件生成ball loat的输入文件,可从以下链接下载
https://figshare.com/articles/Tablemaker_Linux_Binary/1053137
基本用法如下
tablemaker\
-p4\
-q-W\
-Ghg19.gtf\
-oout_dir\
对于每个示例,都会生成一个文件夹,其中包含以下五个文件
e_data.ctab
e2t.ctab
i2t.ctab
i_data.ctab
T_data.ctabe代表外显子,I代表内含子,t代表转录本,并且_data的文件在不同的层次表达。I2t代表内含子和转录本的对应关系,e2t代表外显子和转录本的对应关系。
输入文件准备好之后,可以进行差异分析。现在所有的R包都是高度封装的,几个函数就可以完成整个分析。首先,读取所有样本的输入文件。代码如下
图书馆(舞会礼服)
bg=舞会礼服(
samples=c('sampleA.dir ',' sampleB.dir '),
Meas='all ')样本为所有样本指定ball loat的输入文件夹。导入成功后,可以通过*expr函数查看R中不同级别样本的表达信息,其中*的取值范围为I,即t,G,代表不同级别。
检查转录本表达水平的代码示例如下。
转录本_fpkm=texpr(bg,' fpkm ')需要注意的是,内含子、外显子、转录本水平的表达信息都在原ctab文件中,而基因水平的表达信息需要根据基因对应的转录本的表达情况来计算,因此比较耗时。
阅读后,需要设置样本分组,代码如下
pData(bg)-data.frame(
id=sampleNames(bg),
group=rep(c(1,0),每个=3)
)实际上是一个数据框,第一列是样本的名称,第二列是样本对应的分组。
ball loat将根据组的类型自动分析不同类型的差异。如果样本分为两组,将分析两组之间的差异;如果样本是多个组,将分析多个组之间的差异。
ball look通过stattest功能进行方差分析,支持以下四个层次的方差分析。
外显子
基因内区
基因
副本
通过特征参数指定方差分析的级别。一般用法如下
转录水平差异分析
stat_results=stattest(bg,
特征='抄本',
meas='FPKM ',
协变量='组')
#基因水平的差异分析
stat_results=stattest(bg,
特征='基因',
meas='FPKM ',
Covary=' group') Ball Town还支持时间序列的差异分析,使用如下
pData(bg)-data.frame(
pData(bg),
时间=rep(1:10,2)
)
结果-stattest(bg,
特征='抄本',
meas='FPKM ',
协变量='时间',
时间进程=真
)只需添加时间课程=真。ball loat还支持自定义方差分析模型。
这就是如何用ball loat来分析上面小编分享的成绩单水平的差异。如果你恰好也有类似的疑惑,可以参考上面的分析来理解。想了解更多,请关注行业信息渠道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/80651.html