这篇文章向你展示了如何使用plink来分析连锁不平衡。内容简洁易懂。它一定会让你的眼睛发光。希望通过这篇文章的详细介绍,你能有所收获。
Plink是连锁不平衡分析的常用工具之一。它需要两个基本输入文件,后缀分别是ped和map。Ped文件格式在之前的文章中已经详细介绍过了,这里只介绍地图文件。
地图文件主要存储SNP位点的名称和位置信息,内容如下
1snp101
1snp202有4列,每行代表一个snp位点,第一列代表SNP位点所在染色体的名称,第二列代表SNP位点的ID,通常为rs数或用户自定义的ID;第三列代表SNP基因座的遗传距离,如果没有实际值,可以填0;第四列代表染色体上SNP位点的位置。
Plink可以通过以下两种方式执行LD分析:
1. 分析指定的两个SNP位点
订单如下
Plink-filetest-L DSN P1 SNP 2将在日志信息中输出LD分析的结果
ldinformationfornppair[SNP 1 SNP 2]
R-sq=0.009D'=0.163
单体型频率预期基础
-
AG0.1160.139
CG0.3000.278
AT0.2170.194
CT0.3660.389
同相平行创建/重心
分析完成: Satjun 2311:48:352018给出了R2和D’两个值,也给出了不同单倍型的频率。
00-1010命令如下:
plink - filetest - r
Plink - filetest - r2 - r r2-R将直接输出所有LD分析的结果,而- r2将根据R2值过滤结果。在实际分析中,SNP位点的数量非常多,如果不过滤,结果文件会非常大。过滤参数如下
-LD-窗口
默认值为10,限制了一个SNP位点和10个其他SNP位点用于LD分析的最大数量。
- ld-window-kb
默认值为1Mb,只分析1Mb以内的SNP位点。
-LD-窗口-r2
此参数只能与- r2参数结合使用。默认值为0.2。对输出结果进行过滤,只输出R2大于该参数值的LD分析结果。
该文件给出了单核苷酸多态性位点之间的R值或R2值,示例如下
CHR_ABP_ASNP_ACHR_BBP_BSNP_BR
1 SNP 11snp112snp2-0.108465通过指定-LD-SNP参数,还可以只分析一个SNP位点与其他位点的连锁关系。用法如下
plink-file test-R2-LD-SNP P1-LD-Window-KB 1000-LD-Window 99999-LD-Window-R20各有千秋。第一种方法会给出D’和R2两个值,而第二种方法只会给出R值。第一种方法一次只能分析两个SNP位点之间的连锁,第二种方法一次只能分析多个SNP位点之间的连锁。
以上内容是如何使用plink进行连锁不平衡分析。你学到什么知识或技能了吗?如果你想学习更多的技能或丰富你的知识,请关注行业信息渠道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/80649.html