王英珍

不积硅步,无以至千里;不积小流,无以成江河

MIXCR比对率较低的原因查找

27 Nov 2017 »

TCR MIXCR

某次TCR数据的比对率较低(仅有20%左右),查了下日志,发现主要原因是比对后得分较低;

exportAlignmentsPretty命令去跟踪比对文件(默认J区打分阈值为40,下图为跟踪到align sucess的reads):
mixcr exportAlignmentsPretty input.vdjca(或加-v参数,输出另外一种更加详细的比对格式)

设置J区打分阈值为5(-OjParameters.parameters.absoluteMinScore=5,跟踪reads 图片

发现read2,read4等在阈值为40的时候被droped掉了.

疑问?
对于Read id 4来说,虽然 Target0 align TRBJ2-7*00 score is 15<40;但是 score of Target1 is 96 (>40). 为什么还会被过滤掉? Read id 2,Read id 5等也是同样的情况?于是发邮件咨询了mixcr团队,得到了以下答复。

总结一下主要是因为:

  1. 如果两条reads只有一条成功比对上(read1,TRBJ2-7*00),read2就对该基因(TRBJ2-7*00)执行严格的算法比对;而absoluteMinScore这个参数就是设定read2比对的阈值;Read id 4因为read1的比对得分低(15<40)而被过滤掉;
  2. 对于pair-end,其中一条read必须同时跨越V区和J区;否则会被过滤掉。

因此认为,本次比对率较低主要是由于,测序读长较短(之前的都是MINISEQ,PE150;而本次采用的是HISEQ400,PE75)所导致的。

另外对于minSumScore参数,mixcr团队也给了解释:

SumScore= read1 Vgene score + read2 Vgene score + (the same of Jgene)
if you set includeDScore=true and includeCScore=true, this formula will include D and C genes as well.


Author: 王英珍
qq: 296085360
email:wangyingzhen91@163.com