-
Notifications
You must be signed in to change notification settings - Fork 29
Open
Description
请教大家,我刚入门处理宏基因组数据,我的数据来源于华大测序平台,按照BGI|Dr.Tom手册(https://biosys.bgi.com/help/metagenomics/analytic/1-2-general-filter.html)中质控这里的描述:
SOAPnuke 对原始数据过滤的具体步骤如下:
剔除含有 1% 不确定碱基(N 碱基)的 read
剔除含有测序接头序列的 read
剔除含有 50% 以上的低质量碱基(Q ≤ 20 的碱基)的 read
对于宿主环境来源的样品,为了降低宿主序列对后续分析的干扰,需要使用 Bowtie2 软件比对宿主序列,然后过滤掉比对上宿主基因组的序列(若样本来源为人、小鼠或大鼠,会根据来源直接过滤,否则需要提供宿主序列)
| 软件 | 版本 | 默认命令 |
|---|---|---|
| SOAPnuke | 2.3 | SOAPnuke filter -l 20 -q 0.5 -n 0.01 -d -Q 2 -5 0 --adaMis 0.3 |
| Bowtie2 | 2.4.4 | 使用软件默认参数 |
我先使用SOAPnuke进行质控,这里的参数并没有提及接头序列去除,那是否应该在SOAPnuke filter -l 20 -q 0.5 -n 0.01 -d -Q 2 -5 0 --adaMis 0.3基础上加上接头序列去除这一串参数,此外是否也可以使用filterMeta这个进行宏基因组数据质控?并且我也没有看到2.3版本的软件下载位置
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels