Skip to content

处理宏基因组数据 #71

@ChenZx1234

Description

@ChenZx1234

请教大家,我刚入门处理宏基因组数据,我的数据来源于华大测序平台,按照BGI|Dr.Tom手册(https://biosys.bgi.com/help/metagenomics/analytic/1-2-general-filter.html)中质控这里的描述:

SOAPnuke 对原始数据过滤的具体步骤如下:

剔除含有 1% 不确定碱基(N 碱基)的 read
剔除含有测序接头序列的 read
剔除含有 50% 以上的低质量碱基(Q ≤ 20 的碱基)的 read
对于宿主环境来源的样品,为了降低宿主序列对后续分析的干扰,需要使用 Bowtie2 软件比对宿主序列,然后过滤掉比对上宿主基因组的序列(若样本来源为人、小鼠或大鼠,会根据来源直接过滤,否则需要提供宿主序列)

软件 版本 默认命令
SOAPnuke  2.3 SOAPnuke filter -l 20 -q 0.5 -n 0.01 -d -Q 2 -5 0 --adaMis 0.3
Bowtie2  2.4.4 使用软件默认参数

我先使用SOAPnuke进行质控,这里的参数并没有提及接头序列去除,那是否应该在SOAPnuke filter -l 20 -q 0.5 -n 0.01 -d -Q 2 -5 0 --adaMis 0.3基础上加上接头序列去除这一串参数,此外是否也可以使用filterMeta这个进行宏基因组数据质控?并且我也没有看到2.3版本的软件下载位置

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions