使用 Geneious Prime 从平铺扩增子 Illumina 测序中组装 SARS-CoV-2 基因组 希拉里·米勒(Hilary Miller)2020年11月29日20:30 介绍 平铺扩增子 RT-PCR 然后使用 Illumina 或牛津纳米孔技术进行测序是生成 SARS-CoV-2 全基因组序列的最流行方法。 使用平铺扩增子测序允许组装具有低病毒基因组拷贝数或降解 RNA 的样本,但需要对标准 NGS 组装协议进行一些修改。 本文概述了从 Illumina 数据组装 SARS-CoV-2 序列的工作流程,包括质量修整和扩增子引物的去除、映射到参考、SNP 调用和共识生成。 The workflow requires the BBDuk plugin, this can be installed by going to Tools Plugins. 此工作流程已在来自 NCBI SRA、项目 PRJNA627229( Walker 等人,2020 年)和PRJNA622817( Paden 等人,2020 年)的公开可用数据集上进行了测试,并给出了与iVar 管道( Grubaugh 等人,2019 年)和用于 Illumina 多重 PCR的 CDC 分析管道。 1 扩增子引物序列的质量修整和去除。 在组装之前,去除劣质碱基和用于生成平铺扩增子的 PCR 引物非常重要。 如果基因组中的引物结合位点包含与引物的错配,如果在组装和变异调用之前未去除引物序列,则这些区域中的变异可能会被遗漏。 带有一些修改设置的BBDuk 插件可用于在一个步骤中进行质量修整和去除扩增子引物。 对于尚未合并的配对末端序列,扩增子引物位于每个读数的 5' 末端。 在运行 BBDuk 之前,必须将测序中使用的引物序列集导入到 Geneious 中,以便可以选择这些引物进行接头修整。 从 CSV 或 TSV 文件导入 Artic 网络和其他平铺扩增子测序引物组的指南位于此链接。 将引物导入 Geneious 后,通过使用 BBDuk 进行注释和预测修剪来打开 BBDuk 。 在Adapters 下,选择包含引物序列的文件夹,并将Trim设置为 Left End。 调整Kmer 长度和最大替换设置,如下面的屏幕截图所示。 为确保仅修剪读取开始时的前向引物,请在More Options下添加以下自定义命令: rcomp=f限制左=32 要修剪低质量碱基并过滤掉短读数,请将Trim Low Quality设置为 30,并将Discard Short Reads 设置为 75 bp。 2 映射到参考 要将修剪后的读数映射到此序列,请选择修剪后的读数文件并打开“对齐/组装”按钮下的“映射到参考”。 在参考选择器中设置参考序列,将灵敏度设置为低,微调迭代次数为3。 3 共识序列生成 生成一致序列的首选方法是调用组装读取上的变体,然后将这些变体碱基应用于参考序列,而不是直接从组装中生成一致。 这确保只有具有良好覆盖深度的统计显着变体才包含在共有序列中。 要调用变体,请选择 Map 生成的重叠群组装文档进行引用,然后转到Annotate and Predict Find Variations/SNPs 。 将最小覆盖率设置为 100,并关闭最小链偏差 P 值。 如果在某些变体上保留了链偏差设置,则可能会遗漏某些变体,因为平铺扩增子方法可能导致基因组的某些部分仅被正向或反向读取覆盖。 SNP 调用完成后,保存结果,然后转到工作流程-将变体应用到参考以生成包含变体碱基的新共识序列。 进一步阅读 平铺扩增子测序和下游生物信息学分析的 Artic 网络快速指南 CDC SARS-Cov-2 测序资源 Geneious Prime 2012.1.2 及更高版本的自动化工作流程 此处描述的分析管道已组合成一个 Geneious Workflow,附在下面。 要将工作流导入 Geneious,请将其拖放到 Geneious 窗口中。 然后转到管理工作流,选择工作流并转到查看/编辑。 通过单击步骤并转到“查看/编辑”选项来打开工作流的每个步骤。 这将更新您的 Geneious 副本的选项,并使您能够从您自己的数据库中选择引物和参考序列。 要运行工作流程,请关闭“管理工作流程”窗口并选择您希望组装的 Illumina 原始读数文件。 然后单击工作流按钮并从列表中选择工作流。 Coronavirus_assembly_protocol.geneiousWorkflow (30 KB) 以上内容来自互联网,仅供中文用户参考,仍未解决?马上联系中文技术支持→→→提交难题/咨询/报错 购买正版Geneious Prime,享受随时技术支援,免费提供中文操作教程、含正规发票! 立即购买正版Geneious Prime软件(淘宝店铺)