QC参数的解读诠释
探索精准医疗的幕后英雄,迪赢生物公众号为您提供专业洞见。高通量测序技术,如NGS,以其经济高效的特点分析20+靶点,然而海量数据和较低的准确性呼唤着质量控制流程的构建。让我们一起解读这些关键的QC参数,它们如同测序的导航灯塔:
Q值:</每个碱基的信任度标签,Q值越高,识别的准确性就越可靠,通常以Q20和Q30为评价标准。
Clean Data得率:</过滤杂质后,优质数据的比例,它预示着实际分析的数据量和测序深度的潜力。
Mapping Rate:</Clean Data与基因组精确匹配的比例,高值意味着污染程度低,测序结果更可靠。
Duplication Rate:</冗余Reads的占比,过高可能影响结果的精确度,需要合理控制。
On Target Rate:</目标区域的有效覆盖率,评估实验特异性,有助于降低成本并提高实验效率。
Uniformity:</测序数据的均匀分布,衡量覆盖的均衡性,均匀性越好,覆盖效果越佳。
理想情况下,测序的均一性和深度是金科玉律。均一性以方差和特定深度占比(如0.2倍平均深度区占比和Fold-80)衡量,保证了数据质量。测序覆盖率,即测得的区域比例,越高说明遗漏的信息越少。深度的提升可通过多次测序来优化,平均深度则反映了不同检测类型的需求差异,如Germline/WES/WES的深度要求。
在变异检测中,覆盖度是决定性的,它揭示了变异的可见性;均一性确保了结果的准确性,绝对深度至关重要;而捕获效率则关乎数据的利用效率,经济性则由这三个因素和冗余Reads共同塑造。在最理想的状态下,我们期待用最少的数据量,捕捉到最精确的变异信息。
图4以直观的方式展示了这些关键指标的关联和影响,帮助我们理解测序过程中的每一步骤。