江西生物技术有限公司

生物科技 ·
首页 / 资讯 / 基因测序的六步拆解:从样本到数据报告

基因测序的六步拆解:从样本到数据报告

生物科技 基因测序步骤详解 发布:2026-05-14

基因测序的六步拆解:从样本到数据报告

拿到一份基因测序报告,很多人只关心最后几行结论,却不知道从唾液或血液样本到最终结果,中间经历了一整套精密流程。基因测序步骤并非单一操作,而是由样本处理、文库构建、上机测序和数据分析等多个环节串联而成。任何一个环节的偏差,都会直接影响检测结果的准确性。下面按实际实验流程,逐一拆解每一个关键步骤。

样本采集与核酸提取

测序的第一步从样本开始。常见的样本类型包括外周血、唾液、组织切片或口腔拭子。不同样本对采集管和保存条件有不同要求——血液样本通常使用EDTA抗凝管,唾液则需要专用保存液来抑制核酸降解。样本采集后应尽快进入提取流程,避免反复冻融。核酸提取的核心目标是获得足够纯度和完整度的DNA或RNA。目前主流方法包括磁珠法和柱式纯化法,前者适合自动化批量处理,后者在小样本量时更为经济。提取完成后需要检测浓度和纯度,OD260/280比值在1.8到2.0之间才符合建库标准。

文库构建:给DNA加上标签

提取到的核酸并不能直接上机测序,必须经过文库构建。这个过程相当于给DNA片段加上接头和索引序列,让测序仪能够识别每一条片段来自哪个样本。具体步骤包括DNA片段化、末端修复、加A尾、连接接头和PCR扩增。片段化方式有超声打断和酶切打断两种,超声打断的随机性更好,但设备成本高;酶切法操作简便,适合高通量场景。连接接头这一步至关重要,接头序列的设计直接决定了测序读长和数据分析时的比对效率。PCR扩增环节需要控制循环数,过度扩增会引入偏好性,导致后续定量失真。

文库质控与定量

建好的文库不能直接上机,必须经过严格的质控。首先用毛细管电泳或生物分析仪检测文库片段大小分布,理想的文库应该呈现一个尖锐的单峰,没有明显的拖尾或杂峰。如果出现双峰或宽峰,说明片段化不均匀或存在引物二聚体污染,需要重新纯化。接下来进行定量,常用的方法包括Qubit荧光定量和qPCR绝对定量。Qubit只能给出总核酸浓度,无法区分有效文库和残留接头,因此qPCR定量更准确。定量结果用于计算上机时的文库混合比例,多个样本混合测序时,每个文库的摩尔浓度必须精确配平,否则低丰度样本的测序深度会严重不足。

上机测序:化学反应与光学检测

文库准备就绪后进入测序仪操作环节。以目前最主流的边合成边测序技术为例,流程大致如下:文库被加载到流动槽上,通过桥式PCR在芯片表面形成克隆簇。测序试剂中含有四种荧光标记的核苷酸,每次只添加一个碱基,合成完成后用激光激发荧光信号,相机采集图像。每次循环切除荧光基团和终止基团,进入下一轮合成。测序运行时间取决于读长和芯片规格,一个全流程通常需要12到48小时。运行过程中需要实时监控各项参数,包括簇密度、荧光信号强度和质量分数。簇密度过低会导致数据产出不足,过高则会引起簇重叠,信号无法区分。理想簇密度通常控制在每平方毫米700到900个簇。

数据产出与碱基识别

测序仪采集到的原始图像数据需要经过碱基识别软件转换为序列文件。这一步骤包括图像定位、信号提取、质量打分和碱基判定。每个碱基附带一个质量值,用Q分数表示,Q30代表错误率千分之一。行业通行的标准是Q30比例不低于80%,低于这个阈值的数据需要谨慎使用。碱基识别完成后,输出FASTQ格式文件,其中包含序列信息以及每个碱基对应的质量值。这个文件是后续所有生物信息分析的基础。数据量以吉碱基为单位,一个全基因组测序通常需要90到120吉碱基的原始数据,而靶向测序则只需1到5吉碱基。

生物信息分析:从序列到变异解读

原始序列数据不能直接用于临床判断,必须经过复杂的生物信息学分析流程。第一步是数据质控,去除低质量序列和接头污染。第二步是序列比对,将干净的序列比对到参考基因组上。比对软件的选择会影响速度和准确率,BWA是短序列比对的主流工具,而针对长读长数据则需要minimap2。比对完成后进行变异检测,包括单核苷酸变异、插入缺失、结构变异和拷贝数变异。每个变异位点需要过滤掉测序深度过低、比对质量差或存在链偏倚的假阳性结果。最后一步是变异注释,结合公共数据库和临床知识库,判断每个变异的致病性和临床意义。这一步极其依赖数据库的更新频率和注释规则的严谨性,不同分析流程对同一个变异的解读可能截然不同。

报告解读与结果验证

分析完成后生成一份可读的检测报告,但报告上的每一个阳性位点都建议经过Sanger测序或数字PCR验证后再用于临床决策。尤其是低频变异和嵌合体变异,测序过程中的系统误差可能导致假阳性。验证实验的引物设计必须避开已知的SNP位点,PCR扩增条件也需要针对不同GC含量进行优化。验证通过后,结合患者的临床表现和家族史,才能给出最终的解读意见。整个基因测序步骤环环相扣,从样本采集到报告出具,任何一个环节出现疏漏,都会让后续的所有努力失去意义。

本文由 江西生物技术有限公司 整理发布。