选择适合的基因组分析方法需综合考虑研究目标、样本类型、数据需求、成本预算及技术特性等因素。以下是系统性的选择策略和关键考量点:
-
目标:探索基因功能、调控机制、进化关系等。
-
方法选择:
-
全基因组测序(WGS):适用于物种从头组装、结构变异(SV)分析(如染色体易位)。
-
转录组测序(RNA-seq):研究基因表达差异、可变剪切(如发育阶段基因调控)。
-
表观基因组技术:如 ChIP-seq(转录因子结合位点)、ATAC-seq(染色质开放性)。
-
案例:研究某转录因子在癌症中的调控网络,可结合 ChIP-seq(定位结合位点)和 RNA-seq(分析下游基因表达)。
-
目标:致病基因鉴定、肿瘤分型、用药指导等。
-
方法选择:
-
靶向测序(基因 Panel):已知疾病相关基因(如癌症驱动基因 Panel),成本低且高效。
-
全外显子测序(WES):针对罕见病或未知致病基因的单基因病(如遗传性心血管病)。
-
全基因组测序(WGS):复杂疾病(如糖尿病多基因互作)或肿瘤基因组进化研究。
-
液体活检(ctDNA 测序):肿瘤疗效监测、耐药突变追踪。
-
案例:疑似遗传性乳腺癌患者,优先选择 BRCA1/2 靶向测序;若未发现突变,再考虑 WES 扩展检测范围。
-
目标:筛选优良性状相关基因(如作物抗逆性、畜禽生长速度)。
-
方法选择:
-
简化基因组测序(RAD-seq):降低基因组复杂度,快速定位 SNP/CNV 与表型关联(适用于非模式生物)。
-
GWAS(全基因组关联分析):基于 SNP 芯片或 WGS,扫描群体水平的性状相关位点。
-
组织 / 细胞:新鲜冰冻组织(适合 WGS/WES)、FFPE(福尔马林固定石蜡包埋,需注意 DNA 降解)。
-
体液:血液(用于 ctDNA 肿瘤监测)、唾液(无创采集,适用于群体筛查)。
-
微生物 / 病毒:宏基因组测序(如肠道菌群与疾病关联)、病毒全基因组测序(如新冠病毒变异监测)。
-
DNA/RNA 完整性:
-
WGS/WES:DNA 浓度≥10 ng/μL,片段长度≥100 bp(可通过 Qubit 定量、Agilent Bioanalyzer 评估)。
-
RNA-seq:RNA 纯度(OD260/280≈2.0)、完整性(RIN 值≥7)。
-
特殊处理:
-
肿瘤样本需评估肿瘤细胞含量(≥20%),避免正常细胞污染掩盖突变信号。
方法 |
测序深度 |
检测变异类型 |
成本(人类样本) |
适用场景 |
靶向测序 |
500-1000× |
SNV/Indel(高灵敏度) |
$100-$500 |
已知基因的高频突变检测 |
WES |
100-200× |
外显子区 SNV/Indel/CNV |
$500-$1500 |
单基因病致病基因筛查 |
WGS |
30-60× |
全基因组 SNV/Indel/SV/CNV |
$1000-$3000 |
复杂疾病、结构变异、肿瘤全景 |
RNA-seq |
20-30 M reads |
基因表达、融合基因、剪切体 |
$300-$800 |
转录调控、肿瘤融合基因检测 |
-
优先考虑靶向测序:若已有明确候选基因(如家族性疾病已知致病基因),避免全基因组测序的冗余成本。
-
梯度策略:先用低成本方法(如 SNP 芯片)进行初筛,再对阳性结果用高分辨率技术(如 WGS)验证。
-
例:群体遗传病筛查中,先用芯片扫描常见致病 SNP,阳性样本再行 WES 确认。
-
单基因病:聚焦 SNV/Indel,优先用 WES+Sanger 验证(如囊性纤维化 CFTR 基因)。
-
肿瘤:需检测 SNV(驱动突变)、CNV(扩增 / 缺失)、SV(融合基因,如 ALK 重排),WGS 或全转录组测序更全面。
-
复杂疾病:多基因 + 环境因素,需 GWAS(SNP 芯片)或 WGS 结合生存分析、代谢组学数据。
-
已知变异:使用靶向测序 + 公共数据库(如 ClinVar、COSMIC)快速注释。
-
未知变异:WGS/WES 结合 de novo 突变分析(如 GATK 流程),需高性能计算资源。
-
诊断时效性:急诊遗传病诊断需选择快速测序(如 24 小时周转的 WES)。
-
可干预性:若检测结果无临床指导意义(如迟发性遗传病且无治疗手段),需谨慎选择全基因组检测,避免心理负担。
-
遗传咨询:涉及致病突变(如 BRCA1)或意外发现(如癌症风险基因)时,需提前安排遗传咨询师介入。
-
数据安全:全基因组数据包含大量隐私信息,需符合 GDPR 等法规,避免泄露。
-
目标导向:从科学问题反推技术,避免 “为了测序而测序”。
-
经济性:先用低通量技术初筛,再用高通量技术验证,降低成本。
-
动态调整:若初步结果未达预期,可升级方法(如从 Panel 转向 WGS)。
-
跨学科合作:基因组分析需结合生物信息学、临床 / 基础研究团队,确保技术选择与解读的科学性。
通过系统化评估上述因素,可最大化基因组分析的效率与价值,避免资源浪费或结果偏差。