这类数据用于验证 AI 模型在不同人群中的适用性,避免因 “训练数据偏倚” 导致模型仅对特定群体有效(如仅适用于年轻患者或典型病例)。
-
人口学与基础信息
-
核心数据:年龄(覆盖全年龄段,尤其需包含≥75 岁老年患者和<40 岁青年发病群体)、性别(女性心血管疾病症状常不典型,需占比≥40%)、种族 / 民族(如藏族高血压患病率高、维吾尔族冠心病遗传特征不同)、体重指数(BMI)、吸烟史(年数、是否戒烟)、饮酒史(频率、酒量)、职业(体力 / 脑力劳动,影响活动量)。
-
作用:验证 AI 模型是否受人口学特征影响(如是否对女性房颤的识别灵敏度低于男性),确保在多样化人群中稳定发挥作用。
-
基础疾病与合并症数据
-
核心数据:高血压(病程、最高血压、降压药使用史)、糖尿病(类型、糖化血红蛋白 HbA1c、是否合并糖尿病肾病)、高脂血症(LDL-C、HDL-C 水平、他汀类药物使用情况)、慢性肾病(eGFR 分期、蛋白尿)、甲状腺疾病(甲亢 / 甲减,影响心率和房颤风险)、风湿免疫疾病(如系统性红斑狼疮,可能导致心包炎或冠脉病变)。
-
作用:心血管疾病常与多系统疾病共存(如心衰合并慢性肾病占比达 30%),需验证 AI 在复杂合并症场景下的决策准确性(如 AI 推荐的抗凝药是否考虑肾功能不全导致的出血风险)。
这类数据是 AI 诊断 / 评估模型的核心验证依据,需覆盖心血管疾病的主要检查类型,且体现数据的 “真实性”(如包含质量不佳的临床常见数据)。
-
心电与电生理数据
-
静态心电图:12 导联标准心电图(需包含正常、房颤、心梗、房室传导阻滞等典型与非典型波形)、异常心电图(如 Brugada 综合征的特征性 ST 段抬高、长 QT 综合征的 QT 间期延长),同时需包含 “伪差数据”(如肌肉震颤、电极接触不良导致的干扰,模拟临床常见的低质量心电信号)。
-
动态心电:24 小时 Holter 数据(记录日常活动中的心律失常,如阵发性房颤、无症状心肌缺血)、事件性心电(记录晕厥发作时的心律变化)。
-
作用:验证 AI 对各类心律失常、心肌缺血的识别灵敏度(如对 “无症状心肌缺血” 的 ST-T 段改变是否漏诊),以及在噪声干扰下的稳定性。
-
影像数据
-
心脏超声:经胸超声(TTE)和经食道超声(TEE)图像,包含不同设备(飞利浦、GE、迈瑞等)、不同操作者的扫查结果(避免 “设备 / 操作偏倚”),需覆盖左心室扩大、室壁瘤、瓣膜反流(轻 / 中 / 重度)、先天性心脏病(如房间隔缺损)等结构异常。
-
冠脉影像:冠脉 CTA(需包含钙化斑块、非钙化斑块、混合斑块,以及不同狭窄程度:<50%、50%-70%、>70%)、冠脉造影(记录病变位置、分叉 / 慢性闭塞病变等复杂情况)、OCT(光学相干断层成像,评估斑块纤维帽厚度等易损特征)。
-
心脏 MRI:延迟增强影像(识别心肌纤维化区域,如心肌病或心梗后瘢痕)、灌注成像(评估心肌血流储备)。
-
作用:验证 AI 对心脏结构、功能及冠脉病变的量化准确性(如 AI 测量的左心室射血分数是否与人工金标准一致),以及对复杂影像(如严重钙化的冠脉 CTA)的处理能力。
-
实验室与功能学检查数据
-
生化指标:心肌酶谱(肌钙蛋白 I/T、CK-MB,用于心梗诊断)、BNP/NT-proBNP(心衰标志物,需覆盖不同浓度:<100pg/ml、100-400pg/ml、>400pg/ml)、血脂(LDL-C、HDL-C、甘油三酯)、肝肾功能(ALT、肌酐、eGFR)、电解质(血钾、血钠,影响心衰用药)。
-
功能学指标:运动负荷试验数据(运动时长、最大心率、ST 段压低程度)、冠脉血流储备分数(FFR,评估冠脉狭窄的功能性意义)、无创血压动态监测(24 小时血压波动,识别隐匿性高血压)。
-
作用:验证 AI 对 “影像 + 实验室指标” 联合分析的能力(如结合 BNP 和超声 EF 值判断心衰类型),以及对功能学意义的解读(如 AI 是否能区分 “解剖狭窄但无功能意义” 的冠脉病变)。
AI 的临床价值不仅在于诊断,更在于指导治疗和预测预后,因此需要治疗方案、干预过程及长期结局数据,验证其是否能改善临床结果。
-
治疗方案数据
-
药物治疗:具体用药(如房颤患者的华法林 / 达比加群,心衰患者的 ACEI/ARB/ARNI)、剂量调整记录(如 β 受体阻滞剂从 1/4 剂量逐步滴定至目标剂量)、用药依从性(是否漏服)、药物不良反应(如服用他汀后的肌痛、抗凝药导致的出血)。
-
手术 / 介入治疗:PCI(支架类型、数量、植入位置,是否出现夹层 / 血栓)、心脏瓣膜置换 / 修复(生物瓣 vs 机械瓣,术后抗凝方案)、心脏再同步化治疗(CRT,术前术后 QRS 波宽度变化)。
-
作用:验证 AI 推荐治疗方案的合理性(如 AI 是否会为肾功能不全患者推荐不适合的抗凝药),以及方案调整的有效性(如 AI 指导的药物剂量滴定是否更快达标)。
-
随访与预后数据
-
短期结局:术后 24 小时并发症(如 PCI 后的穿刺部位血肿、心衰患者的容量负荷过重)、30 天主要不良心血管事件(MACE:心梗、卒中、心血管死亡)。
-
长期结局:1 年 / 3 年 / 5 年随访数据,包括再入院率(如心衰患者 1 年内再入院次数)、疾病进展(如房颤是否进展为永久性房颤)、生活质量评分(如 NYHA 心功能分级、6 分钟步行试验距离)。
-
作用:验证 AI 预后预测的准确性(如 AI 预测的 “高风险人群” 是否真的有更高的 MACE 发生率),以及 AI 干预是否能降低不良结局风险(如 AI 指导的康复计划是否减少再入院)。
临床验证需避免 AI 仅在 “完美数据”(如高质量影像、完整病历)中有效,需纳入多模态整合数据和真实世界中的 “非理想数据”。
-
多模态整合数据
-
核心数据:同一患者的 “心电图 + 超声 + 冠脉 CTA + 实验室指标 + 基因数据” 的关联数据(如肥厚型心肌病患者的超声心肌厚度 + MYH7 基因突变 + 动态心电图)。
-
作用:验证 AI 对多源信息的整合能力(如结合影像形态与基因特征判断心肌病类型),避免单一数据导致的片面决策。
-
真实世界 “非理想数据”
-
核心数据:基层医院的低质量影像(如超声探头老化导致的模糊图像)、不完整病历(如缺失部分实验室检查)、非标准化报告(如手写病历的潦草记录)、合并多种基础病的复杂病例(如心衰 + 糖尿病 + 终末期肾病)。
-
作用:模拟真实临床场景(尤其基层医疗资源有限的情况),验证 AI 在数据不完整、质量不佳时的稳定性(如是否会因部分数据缺失而输出错误结果)。
-
标注准确性:所有数据需经至少 2 名副主任以上医师审核标注(如心电图的诊断结果、影像的病变位置),避免错误标注影响验证;
-
隐私合规:数据需脱敏处理(去除姓名、身份证号等标识信息),符合《个人信息保护法》和《医疗数据安全指南》;
-
可及性:通过数据联盟(如国家心血管病中心数据平台)实现多中心数据共享,避免单一中心数据的局限性。
AI 在心血管内科的临床验证数据需覆盖 **“患者特征 - 诊断信息 - 治疗过程 - 长期结局” 全链条 **,并体现 “多样性”(不同人群、疾病类型)、“真实性”(非理想数据、真实世界场景)和 “关联性”(多模态整合)。只有基于这类数据的验证,才能确保 AI 模型不仅在技术指标上达标,更能真正解决临床痛点,成为可靠的临床工具