需先定义 “高质量数据” 的标准,针对心血管场景,核心维度包括:
-
准确性:数据真实反映患者状态(如心电图波形未因设备故障失真,超声测量值与实际解剖一致);
-
完整性:关键信息无缺失(如心梗患者需包含发病时间、肌钙蛋白峰值、冠脉造影结果,缺一则无法验证 AI 的诊断时效性);
-
一致性:数据格式、术语、单位统一(如血压记录需统一为 “mmHg”,而非 “kPa” 与 “mmHg” 混用);
-
代表性:覆盖多样化人群与场景(如包含基层医院的低质量心电、合并多系统疾病的复杂病例);
-
标注可靠性:专业标注且无歧义(如房颤心电图的标注需明确 “阵发性”“持续性”,而非笼统标注 “房颤”)。
心血管数据的采集过程易受设备、操作、环境影响(如超声图像质量依赖医师扫查手法),需通过标准化流程减少 “采集偏倚”。
-
标准化采集规范,适配心血管专科特性
-
设备校准与统一:
-
心电设备:统一采样频率(如 1000Hz)、滤波参数(避免肌电干扰或工频干扰),定期校准(每 3 个月验证心电图机的标准波形输出,如标准 1mV 电压对应 10mm 振幅);
-
影像设备:心脏超声需记录设备型号(如 GE Vivid E95、迈瑞 Resona 7)、探头频率(经胸探头 2-5MHz),并标注扫查切面(如胸骨旁长轴、心尖四腔心),确保不同设备的图像可对比;
-
生理信号:动态血压监测需统一测量间隔(白天每 30 分钟、夜间每 60 分钟),避免因间隔不同导致数据不可比。
-
操作流程标准化:
-
针对冠脉造影,需规定造影体位(如左冠常规取 LAO 45°+CRA 30°,右冠取 RAO 30°),确保关键血管段(如左前降支近段)无遮挡;
-
临床数据采集需使用结构化模板(如心衰患者入院记录需包含 “NYHA 分级、6 分钟步行距离、BNP 值” 必填项),避免自由文本导致的信息遗漏。
-
记录 “元数据”,追溯数据可靠性
元数据(描述数据的数据)是判断数据质量的 “溯源凭证”,需强制记录:
-
设备信息:型号、序列号、校准时间(如某超声图像的元数据显示 “探头未校准”,则该数据需排除);
-
操作信息:操作者资质(如心电图由护士 vs 医师操作)、操作时间(如心梗患者的首份心电图是否在发病 1 小时内完成);
-
环境信息:采集时患者状态(如是否躁动导致心电伪影)、环境干扰(如 ICU 监护仪电磁干扰影响心电信号)。
心血管数据的标注(如影像病变定位、诊断结论)是 AI 验证的 “金标准”,需突破 “标注随意性” 和 “专业壁垒” 问题。
-
建立 “多层级专业标注体系”
-
标注团队资质准入:标注人员需具备心血管专科背景(如心电图标注需主治医师以上资质,冠脉影像标注需有 5 年以上介入经验的医师);
-
标注内容结构化:避免模糊表述,例如:
-
房颤标注需包含 “类型(阵发性 / 持续性 / 长程持续性)、心室率(静息时 bpm)、是否合并预激”;
-
左心室功能标注需明确 “EF 值(Simpson 法)、左心室舒张末期容积(LVEDV)、室壁运动评分(17 节段法)”;
-
多专家共识标注:对复杂病例(如遗传性心肌病、复杂冠脉畸形)采用 “3+1” 标注模式 ——3 名专科医师独立标注,若分歧率>20%,则由 1 名资深专家(主任医师)仲裁,确保标注一致性(Kappa 系数≥0.85,即 “几乎完全一致”)。
-
标注质量的量化评估与反馈
-
随机抽取 10% 标注数据进行 “盲审”(由未参与初始标注的专家审核),计算 “标注错误率”(如将 “房扑” 误标为 “房颤” 的比例需<5%);
-
对影像标注,通过 “标注重合度” 评估(如两名医师标注的心肌梗死区域重合率需≥90%),低重合度数据需重新标注。
临床数据常存在缺失、错误、格式混乱(如手写病历的潦草记录),需针对性清洗,尤其注意心血管数据的特殊性。
-
针对性处理缺失数据,避免 “假阴性”
心血管数据缺失具有场景依赖性(如急诊患者可能来不及做完整检查),需分类处理:
-
关键信息缺失:如心梗患者缺失 “肌钙蛋白值” 或 “发病时间”,直接排除(此类数据无法验证 AI 的诊断灵敏度);
-
非关键信息缺失:如高血压患者缺失 “职业” 信息,通过 “多重插补法” 补充(基于同年龄、同血压水平人群的职业分布推算);
-
缺失模式分析:若某类数据(如基层医院的超声 EF 值)缺失率>30%,需记录缺失原因(设备不足 / 操作不规范),并在验证报告中说明,避免模型对该类场景的 “隐性偏倚”。
-
规范化处理,消除 “格式噪声”
-
术语标准化:映射至权威术语体系,如:
-
诊断术语统一采用《国际疾病分类(ICD-11)》(如 “急性 ST 段抬高型心梗” 对应 ICD-11 编码 BA41.0);
-
药物名称统一采用 “通用名”(如 “阿司匹林” 而非 “拜阿司匹灵”);
-
单位与格式统一:如血压(mmHg)、血脂(mmol/L)、体重(kg),日期统一为 “年 - 月 - 日”(避免 “月 / 日 / 年” 与 “日 / 月 / 年” 混淆);
-
去重与纠错:通过患者唯一标识(如身份证号哈希值)排查重复数据,删除 “逻辑矛盾数据”(如 “EF 值 20% 却无心力衰竭症状” 的明显错误)。
AI 临床验证需证明模型在 “真实世界” 中有效,而非仅在 “完美数据”(如三甲医院的高清影像、典型病例)中表现优异,因此需强化数据的 “场景覆盖度”。
-
覆盖多样化人群,打破 “人口学偏倚”
-
年龄:包含<18 岁(先天性心脏病)、18-40 岁(青年心梗)、40-75 岁(高发人群)、>75 岁(老年心衰,合并多器官功能不全);
-
疾病谱:不仅包含常见病(高血压、冠心病),还需纳入罕见病(如致心律失常性右室心肌病、左心发育不全综合征),占比≥5%;
-
合并症:包含 “心血管 + 多系统疾病” 患者(如心衰 + 慢性肾病 + 糖尿病,占比≥30%),验证 AI 在复杂共病场景下的决策能力。
-
纳入 “非理想数据”,模拟真实临床场景
-
低质量数据:基层医院的 “噪声心电”(运动伪影、电极接触不良)、设备老旧的超声图像(分辨率低、伪影多)、不完整病历(如社区医院的手写记录,关键信息遗漏);
-
动态场景数据:急诊抢救中的 “碎片化数据”(如 120 转运途中的 3 导联心电、床旁快速超声)、慢病管理中的 “长期随访数据”(如患者居家自测的血压波动记录,存在漏测)。
-
多中心数据整合,避免 “中心特异性偏倚”
联合不同级别医疗机构(三甲医院 5-8 家、地市级医院 10-15 家、基层医院 20-30 家)和不同区域(如北方高血压高发区、西南风湿性心脏病高发区),确保数据不局限于单一中心的诊疗特色(如某医院擅长复杂 PCI,数据中重症病例占比过高)。
数据质量不仅指 “技术层面”,还包括 “伦理与合规层面”,否则即使数据准确,也无法用于临床验证(如侵犯患者隐私)。
-
全流程隐私保护,符合监管要求
-
数据脱敏:通过 “去标识化” 去除直接标识符(姓名、身份证号),对间接标识符(年龄 + 性别 + 疾病,可能唯一标识个体)进行 “泛化处理”(如年龄分组为 “50-60 岁” 而非 “55 岁”);
-
权限管控:采用 “最小权限原则”,仅允许验证团队中必要人员访问数据,操作留痕(记录 “谁、何时、访问了哪些数据”);
-
合规认证:符合《医疗数据安全指南》《个人信息保护法》,通过国家健康医疗大数据标准符合性测试。
-
数据溯源与可审计
建立 “数据全生命周期台账”,记录数据来源(医院名称、科室)、采集时间、标注人员、清洗过程、使用记录,确保可追溯(如监管机构抽查时,能完整还原数据的流转路径)。
数据质量不是 “一次性达标”,而是持续优化的过程,需通过系统化机制监控与改进。
-
成立专职数据质控团队
团队包含:心血管医师(负责临床合理性判断)、医学数据分析师(负责数据清洗与标准化)、AI 工程师(负责数据与模型的适配性)、伦理专家(负责隐私合规),定期(每月)召开质控会议,分析数据问题(如近期影像标注错误率上升)并整改。
-
引入第三方审计
邀请独立于验证团队的机构(如国家心血管病中心、第三方医疗数据评估机构)对数据质量进行 “盲评”,出具《数据质量评估报告》,作为监管机构(如 NMPA、FDA)审批的依据。
-
动态更新数据,避免 “模型老化”
随着诊疗技术发展(如新型心衰药物 ARNI 的普及)、疾病谱变化(如新冠后心肌炎病例增加),需每 6-12 个月补充新数据,确保验证数据与当前临床实践同步。
保证 AI 心血管内科临床验证的数据质量,需从 “采集标准化、标注专业化、清洗精准化、人群多样化、合规严格化” 五个维度构建体系,核心是让数据 “真实反映临床场景、准确支撑模型验证、全面覆盖应用需求”。只有基于高质量数据的验证,才能让 AI 工具真正通过 “临床考验”,从 “实验室” 走向 “病床边”,成为心血管医生可信赖的辅助力量。