李豹 朱腾 刘振宇 王坤 田捷
编者按:2021年12月7~10日,乳腺癌领域的年度压轴大戏——第44届美国圣安东尼奥乳腺癌研讨会(SABCS)将以虚拟会议的形式召开。我国学者开展的多项研究已入选大会报告,来自中国学者、中国研究、中国患者的数据和经验,将再一次走上国际舞台。本次SABCS大会期间,《肿瘤瞭望》特别推出“瞭望SABCS·中国研究者说”栏目,介绍相关研究成果。并将邀请部分中国研究者,阐述相关研究的意义与价值。
本期,我们邀请到中国科学院自动化研究所刘振宇研究员,请他为我们介绍其团队开展的基于影像病理组学融合的乳腺癌新辅助治疗患者pCR预测的研究。
研究背景及目的
预测乳腺癌患者接受新辅助化疗(NAC)后的病理完全缓解(pCR)对于早期患者分层和个体化治疗至关重要。磁共振成像(MRI)的影像组学特征可以从宏观尺度反映整个肿瘤信息,活检数字病理图像(WSI)的病理特征从微观尺度上反映着有关肿瘤细胞生存状况的基本信息。然而,很少有研究通过融合影像组学和病理组学信息来预测接受NAC治疗的乳腺癌患者的pCR。
研究方法
我们自2015年1月到2019年12月从3个医院共回顾性地收集了具有原发侵犯性的乳腺癌患者318例。其中广东省人民医院有175例作为主队列,佛山市第一人民医院115例和汕头市中心医院28例共143例作为外部验证队列。所有的患者均具有轴向T2WI,DWI(b值为0和800s/mm2或1000s/mm2)两个模态的MRI图像,与活检数字病理图像。
对于MRI图像的影像组学特征提取,我们首先将DWI模态转为表观扩散系数(ADC)图,并通过pyradiomics从 T2WI,ADC模态中提取定量的影像组学特征。对于病理特征,我们首先从两个尺度将WSI切成大小为 512×512(0.25 mpp)和 256×256(0.25 mpp)的切片。通过预训练的深度学习模型选择具有细胞区域的切片,并将深度学习模型最后一层卷积层的输出被提取为切片级特征。
使用词袋(BoW)方法将切片级别的特征聚合为患者级别的特征。对于pCR预测模型的构建,我们首先在主队列中使用轻量化的梯度增强模型(LGBM)分别基于单独的T2WI特征、ADC特征和病理特征构建预测pCR的单一组学模型。然后我们将上一步单一组学模型筛选的T2WI、ADC 和病理特征组合为多组学特征,并使用 LGBM 构建多组学pCR 预测模型。此外,我们将多组学特征与临床特征相结合,包括雌激素受体(ER)状态、孕激素受体(PR)状态、Ki67 指数和人表皮生长因子2(HER2)状态、肿瘤分期(cT)和淋巴结分期(cN)以获得更好的性能。
研究结果
我们选择ROC曲线的曲线下面积(AUC)作为评价指标。在单一组学结果中,该模型在病理特征中显示出最低的AUC(PC:0.787,VC:0.675),在 T2WI模态中模型具有最高的AUC(PC:0.989,VC:0.725)。将三种模态特征融合为多组学特征后,与所有单组学性能相比,预测性能在外部验证队列中均得到提高(PC:0.833,VC:0.745)。此外,通过添加临床特征,模型获得了最佳性能,其中,主队列的AUC为0.861,外部验证队列的AUC为0.833。
研究结论
我们的研究表明,与单组学特征相比,利用多组学特征的构建的pCR预测模型性能更好。多组学特征可以从宏观和微观两个尺度反映肿瘤特性,提高模型的泛化性并在外部验证队列中显示出更良好的预测性能。此外,结合临床特征可以进一步提高模型预测pCR的性能。
专家简介
刘振宇
中国科学院自动化研究所研究员,博士生导师
国家优秀青年科学基金获得者
中国研究型医院学会医学影像与人工智能专业委员会副主任委员
中国科学院人工智能创新研究院2035创新任务负责人
中国科学院脑科学与智能技术卓越创新中心年轻骨干
中国科学院青年创新促进会会员
获得中国体视学学会青年科学技术奖
主要从事医学影像大数据智能分析方面的研究工作,主持了多项国家级和省部级科研项目,作为第一作者(含共同)将所研发的智能分析方法及应用工作发表于包括《Nature Communications》和《Clinical Cancer Research》在内的综合类和临床肿瘤类国际权威期刊,相关工作写入中国临床肿瘤学会(CSCO)指南和中华放射学会专家共识,并获得国际权威学者特别是临床肿瘤专家的首创性评价。
专家简介
李豹
中国科学技术大学(2019.09-现在)
信息科学技术学院 电子工程与信息科学系 生物医学工程专业 在读博士
中国科学院自动化所(2020.09-现在)
中国科学院分子影像重点实验室 访问博士