多模态 X 线影像组学列线图预测乳腺肿块良恶性的价值 | ![]() |
2. 山东第一医科大学附属省立医院影像科, 山东 济南 250001;
3. 山东省烟台芝罘医院放射科, 山东 烟台 264000
乳腺癌是女性癌症中发病率和死亡率最高的肿瘤[1],严重威胁患者的身心健康,早期诊断并及时治疗能有效改善预后[2-3]。目前,全数字化乳腺X线摄影(full-field digital mammography, FFDM)因其处理快、成本低、易于操作等优点已广泛应用于乳腺癌的筛查及诊断中[4],但致密型乳腺因腺体遮挡,FFDM对其检出率较低;数字乳腺体层合成摄影(digital breast tomosynthesis, DBT)技术可在很大程度上解决这个难题,提高乳腺疾病的检出率和诊断准确率,具有重要的临床意义[5-6]。DBT与FFDM联合应用已被临床广泛认可[7-8]。在近几年开展的大量关于FFDM、DBT应用价值的研究中,传统影像学表现及形态特征方面的研究占较大比例[9-11]。影像组学基于更深层次的数据挖掘分析,为影像诊断提供全新的视野,在乳腺方面也有大量相关研究[12-13]。而对多模态X线影像组学结合临床危险因素建立联合预测模型的诊断价值却鲜有报道[14-15]。本研究旨在探讨FFDM+DBT影像组学特征+临床危险因素建立的联合预测模型评估乳腺肿块良恶性的价值,以期为临床医师术前提供一种无创且有效评价乳腺肿块良恶性的方法。
1 资料与方法 1.1 一般资料回顾性分析2018年6月至2020年6月于山东第一医科大学附属省立医院就诊的女性乳腺肿块患者391例,其中选择2018年6月至2019年12月就诊的313例患者作为训练集,选择2020年1—6月就诊的78例患者作为验证集。训练集中良性91例,恶性222例;验证集中良性30例,恶性48例。为解决训练集中良恶性样本分类不平衡的问题,用随机欠采样方法删除恶性样本131例,最终训练集中恶性与良性患者各91例。最终260例患者纳入模型,年龄27~77岁;恶性139例,其中浸润性导管癌108例、导管原位癌9例、浸润性导管癌伴导管原位癌6例、浸润性小叶癌7例、乳头状癌5例、黏液癌2例和髓样癌2例;良性121例,其中乳腺纤维腺瘤49例、乳腺导管内乳头状瘤23例、乳腺病17例、乳腺炎性病变11例、良性分叶状肿瘤10例、硬化性腺病6例和乳腺囊肿5例。纳入标准:(1)术前完善的FFDM及DBT检查资料,临床资料完善;(2)病理良恶性诊断明确。排除标准:(1)影像资料质量不理想;(2)FFDM及DBT检查前有乳腺手术、化疗、放疗、激素治疗、靶向治疗既往史。
1.2 仪器与方法应用Siemens Mammomat Inspiration数字化乳腺X线摄影机行影像检查,采用头尾位(CC位)及内外斜位(MLO位)。患者先获取单一体位FFDM图像,在相同条件下自动完成DBT检查。X线球管于乳腺上方按顺序旋转摄影,在-25°~25°夹角内每旋转2°自动曝光扫描一次,经后处理重建最终获取多幅不同角度的低剂量DBT图像,层厚1 mm,被检乳腺的腺体厚度决定层数。
1.3 ROI勾画由1名主治医师(医师1)和1名高年资住院医师(医师2)使用Deepwise科研平台(深睿医疗)分别在CC位、MLO位图像上手动勾画肿块边界(图 1),其中每一体位FFDM图像仅需勾画单幅图像,而DBT图像需逐层完整勾画肿块边界。
![]() |
注:患者,女,49岁,术后病理为良性乳腺纤维腺瘤。图 1a为全数字化乳腺X线摄影(FFDM)头尾位勾画示意图(箭头);图 1b为数字乳腺体层合成摄影(DBT)头尾位勾画示意图(箭头) 图 1 ROI 手动勾画方法示意图 |
1.4 影像组学特征提取
在Deepwise科研平台上进行影像组学特征的提取。随机选出的90例患者图像先由2名医师同时勾画ROI,然后分别提取2名医师勾画ROI的影像组学特征并行一致性评估;1个月后由医师2再次勾画ROI,并提取ROI内影像组学特征,对该医师前后2个时间段所勾画的影像组学特征进行一致性评估;筛选一致性较高的影像组学特征进入下一步数据分析。剩余170例患者ROI的勾画由医师2完成。
1.5 影像组学特征筛选与模型构建对训练集中影像组学特征行单因素ANOVA、Mann-Whitney U检验,运用最小绝对收缩与选择算子(least absolute shrinkage and selection operator, LASSO)算法进一步筛选出主要的影像组学特征作为预测良恶性乳腺疾病的诊断价值标签。共建立3类预测模型:第1类模型,通过筛选相关影像组学特征建立FFDM、DBT及FFDM+DBT的逻辑回归预测模型,分别为模型1、模型2及模型3。第2类模型,用logistic回归筛选临床危险因素,利用筛选的临床危险因素构建临床预测模型(模型4)。第3类模型,用影像组学特征结合临床危险因素建立联合预测模型(模型5)。
1.6 统计学分析运用SPSS 22.0软件和R3.6.1完成统计分析。正态性检验采用科尔莫戈罗夫-斯米尔诺夫(KolmogorovSmirnov, K-S)检验进行,符合正态分布的计量资料以x+s表示,偏态分布的计量资料用M(QL, QU)表示;用χ2检验或Fisher确切概率法对计数资料进行比较。通过组内相关系数(intraclass correlation efficient, ICC)评价观察者一致性,比较不同医师之间及不同时间段之间影像组学特征的一致性,当ICC > 0.75时为一致性较高。采用单因素方差分析及Mann-Whitney U检验行单因素分析。用ROC曲线评价各预测模型的性能,DeLong检验评价不同预测模型AUC的显著性差异。用R软件生成列线图、决策曲线(DCA)及校准曲线,用校准曲线评价模型的实用性,用DCA分析评估模型的临床净收益。以P < 0.05为差异有统计学意义。
2 结果 2.1 2组一般资料比较训练集与验证集肿块大小、位置比较差异均无统计学意义(均P > 0.05);2组年龄、腺体密度、有无钙化、仅DBT清晰显影、触诊是否质硬不规则、触诊是否单发等特征差异均有统计学意义(均P < 0.05,表 1)。单因素logistic回归分析显示,训练集中,良恶性患者年龄、触诊是否质硬不规则及触诊是否单发差异均有统计学意义(均P < 0.05,表 2);采用多因素logistic回归对上述临床危险因素进行分析,年龄、触诊是否质硬不规则及触诊是否单发差异均有统计学意义(均P < 0.05,表 3)。
表 1 训练集与验证集患者临床资料比较 |
![]() |
表 2 训练集良恶性患者临床资料的单因素逻辑回归分析 |
![]() |
表 3 训练集良恶性患者临床资料的多因素逻辑回归分析 |
![]() |
2.2 特征筛选与模型评估
训练集与验证集中的FFDM、DBT及FFDM+DBT影像组学特征一致性较高(ICC > 0.8)。FFDM 2个体位组合数据集共3 124个特征,其中2 562个特征具有较高的一致性;DBT 2个体位组合数据集共3 984个特征,其中3 274个特征具有较高的一致性;FFDM+DBT 2个体位组合数据集共7 108个特征,其中5 836个特征具有较高的一致性。最终筛选出19、15、20个影像组学特征分别纳入模型1、模型2、模型3。多模态的模型3筛选的影像组学特征与其对应的特征系数见表 4。
表 4 模型3(多模态影像组学模型)中包含的特征及参数 |
![]() |
模型1在训练集与验证集的AUC分别为0.90、0.80,准确率分别为83.52%、75.64%;在验证集中,模型1的特异度及敏感度分别为83.30%、70.80%。模型2在训练集和验证集的AUC为0.90、0.88,准确率分别为81.32%、75.64%;在验证集中,模型2的特异度及敏感度分别为96.70%、68.80%。模型3在训练集与验证集的AUC分别为0.91、0.90,准确率分别为84.07%、79.49%;在验证集中,模型3的特异度及敏感度分别为80.00%、91.70%。模型4在训练集和验证集的AUC分别为0.82、0.85,准确率分别为76.92%、78.21%;在验证集中,模型4的特异度及敏感度分别为70.00%、91.70%。模型5在训练集与验证集AUC分别为0.96、0.93,准确率分别为87.91%、84.62%;在验证集中,模型5的特异度和敏感度分别为96.70%、75.00%。
DeLong检验示:在验证集中,模型3与模型1的AUC差异有统计学意义(P=0.043);模型1与模型2、模型2与模型3的AUC差异均无统计学意义(均P > 0.05图 2,表 5)。在验证集中,模型5与模型4的AUC差异有统计学意义(P=0.047),模型3与模型4、模型3与模型5的AUC差异均无统计学意义(均P > 0.05,图 2,表 5)。绘制模型5的列线图(图 3)。DCA示当验证集阈值概率在0.12~0.93,模型5具有较高的诊断价值及临床净收益(图 4)。校准曲线显示模型5具有良好的临床实用性(图 4)。
![]() |
注:图 2a为5种预测模型训练集ROC曲线。图 2b为5种预测模型验证集ROC曲线 图 2 模型评价 |
表 5 验证集5种预测模型AUC两两差异DeLong检验P值 |
![]() |
![]() |
注:根据影像组学评分、患者年龄、触诊是否单发及触诊是否质硬不规则分别对应的分数计算总分数 图 3 联合模型列线图 |
![]() |
注:图 4a为验证集联合模型决策曲线(DCA)。图 4b为验证集联合模型校准曲线,图中45°斜虚线表示诊断的理想预测性能,另一条虚线表示列线图的预测性能,实线则表示列线图预测偏差的修正,2条虚线越接近表示预测准确率越高 图 4 模型评价 |
3 讨论
FFDM因价格低廉、检查便捷,是乳腺癌筛查及术前诊断的常规检查方法,也是钙化类病变的最佳检查方法,但其对致密型腺体背景下肿块类病变的检出率及准确率不理想。DBT通过机架的旋转获得断层图像,重建出类三维图像,突破FFDM二维图像组织重叠的局限性,明显提高了病变的检出率及准确率。影像组学可高通量地提取病变图像的内部特征,对病变特征进行深层次分析,旨在为疾病的诊断提供更多规范化的客观依据,进一步提高疾病诊断的准确性[16-19]。本研究构建了乳腺肿块的多模态X线影像组学特征联合临床特征的列线图,最终结果显示影像组学、临床特征联合预测模型的诊断效能最优,AUC=0.93。DCA显示联合模型具有良好的临床应用价值。
3.1 影像组学模型效能比较本研究比较了FFDM、DBT及FFDM+DBT 3种模态的影像组学模型的效能,结果显示,FFDM+DBT的诊断效能(AUC=0.93)优于单一FFDM模型(AUC=0.80)及单一DBT模型(AUC=0.88),且DBT模型优于FFDM模型,DeLong检验进行3组模型的AUC两两比较,仅FFDM+DBT模型与FFDM模型间差异有统计学意义(P=0.043)。与FFDM比较,DBT图像可避免病变与正常组织的重叠,清晰显示病变边缘,提供更多的形态学特征,生成类三维图像,可获取更多病变内部的纹理特征。从FFDM+DBT建模的20个最优特征权重看,部分FFDM特征也占较高权重,表明尽管FFDM提供的特征信息数量与细节不及DBT,但部分权重较高的特征对最终结果也有重要影响,2种模态联合呈现出最佳的诊断能效,与之前研究[20]结果一致。本研究比较了各模型的特异度及敏感度,在验证集中,多模态影像组学模型预测恶性肿瘤的效能有所提高,说明FFDM结合DBT组学纹理特征不但减少了腺体重叠的干扰,且能提供更丰富的诊断信息,提高诊断效能,尤其是恶性肿瘤的检出率。
3.2 影像组学模型、临床模型及联合预测模型的比较本研究采用logistic回归分析对患者病史及相应的体格检查行临床危险因素分析,最终证实触诊是否质硬不规则及触诊是否单发可作为临床预测因子对模型进一步优化,构建了临床模型、影像组学与临床预测因子结合的联合模型,而之前的研究多局限于影像组学联合模型性能的比较,或是对乳腺MRI联合临床模型的分析,乳腺X线多模态影像组学联合临床模型的研究则鲜有报道[21-23]。相对于乳腺MRI费用高、检查时间长、存在对比剂风险等因素,基于乳腺X线基础的诊断模型具有广泛的临床适用性。另外,本研究联合模型的AUC显著高于临床模型及影像组学,这表明联合模型中年龄、是否触诊质硬不规则及触诊是否单发这些临床危险因素能进一步提高对病变良恶性的预测效能。本研究中临床预测因素对联合预测模型列线图的贡献权重较小,后续研究可进一步挖掘更具权重的临床危险因素。
3.3 训练集中自变量分类不平衡解决方法自变量分类不平衡导致模型偏颇预测是在机器学习的分类模型训练过程中的常见问题。为解决该问题,研究者多采用系统性过采样算法处理数据不平衡问题[24],此算法存在的缺点是训练集中部分数据为合成数据,非患者的真实数据,因此预测模型的准确性会受到一定影响。本研究训练集中恶性患者多于良性患者,样本分类不平衡,笔者用随机欠采样方法删除训练集中部分恶性样本,使训练集样本分类变量数据平衡;同时验证集中样本分类变量保持不变,保证模型在验证集中不存在过拟合现象,从而客观反映患者的真实病理分布情况。
本研究的局限性:(1)为单中心回顾性研究,需加入多中心数据进一步研究验证;(2)人工勾画ROI存在一定主观性及不稳定性,且效率低;今后将采用自动勾画方式提高性能及效率;(3)有监督机器学习算法较为单一,以后可运用深度学习进一步探索。
综上所述,FFDM+DBT影像组学特征结合临床危险因素建立的联合预测模型可高效预测术前预测乳腺肿块的良恶性,为临床医师提供了一种术前无创评价乳腺肿块良恶性的方法。
[1] |
MILLER K D, NOGUEIRA L, DEVASIA T, et al. Cancer treatment and survivorship statistics, 2022[J]. CA Cancer J Clin, 2022, 72(5): 409-436. DOI:10.3322/caac.21731 |
[2] |
SIEGEL R L, MILLER K D, JEMAL A. Cancer statistics, 2020[J]. CA Cancer J Clin, 2020, 70(1): 7-30. DOI:10.3322/caac.21590 |
[3] |
HARBECK N, GNANT M. Breast cancer[J]. Lancet, 2017, 389(10074): 1134-1150. DOI:10.1016/S0140-6736(16)31891-8 |
[4] |
SPAK D A, PLAXCO J S, SANTIAGO L, et al. BI-RADSR® fifth edition: a summary of changes[J]. Diagn Interv Imaging, 2017, 98(3): 179-190. DOI:10.1016/j.diii.2017.01.001 |
[5] |
RATANAPRASATPORN L, CHIKARMANE S A, GIESS C S. Strengths and weaknesses of synthetic mammography in screening[J]. Radiographics, 2017, 37(7): 1913-1927. DOI:10.1148/rg.2017170032 |
[6] |
NIELL B L, FREER P E, WEINFURTNER R J, et al. Screening for breast cancer[J]. Radiol Clin North Am, 2017, 55(6): 1145-1162. DOI:10.1016/j.rcl.2017.06.004 |
[7] |
CIATTO S, HOUSSAMI N, BERNARDI D, et al. Integration of 3D digital mammography with tomosynthesis for population breast-cancer screening(STORM): a prospective comparison study[J]. Lancet Oncol, 2013, 14(7): 583-589. DOI:10.1016/S1470-2045(13)70134-7 |
[8] |
SKAANE P, BANDOS A I, GULLIEN R, et al. Comparison of digital mammography alone and digital mammography plus tomosynthesis in a population-based screening program[J]. Radiology, 2013, 267(1): 47-56. DOI:10.1148/radiol.12121373 |
[9] |
MANDUCA A, CARSTON M J, HEINE J J, et al. Texture features from mammographic images and risk of breast cancer[J]. Cancer Epidemiol Biomark Prev, 2009, 18(3): 837-845. DOI:10.1158/1055-9965.EPI-08-0631 |
[10] |
KONTOS D, IKEJIMBA L C, BAKIC P R, et al. Analysis of parenchymal texture with digital breast tomosynthesis: comparison with digital mammography and implications for cancer risk assessment[J]. Radiology, 2011, 261(1): 80-91. DOI:10.1148/radiol.11100966 |
[11] |
RAY S, CHEN L, KELLER B M, et al. Association between breast parenchymal complexity and false-positive recall from digital mammography versus breast tomosynthesis: preliminary investigation in the ACRIN PA4006 trial[J]. Acad Radiol, 2016, 23(8): 977-986. DOI:10.1016/j.acra.2016.02.019 |
[12] |
MA W, JI Y, QI L, et al. Breast cancer Ki67 expression prediction by DCE-MRI radiomics features[J]. Clin Radiol, 2018, 73(10): 909.e1-909.e5. DOI:10.1016/j.crad.2018.05.027 |
[13] |
TAGLIAFICO A S, PIANA M, SCHENONE D, et al. Overview of radiomics in breast cancer diagnosis and prognostication[J]. Breast, 2020, 49: 74-80. DOI:10.1016/j.breast.2019.10.018 |
[14] |
NIU S, WANG X, ZHAO N, et al. Radiomic evaluations of the diagnostic performance of DM, DBT, DCE MRI, DWI, and their combination for the diagnosis of breast cancer[J]. Front Oncol, 2021, 11: 725922. DOI:10.3389/fonc.2021.725922 |
[15] |
GERAS K J, MANN R M, MOY L. Artificial intelligence for mammography and digital breast tomosynthesis: current concepts and future perspectives[J]. Radiology, 2019, 293(2): 246-259. DOI:10.1148/radiol.2019182627 |
[16] |
LAMBIN P, LEIJENAAR R T H, DEIST T M, et al. Radiomics: the bridge between medical imaging and personalized medicine[J]. Nat Rev Clin Oncol, 2017, 14(12): 749-762. DOI:10.1038/nrclinonc.2017.141 |
[17] |
周嘉音, 尤超, 顾雅佳. 影像组学在乳腺癌的应用研究进展[J]. 国际医学放射学杂志, 2022, 45(2): 174-179. |
[18] |
马明明, 崔应谱, 刘想, 等. 基于乳腺X线摄影的影像组学对乳腺肿块和钙化良恶性分类的研究[J]. 放射学实践, 2022, 37(3): 325-330. |
[19] |
谭红娜, 武明辉, 周晶, 等. 乳腺X线影像组学方法预测乳腺癌腋窝淋巴结转移的价值[J]. 中华放射学杂志, 2020, 54(9): 859-863. |
[20] |
陈旭, 宋歌声, 李爱银. 多模态X线影像组学模型对乳腺BI-RADS 4类肿块良恶性的辅助诊断价值[J]. 临床放射学杂志, 2022, 41(1): 54-58. |
[21] |
ZHANG R, WEI W, LI R, et al. An MRI-based radiomics model for predicting the benignity and malignancy of BI-RADS 4 breast lesions[J]. Front Oncol, 2022, 11: 733260. DOI:10.3389/fonc.2021.733260 |
[22] |
TAO W, LU M, ZHOU X, et al. Machine learning based on multi-parametric MRI to predict risk of breast cancer[J]. Front Oncol, 2021, 26, 11: 570747. |
[23] |
GERAS K J, MANN R M, MOY L. Artificial intelligence for mammography and digital breast tomosynthesis: current concepts and future perspectives[J]. Radiology, 2019, 293(2): 246-259. DOI:10.1148/radiol.2019182627 |
[24] |
RICH B, HUANG J, YANG Y, et al. Radiomics predicts for distant metastasis in locally advanced human papillomavirus-positive oropharyngeal squamous cell carcinoma[J]. Cancers(Basel), 2021, 13(22): 5689. |