出国看病  
肺部结节
肺结节动态
训练数据集对肺结节分类准确性的影响

  肺癌是全球癌症相关死亡的主要原因,5年生存率低于16%。然而,肺癌患者的预后与诊断时的癌症阶段密切相关。因此,肺癌的早期检测和诊断对于提高患者的存活率是重要的。目前,计算机断层扫描(CT)越来越多地被用作在早期检测肺结节的有效成像工具。然而,检测肺结节并确定哪些很可能是恶性的是放射科医师在阅读和解释大量薄层CT图像时的艰巨而繁琐的任务,这导致不准确的检测,误解和大的读者间可变性。因此,开发计算机辅助检测或诊断(CAD)方案以帮助放射科医师阅读和解释肺部CT图像在过去二十年中引起了广泛的研究兴趣。
  因此,许多用于检测可疑肺结节的CT图像的计算机辅助检测(CADe)方案已被开发出来并被提议用作辅助放射科医师的“第二读者”。在阅读肺CT图像的临床实践中,准确地确定结节恶化的可能性对于放射科医师来说也是一项具有挑战性的任务。因此,开发用于区分良性和恶性肺结节的高性能计算机辅助诊断方案(CADx)对于检测更多早期癌症同时具有高临床意义,同时消除许多不必要的活组织检查或手术。为此研究人员一直致力于使用不同的结节分割和基于多特征融合的机器学习方法来开发CADx方案。然而,开发CADx计划仍然面临许多挑战。
  最近,许多研究使用公开的LIDC / IDRI(肺图像数据库联盟/图像数据库资源计划)数据库来开发使用传统机器学习模型训练的拟议CADx方案或深度卷积神经网络方法。然而,由于缺乏基于组织病理学的“基础事实”,这些方案仅根据可疑性评分将结节分类为放射科医师恶性评分。因此,尚未测试这些CADx方案对真实良性和恶性结节进行分类的性能。虽然其他几项研究使用了从合作医院收集的图像数据集,根据放射科医师的诊断评分,确定良性和恶性结节之间的区别。由于难以收集大量活组织检查和组织病理学证实良性和恶性肺结节,一些研究使用LIDC / IDRI数据库训练CADx方案,随后使用内部收集的小组数据验证了方案性能,并确认了组织病理学结果。
  此外,CAD性能也可能在很大程度上取决于培训和测试数据集的难度和不同层次。文献中报道了如何在开发尚未研究过的肺结节CADx方案中建立最佳训练数据集。因此,本研究的目的是开发一种新的CADx方案,用于区分恶性和良性肺结节,并评估CADx方案的性能是否以及如何在早期和晚期肺癌相关结节的检测和分类中发生变化。为此,首先回顾性地组装了一个多样化的数据集,其中所有针对性的可疑结节都进行了活组织检查并具有组织病理学证实的结果。其次,研究人员评估CADx方案的分类性能与癌症阶段之间可能的趋势。
  在这项研究中,研究人员开发并测试了一种新的肺部CT图像CADx方案,以区分恶性和良性肺结节。该研究具有许多独特的特征。首先,研究人员组装了一个多样化的肺部CT数据集,其中所有结节都有经过确认的活组织检查和组织病理学检查结果。因此,CADx方案使研究人员能够区分恶性和良性肺结节,不仅可以预测结节恶化的风险或可能性,如许多先前的研究所报告的。为了提高使用有限数据集开发的CADx方案的稳健性,仅使用了几种简单的图像处理和特征分析方法或过程。研究结果证明了提取图像特征或特征集的可行性,并构建了具有高辨别力的多特征融合机器学习分类器,以区分恶性和良性结节。由于许多以前的研究已经测试和证明施加肺CT图像的一个的CADx方案为“第二读取”,以协助放射检测可疑肺结节和改善诊断性能的可行性,如果新方案在未来使用更大和更多样化数据集的测试中是稳健的,该研究将对协助放射科医师做出决定具有很高的临床影响在未来的临床实践中进行肺癌的检测和诊断。
  其次,众所周知,为了构建最佳且鲁棒的机器学习分类器,它需要大量且多样的图像数据集,以及一小组图像特征,以在训练样本和训练样本之间产生更高或可接受的比率。图像功能的数量。然而,癌症成像数据集的大小通常是有限的,包括在该研究中,而通常可以初始计算大量图像特征。例如,最初计算了66个图像特征,这些特征覆盖或表示了本研究中结节的密度异质性,形状和纹理特征。因此,在训练和测试分类器的过程中添加和集成三种方法或步骤,即Relief-F特征选择算法,SMOTE算法和LOCO交叉验证方法。特别,应用Relief-F特征选择算法来减少特征空间的维数。研究人员应用SMOTE算法在良性和恶性病例之间创建更平衡的训练数据集。然后,Relief-F和SMOTE算法都嵌入到LOCO交叉验证过程中,该过程产生最大数量的训练样本,并避免或最小化特征选择和案例分区中的潜在偏差。研究结果表明,使用具有最佳选择的小特征的该过程改善了分类器的性能Relief-F和SMOTE算法都嵌入到LOCO交叉验证过程中,该过程产生最大数量的训练样本,并避免或最小化特征选择和案例分区中的潜在偏差。研究结果表明,使用具有最佳选择的小特征的该过程改善了分类器的性能Relief-F和SMOTE算法都嵌入到LOCO交叉验证过程中,该过程产生最大数量的训练样本,并避免或最小化特征选择和案例分区中的潜在偏差。研究结果表明,使用具有最佳选择的小特征的该过程改善了分类器的性能。此外,在分析了LOCO迭代周期中最常选择的特征后,研究人员发现这些特征具有更高的辨别力以区分良性和恶性结节。结果表明,在LOCO交叉验证过程中应用和嵌入特征选择和可能的SMOTE算法对于使用相对小的图像数据集构建高性能和鲁棒的机器学习分类器是有效的。
  第三,由于CAD性能取决于培训和测试数据集的难度和多样性,研究人员将恶性结节或病例分为两组早期和晚期癌症,并组装三组数据,以研究CADx方案在检测或分类与不同阶段肺癌相关的肺结节中的表现变化。使用这三个数据集分别训练和测试许多分类器。数据分析结果呈现一致趋势。包含在训练和测试数据集中的更高级的癌症病例,可以实现的分类性能越高。这表明随着癌症生长或迁移到更高级阶段,从结节计算的图像特征也显示出与良性结节相比增加的差异。从而,良性结节与早期肺癌相关的恶性结节之间的准确分类更加困难或具有挑战性。由于先前的研究未报告病例难度水平或癌症分期的分布,因此CADx方案是否经过最佳训练以及报告的性能水平是否具有可比性尚不清楚。这项研究的结果表明,为了提高应用CAD方案的性能,以较低的FP率准确检测更微妙或早期的肺癌,研究人员需要组装一个以更多结节相关的最佳训练数据集。患有早期肺癌。是否对CADx方案进行了最佳培训,以及报告的性能水平是否具有可比性尚不清楚。这项研究的结果表明,为了提高应用CAD方案的性能,以较低的FP率准确检测更微妙或早期的肺癌,研究人员需要组装一个以更多结节相关的最佳训练数据集。患有早期肺癌。是否对CADx方案进行了最佳培训,以及报告的性能水平是否具有可比性尚不清楚。这项研究的结果表明,为了提高应用CAD方案的性能,以较低的FP率准确检测更微妙或早期的肺癌,研究人员需要组装一个以更多结节相关的最佳训练数据集。患有早期肺癌。
  第四,为了初步测试使用本研究中计算或选择的图像特征的稳健性来开发没有其他独立测试数据集的CADx方案,研究人员构建并测试了三种不同类型的机器学习分类器。这些分类器使用不同的统计或机器学习概念或方法,但是当它们使用相对小的图像数据集训练时,它们经常用于基于成像的CADx方案中,具有相对高的泛化能力。数据分析结果显示使用这三种分类器中的任何一种来检测或分类早期和晚期肺癌病例的一致趋势。结果提供了新的证据来支持本研究中开发新CADx方案的方法的稳健性。
  尽管结果很有希望,但这项研究也存在一些局限性。首先,研究人员的数据集很小,有243个病例,76个良性结节不平衡。因此,该数据集的多样性可能是有限的,并且不能充分代表临床实践中的一般肺癌群体。报告结果的可重复性和一般化需要在未来的研究中通过大量不同的数据集进行验证。其次,虽然为了提高结节分割的准确性,采用三种算法的自适应结节分割方法分别对三种类型的孤立,近胸膜和血管化结节进行分割,如何评估结节分割的准确性仍然是一个挑战,并且是主观的对于结核的实际边界轮廓缺乏“基本事实”。从而,开发更准确可靠的结核分割和评价方法仍是需要探索的研究重点之一。第三,研究人员仅计算了66个图像特征,这些特征关注于结核密度的异质性和纹理变化。尚未探索一些其他潜在有用的图像特征,例如结节推测和分叶。第四,尽管已经开发并测试了深度CNN转移学习方法以开发CADx方案来预测肺结节如结节推测和分叶尚未探索过。第四,尽管已经开发并测试了深度CNN转移学习方法以开发CADx方案来预测肺结节(即太阳的恶性风险)如结节推测和分叶尚未探索过。第四,尽管已经开发并测试了深度CNN转移学习方法以开发CADx方案来预测肺结节,由于本研究的数据集有限,只使用传统的机器学习方法或分类器。与未经训练的传统机器学习分类器相比,使用深度学习方法是否能够产生明显更高且更稳健的分类准确度,需要在未来的研究中进一步研究,同时增加训练数据集大小。最后,这只是评估CADx方案的独立性能的主要技术开发研究。CADx性能是否以及如何转化为人类(放射科医师)的表现还不清楚。因此,在CADx方案和技术可以在临床实践中被接受之前,需要在将来的研究中研究CADx方案的临床应用。
  在这项研究中,研究人员开发了一种新的CADx方案来区分恶性和良性肺结节,并研究了不同图像训练数据集对CADx方案性能的影响。实验和数据分析结果显示了CADx表现与癌症进展阶段之间的一致积极趋势。因此,为了在检测细微或早期肺癌病例中增加CADx性能,训练数据集应包括更多样化的细微或早期肺癌病例。此外,在LOCO交叉验证方法中嵌入有效的特征选择方法以训练和构建机器学习分类器也是使用有限图像数据集开发CADx方案的最佳方法。

 

 
肺癌与肺结节简介
  肺癌的临床表现比较复杂,症状和体征的有无、轻重以及出现的早晚,取决于肿瘤发生部位、病理类型、有无转移及有无并发症,以及患者的反应程度和耐受性的差异。肺癌早期症状常较轻微,甚至可无任何不适。中央型肺癌症状出现早且重,周围型肺癌症状出现晚且较轻,甚至无症状,常在体检时被发现。肺癌的症状大致分为:局部症状、全身症状、肺外症状、浸润和转移症状。
网站导航
肺部小结节
肺结节探寻
肝癌
胶质瘤
烟雾病
脑膜瘤
大脑海绵状血管瘤
联系方式
电话:13263277712
邮箱:81068003@qq.com
地址:北京市.丰台区.万丰公园
中国海外医疗网肺癌频道 版权所有 2018-2020 出国看病 海外医疗 硼中子俘获治疗
本网站部分内容参考网络,如有侵权请您发邮件提醒!