在世界范围内,肺癌是与癌症相关的死亡的主要原因。然而,根据最新的医学研究报告,如果性质和癌症症状在早期正确识别,它可以治愈的。癌症通过血液和淋巴系统扩散到身体的其他部位,这一过程称为转移,然后迅速引起继发性肿瘤的发展。像吸烟,呼吸受污染的空气,生活在污染区一些高危因素的预后和肺癌患者生活质量的负面影响。肺癌也可以是遗传性的。在二十世纪初,肺癌的发病率是非常低的,但现在它的发病率正在迅速增加。根据GLOBOCAN2012报告,全球已有180万肺癌新病例,占2012年估计癌症总发病率的12.9%。在这些案例中,有58.0%来自不发达国家。匈牙利的肺癌发生率最高,其次是塞尔维亚和韩国。2012年,在北美,男女肺癌的发病率均最高。非洲的发病率最低,其次是拉丁美洲和加勒比。同年,匈牙利的男性肺癌发病率最高,其次是亚美尼亚和马其顿。在印度,肺癌死亡率很高。2012年,世界卫生组织报告说,在全球范围内,肺癌导致159万人死亡。50岁以上的烟民罹患肺癌的风险最高。目前,女性肺癌的发病率较低,但是生活方式的改变可能会在未来增加肺癌的发病率。根据上述数据,很明显全球范围内的肺癌发病率令人震惊。实际上,它已经成为最常见和致命的癌症类型。这项研究的主要目的是评估肺癌的发生率和相关的死亡率,并分析正在进行的肺癌检测计算方法的研究。对当前研究的深入分析将有助于早期发现肺癌的新技术的发展。
在本研究中,海外医疗网从以下来源收集了英国,美国,印度和埃及的肺癌发生率和死亡率数据。在这些组织收集和发布全球数据时,海外医疗网还考虑了来自法国和瑞士的数据源。苏格兰总登记处:一个存储医学统计数据和出生和死亡记录的资料库。苏格兰信息服务部:苏格兰国家服务部的一部分。免费向所有人提供健康数据。国家癌症情报网:旨在改善临床结果,癌症护理和预防。自2013年4月起,成为英国公共卫生的一部分。北爱尔兰癌症登记处:成立于1994年,位于贝尔法斯特女王大学公共卫生中心。维护癌症发病率和死亡率数据。由北爱尔兰公共卫生局资助。北爱尔兰统计和研究局:一个存储医学数据和社会研究以及死亡和出生记录的资料库。国家统计局:英国的统计机构。收集并发布人口,社会和经济统计数据。英国和爱尔兰癌症注册机构协会:专注于在英国和爱尔兰开发癌症注册机构,以研究和控制癌症。威尔士威尔士癌症情报和监视部门:威尔士国家癌症登记处。存储并发布威尔士癌症发病率的数据。
疾病控制与预防中心:它有助于发现和应对新出现的健康威胁。CDC的目标是解决导致残疾和死亡的最大健康问题。监视,流行病学和最终结果数据库:有关美国癌症发病率和生存率的权威信息来源。印度癌症协会:由DarabJehangirJussawalla博士和NavalTata先生成立的非营利组织,致力于癌症的认识,发现,治疗和生存。还收集了来自印度不同城市的癌症相关发病率和死亡率数据。印度医学研究理事会:印度新德里的一个理事会,负责生物医学研究的准备,配置和支持。主要研究重点是控制传染病,癌症,心血管疾病,失明和糖尿病,并制定医疗策略。启动了国家癌症注册计划,以收集可靠的癌症数据,进行流行病学研究,设计癌症控制策略并组织癌症认识计划。细胞与预防肿瘤研究所:它是ICMR之下的领先研究所。它提供了印度主要癌症的认识,预防策略和治疗方法。
Gharbiah基于人口的癌症注册中心:由中东癌症联盟和埃及卫生部赞助。公布癌症发病率和死亡率的年度统计数据以及可能的控制策略。国际癌症登记协会:一个专业协会,收集特定人群的癌症相关发病率,死亡率和生存数据。埃及国家癌症注册计划:由埃及通信和信息技术部支持。收集癌症数据,进行数据分析,执行培训计划并制定癌症控制策略。瑞士世界卫生组织:1948年成立于瑞士日内瓦。联合国的一部分。致力于全球健康的所有事务。法国国际癌症研究机构:世界卫生组织的专门癌症研究机构。制定并加强癌症预防措施,尽早发现恶性肿瘤,并定期发布有关癌症发生率的报告。法国GLOBOCAN2014:IARC和WHO的项目。估算184个国家/地区在国家一级的癌症发病率,死亡率和患病率。
系统的程序和方法,调查和现有研究得出的流行病学指标能够显示疾病的过程和结果。纯粹基于计算和数字信息,定量指标或方法可能会有用。有用的定量指标包括发病率,患病率和死亡率。发生率的措施本人口肺癌的新病例,而死亡率是死于肺癌的在总人口估计。在这项研究中,海外医疗网使用发病率和死亡率来阐明肺癌对人群的影响。了解给定人群的癌症生存率,使研究人员能够估计癌症的趋势和模式以及人们的健康水平。净生存率显示出在不考虑其他原因导致的死亡的情况下存活癌症的可能性。由于净生存不受其他原因的影响,因此可以得出可靠的结果。有两种通用方法可以估算净生存率:比生存率和相对生存率。从癌症死亡的原因中计算出特定存活率,并且主要用于临床试验。有时死因可能不可用或不可靠;在这种情况下,不可能正确估计生存率。然而,通过发现其他疾病与总发生率之间的差异,其他疾病的生存率可能有助于找到患有该疾病的患者的生存状况。可以通过相对存活率来计算。相对生存率=观察生存率预期生存比例×100%相对生存率=观察生存率预期生存比例×100%预期存活率可以通过EdererI,EdereII和Hakulinen方法计算。在这项研究中,海外医疗网使用了净生存率和相对生存率。
海外医疗网首先考虑了1975-2014年期间英国肺癌的发病率和死亡率。这些数据基于年龄调整后的或标准化的比率。年龄调整后的比率消除了年龄偏差,从而在比较不同人群时具有可靠性。发病率和死亡率因年龄,种族,性别和人口统计学因素而异。因此,海外医疗网比较了来自不同国家和城市的不同年龄的人口群体。肺癌的发病率和在英国死亡率在1975至2014年。发病率和死亡率基于英国每10万人的欧洲年龄标准。对于男性,肺癌的发病率在1975-1980年间有所增加,并在1985-2014年间逐渐下降,而在1975-2014年间,死亡率则逐渐下降。对于女性而言,1975年至2014年期间,肺癌的发病率和死亡率有所上升。许多因素,如年龄,遗传,污染和辐射水平和生活方式,会影响肺癌发展。在英国,吸烟是导致肺癌的主要原因。86.0%的肺癌病例与吸烟有关。
在此期间1971年至2011年的男性和女性在英国肺癌的存活率。图1显示,男性的1年生存率从16.2%增加到30.4%,女性从15.4%增加到35.1%。对于男性,1971-2011年期间的5年生存率从4.8%增加到8.4%;女性的5年生存率从同期的4.4%提高到11.6%。在1971年至2011年期间,英国患有肺癌的男性和女性的10年生存率分别从3.2%增加到4.0%,从2.9%增加到6.5%。在2007年至2011年期间,随着年龄的增长,英国患有肺癌的男性和女性的生存率分别从38.4%降至4.8%,从45.0%降至5.0%。由于以下原因,英国肺癌患者的生存率仍然很差:症状的较晚发现;大多数患者无法获得最佳治疗;缺乏有效的筛查程序;并发肥胖和吸烟。接下来,海外医疗网在此期间1975年至2014年审查了美国肺癌的发病率和死亡率的。与来自英国的数据一样,分析了来自美国的肺癌数据,其中考虑了年龄校正或年龄标准化率以及SEER数据库的发生率。对于男性,肺癌发生率在1975-1980年期间增加,然后在1985-2014年期间逐渐下降。但是,死亡率在1975–1990年期间逐渐增加,而在1995–2014年期间有所下降。对于女性而言,肺癌的发病率在1975-2005年期间缓慢增加,而死亡率在1975-2000年期间首先逐渐增加,此后急剧增加。
对于美国的男性和女性,在1975年至2010年期间,肺癌的1年生存率分别从33.4%增加到40.7%,从40.4%增加到48.5%。在美国,1975年至2006年期间,男性和女性肺癌患者的5年生存率分别从11.1%增加到15.1%,从16.1%增加到20.2%。2012年,约有402,326美国人患有肺癌。美国疾病预防控制中心在2015年估计有221,220例肺癌新病例,占所有诊断出的癌症病例的13.0%。一些研究表明,一个人患上肺癌的机会取决于许多因素,例如过去或现在的吸烟状况,年龄和性别。男性吸烟者患肺癌的风险是男性非吸烟者的23倍。同样,女性吸烟者患肺癌的风险是女性非吸烟者的13倍。此外,海外医疗网在考虑年龄标准化速率期间1980年至2014年。来自印度的这些数据有限。男性和女性肺癌的发病率在1980年至2014年期间都有所增加。最后,海外医疗网研究了2000-2014年期间埃及的肺癌发生率和死亡率。与印度一样,埃及的肺癌发病率和死亡率数据很少。在埃及,肺癌的死亡率在2000年至2014年期间增加;吸烟是在埃及人也肺癌的主要危险因素。在本研究中,海外医疗网审查了Elsevier,IEEE和Springer在2007-2015年期间发表的大约110篇文章。海外医疗网发现数据挖掘和进化算法能够有效地对肺癌数据进行分类。以前,许多研究人员仅使用数据挖掘方法。但是,海外医疗网的研究表明,数据挖掘和进化算法的结合对于检测肺癌更有效。
海外医疗网发现,目前在全球范围内,肺癌的发病率和死亡率模式密切相关。在美国和英国,先进的技术和认识计划已经帮助降低了肺癌的死亡率。但是,在印度和埃及,情况并非如此,在印度和埃及,需要采取更有效的措施,例如发展特殊意识计划,以降低肺癌的死亡率。癌症流行病学是针对给定人群的癌症原因和危险因素的研究。通过允许识别与癌症有关的健康问题,衡量疾病在社区中的传播,扩大对癌症危险因素的了解以及可能会有所帮助。更好地了解癌症的影响。癌症流行病学可以提供有关癌症原因的见解。但是,流行病学调查的区域通常仅限于特定区域,并且通常涉及较小的样本量。由于癌症流行病学本质上是分析性的,因此需要其他计算方法。样本大小可以轻松增加,从而可以产生更好的分类结果。数据挖掘技术可以提供更好的数据分类和分类,但是这些技术可能无法有效地对顺序和时间序列数据的趋势进行聚类,分类和预测。因此,在这种情况下,进化算法可用于获得最佳解。进化算法可以产生高质量的分析解决方案,并且可以简化不同迭代阶段的问题。进化算法,例如蚁群优化,粒子群优化和人工蜂群,是有益的,因为与仅使用数据挖掘技术相比,这些算法能够实现更接近的解决方案。
模式发现在癌症检测中非常重要。为此,需要数据挖掘方法。数据挖掘是一种可以将相关模式与大型数据库分离的过程。数据挖掘可用于六个特定任务:分类,估计,预测,关联规则挖掘,聚类和可视化。分类,估计和预测是监督学习的示例。这些技术的主要目的是基于可用数据准备模型,该数据可以表示一个或多个属性。关联规则挖掘,聚类和可视化是无监督学习的示例。这些技术的主要目的是建立属性之间的关系。六种方法几乎在医疗保健数据库的每个领域中用于知识发现,分类和预测。其中,关联规则挖掘,分类和聚类是最常用的数据挖掘技术。由于肺癌的症状在每个患者中都不相同,因此必须表征其独特特征并为不同患者提供独特的治疗方法。在这方面,聚类或分类技术可能有用,因为一些因素可能会导致肺癌。
癌症治疗中两个最重要的因素是分类和表征。使用Apriori算法成功地实现了所有分类规则,这有助于鳞状细胞癌和腺癌的诊断和药物开发。提出肺癌的早期诊断主要取决于其历史数据。使用关联规则挖掘。在肺癌SEER数据中确定了热点。本研究开发了原型死亡风险计算器;所获得的规则满足生物医学知识。肺癌的早期检测很困难,因为它取决于多种属性。将传统的聚类与有雾的聚类方法进行了比较,并通过使用后者获得了更好的结果。建议文本挖掘,以更好地理解诊断过程,分类准确性和疾病事实;这也有助于预测模型设计,警报系统和决策过程。使用关联规则挖掘来识别不同类型癌症中的风险因素。为此,他们使用了三种不同类型的关联规则挖掘算法:Apriori,预测Apriori和tertius算法。Apriori算法的性能优于其他算法。贝叶斯网络是了解癌症转移的一种非常有用的方法。这项研究纳入了1996年至2010年间来自中国台湾的50,000名癌症患者。根据三种不同的方法对敏感性和特异性进行了比较,但研究人员并未发现它们的显着性。结果准确性和特异性方面的差异。天真贝叶斯的解释能力优于其他方法,并且在信息丢失,非线性情况建模和随机医疗问题的情况下也很有效。研究了决策树,朴素贝叶斯和人工神经网络。一台依赖度增强的朴素贝叶斯分类器和一台朴素信度分类器2用于数据预处理和决策目的,其预测结果优于传统方法。当决策树和人工神经网络结合使用时,获得良好预测结果的机会就很高。提出了一种新的进化方法,用于肺癌基因的有效分类。当被选择的基因的更小数目,这种方法提供了更好的分类精度。数据挖掘可以确定指定时间的任务频率。根据他们的研究,可以通过数据预处理和数据建模将数据挖掘应用于疾病预测。进行数据挖掘以对肺癌进行系统的研究。该数据是从医学确诊和诊断的患者中收集的。他们的结果表明,基于训练的方法比交叉验证方法的效果更好。提出了一种新的分类器,将影响因子方法和GolubandSlonim方法与k最近邻相结合。他们在肺癌和前列腺癌数据方面取得了良好的分类性能。使用带有随机森林树分类器的神经网络来选择癌症基因。根据他们的结果,借助训练有素的神经网络可以提高分类能力。使用基于网络的方法对164位吸烟者进行识别,以鉴定与吸烟相关的基因。他们确定了与肺癌生存相关的基因,以及可以区分吸烟者和非吸烟者的基因。该方法的准确性为73.0%。准备了一个包含400名患者的数据库,其中包括有或没有癌症的患者。对于预处理,使用k均值聚类。结果证明该方法可有效地识别肺癌风险建议基于支持算法,决策树和KNN等不同算法的比较,将SVM用于肺癌分类。提出了一种基于决策树,神经网络和逻辑回归的预测模型。研究表明,这些算法能够对肺癌数据集进行准确分类。
进化算法是受自然启发的基于种群的元启发式优化算法。主要的进化算法是遗传算法,ACO,PSO,ABC和模因算法。正在讨论与先前讨论的方法相结合的进化算法。即使在处理复杂问题时也可以找到最接近的解决方案。提出了一个基于仿生增强计算的系统,称为高维数据集的蚁群优化选择。ACO-S可以产生小尺寸和更好表征的高质量子集。建议ACO抽样以解决班级不均的问题。与传统方法相比,该方法具有更大的基础投机能力。建议使用神经网络和模糊逻辑来训练数据。然后,通过使用ACO,提高了分类精度。比较了PSO和GA。他们将SVM与高维微阵列数据的两种算法结合使用进行分类。PSO和SVM的结合能够发现有趣的基因。将最小冗余最大相关性-GA与GA-SVM包装器和MRMR过滤器进行了比较。在选择和分类性能方面,MRMR-GA产生了更好的结果。提出了一种新的基于群体优化的分类问题多目标算法,称为多目标粒子群优化RBF网络。结果表明,该方法具有良好的泛化能力和紧凑的网络结构。努力使用ACO,交替优化和PSO来最小化模糊c均值模型。他们提出了两种不同形式的PSO:第一种是PSO-V,用于将粒子表示为聚类中心的组成部分。第二个是PSO–U,用于将粒子表示为非缩放且非标准化的隶属度值。将PSO-V和PSO-U与AO和ACO进行了比较。将它们与两个不同的数据集进行了比较:单个异常值和肺癌。ACO,PSO-V和PSO-U的结果比AO慢,但是在每一轮迭代之后,PSO变体的性能都明显优于后者。建议用离散粒子群优化和规则修剪进行肺癌诊断,并获得68.3%的分类准确率。使用了基于PSO的同时学习框架进行聚类和分类。PSOSLCC应用于实际应用中,即纹理图像分割,并获得了良好的性能,表明它可以对问题进行大规模分类。提出了一种基于PSO和决策树分类器的统计分析方法。他们发现通过对11个基因表达癌症数据集进行实验,该方法优于其他流行的分类器。提出了一种基于PSO的高效混合方法,并带有一个极限学习机分类器。它具有自我调节的学习能力,表现出良好的泛化性能。上述研究表明,数据挖掘和进化算法在肺癌检测中都是有效的。尽管进化算法具有处理复杂问题的能力,但仅数据挖掘算法可能会失败。因此,在分类和聚类的不同级别将两种方法结合起来可能会产生更好的结果。
烟草制品的使用每年在世界范围内造成约500万人死亡,其中发展中国家为241万人,发达国家为243万人。在印度,每年发生500万例死亡中,约100万可能是由于癌。到2020年,这一数字估计将达到150万。吸烟占全世界肺癌发生率的80.0%。香烟或比迪烟吸烟导致的25-69岁年龄组中大多数死亡的。一些研究已经报道,肺癌病例15.0%是由遗传因素,空气污染,或暴露于氡气,石棉和农药引起。这些研究还显示,印度非吸烟者几乎患上肺癌如因为接触杀虫剂和其它致癌物吸烟者的相同的机会。海外医疗网的结果表明,必须严格限制烟草制品的使用。
这项研究有一些局限性。首先,最大的数据收集是基于数据的持续可用性,但是在某些情况下,数据来自一次性的社区或医院调查。来自印度和埃及的发病率和死亡率数据可能不完整。因此,发病率和死亡率可能与实际情况有所差异。但是,这些错误可以忽略不计,因为从确定的来源和已发表的论文中获取了尽可能多的数据。其次,海外医疗网仅考虑了英国,美国,印度和埃及的肺癌统计数据。如果考虑更多国家,结果将有所不同。第三,需要进一步研究来阐明如何将数据挖掘和进化算法一起使用,以及哪种组合技术将是最有效的。最后,在发达国家,例如英国和美国,肺癌的死亡率正在下降,并且已经实现了很高的存活率,这可能是由于提高认识计划和先进的医疗技术所致。但是,在印度和埃及等发展中国家,需要做出巨大的努力来降低癌症死亡率。
海外医疗网还分析了计算方法在肺癌早期检测中的有用性。研究发现,最常用的数据挖掘技术包括分类,聚类和关联规则挖掘,但如果将数据挖掘与进化算法结合使用,则可以获得更好的结果。海外医疗网还发现,正确识别肺癌症状后,发现的机会会增加;对于这种分类,可以采用数据挖掘的聚类技术。由于肺癌的特征可能不同,因此采用单一方法获得良好结果的机会较低。数据挖掘和进化算法可以更好地表征不同级别的肺癌症状,将其分组。
|