跳到主要内容

机器学习揭示妇科癌症的一个敏锐的风险预测框架及其对女性心理的影响:孟加拉国的观点

抽象的

背景

在本研究中,我们利用机器学习和数据挖掘的方法开发了一个灵敏的系统来预测与压力相关的子宫颈癌和卵巢癌的风险水平。

结果

对于运作因素和地区,与物流回归,随机森林,Adaboost,Naïve,神经网络,KNN,CN2规则诱导,决策树,二次分类器等几种机器学习模型与标准度量,例如,F1,AUC,CA。对于确定性信息,GASI率,GINI指数对于宫颈癌和卵巢癌揭示。使用不同的特征选择评估者对属性进行排序。然后对显著性因素进行最显著性分析。儿童等因素,第一次性交年龄,丈夫年龄,罂粟试验,年龄是宫颈癌最重要的因素。另一方面,生殖器面积感染,妊娠问题,药物,流产的使用,以及儿童的数量是卵巢癌的重要因素。

结论

根据显著性水平对产生的因素进行合并、分类、加权。利用排序算法对分类因子进行索引,并给出权重值。随后制定了一种算法,可用于预测宫颈癌和卵巢癌与妇女心理健康的风险水平。这项研究将对低收入国家如孟加拉国产生重大影响,因为大多数低收入国家的妇女没有意识到这一点。由于这两种癌症可以说是女性最敏感的癌症,因此从算法开发应用程序也将有助于减少女性的心理压力。今后还将增加更多的数据和参数用于这方面的研究。

同行评审报告

研究重点

  • 对最常见妇科癌症的数据集进行的研究。

  • 利用机器学习方法对数据进行分析。

  • 研究结果表明影响因素显著,显著水平显著。

  • 根据分析和加权结果设计了一种算法。

  • 基于算法的App得出妇科癌症风险预测水平。

介绍

神经退行性疾病和神奇的神经退行性问题被认为是一些主要疾病的真正因素。可以看出,患有神经退行性疾病疾病的个体有55%的几率受到宫颈癌的影响[12]。经历了创伤后患者后神经退行性疾病疾病至少6副作用的妇女对卵巢癌的影响更为重要危险[3.]。根据谁,第二次疾病是癌症,2018年导致960万人死亡[4.]。不规则细胞的不受控制的增长超过了它们正常的领地,有能力攻击或可能扩散到不同的器官,这就是癌症。在不同类型的癌症中,子宫颈癌和卵巢癌是对女性健康危害最大的癌症[5.]。由于每年宫颈癌和卵巢癌,超过3,00,000名女性的患者进一步诊断出50万百万。大约5,00,000名女性每年受宫颈癌的影响,并且由于宫颈癌,274 000次死亡[6.]。

评估(7.]预计对下肢淋巴管(LLL)的危险因素是一种持续和疲软的病情,令人困难的患者通过淋巴细胞切除术治疗妇科癌症,并为其发生的预见模式。为了鼓励在妇科癌症领域的未来研究,在研究中介绍了一种模型[8.]来预测心理和行为发病的风险。神经退行性疾病与多种神经退行性问题有关,特别是压力在阿尔茨海默氏症感染和一些疾病中的病理生理学重要性。先前的一些研究也表明,神经退行性疾病会刺激子宫颈癌和卵巢癌[9.10]。国家癌症研究所总结了宫颈肿瘤在子宫颈中构成,一个与子宫和阴道相关的身体部位[1112人类乳头状瘤病毒(HPV)是子宫颈癌的主要原因[13]众所周知,人乳头瘤病毒(HPV)对子宫颈癌有影响。14在使用HPV抗体计划之前和之后,基于马来西亚居民的HPV和宫颈癌的信息进行了审核文章。在 [15一项研究表明,他发现宫颈发育缓慢,开始时没有显示任何迹象,似乎很难发现,但可以通过相应的巴氏试验发现。对我国70例宫颈癌引起的失眠患者进行了研究[16]。这是初步检查患有宫颈疾病或加剧的睡眠剥夺患者的预议检查患者[17]。在[16]的研究发现,创伤后应激障碍(PTSD)的治疗与卵巢癌的生长之间存在实质性的关系。据美国癌症研究所称,人们认为卵巢癌起源于卵巢,但最近的研究表明,许多卵巢肿瘤可能起源于输卵管,它位于子宫之后,包含两个卵巢。可能宫颈癌、卵巢癌很难识别[18]。卵巢位于盆腔深处,很难看到或摸到[1920.]。卵巢上皮性疾病仍然是一种异常危险的疾病(Hunn & Rodriguez, 2012)。可行性研究[20.]提供筛选和预防卵巢癌的风险管理选择。由于P53基因的修正,由于神经退行性疾病影响的细胞,卵巢上皮癌受影响的细胞[21]。一项研究[22[介绍卵巢癌细胞中燃烧蛋白排放的数据被胁迫激素提示。

根据(23,癌症是死亡的主要来源。最近的研究(15)的研究表明,肺癌已迅速蔓延,并成为全球公认的最严重的疾病。一项完整的研究在[24]建立一个框架,该框架可以用个人利用来测试他的肺癌风险水平。利用所获得的知识,实验能够预测肺癌的风险水平[25]。另一项研究建立了一个系统,可以让个人了解自己患皮肤癌的风险水平[26]。目前,1型糖尿病也是孟加拉国令人震惊的疾病。型称为青少年糖尿病或胰岛素从属糖尿病的1型糖尿病是一种可互突变的条件,其中胰腺主要呈紫外线。从达卡依赖于特定调查问卷的达卡收集信息,以表明要素的关联和临界性[27]。

在本文中介绍“部分,表示风险预测模型,并讨论了预测背后的技术。我们在三个数据集中进行实验“材料与方法,在知识发现的帮助下进行。用一组图表说明了它们的预测效率。本节还包含我们的研究输出,这是我们为风险预测准备的移动应用程序。为了准备这个应用程序,我们首先做了一个方程来区分风险级别,并准备了一个算法。该算法在“材料与方法“ 部分。最后,这项工作得出了“结果和讨论并对今后的工作进行了展望。

材料与方法

本文采用流行的数据挖掘和机器学习模型与精度、精度、召回率、F1、支持度等指标进行了比较[28这是通过sklearn库发现的[29的机器学习和数据挖掘工具包。我们进一步提出了一个基于这两个工具包结果指标之间差异的等式。利用先验算法描述了描述因素间相关性的重要因素之间的相关关系。排序算法是比BestFirst和GreedyStepwise算法最有效的用于索引特征排序的算法。采用rank算法进行特征选择。对rank算法的所有评价者导出了数据分析的关键因素[30.]。然后对其进行比较,得到最有价值的属性。对于预测来说,找出显著性因素是很重要的。这里根据信息增益、增益比、基尼指数等因素的重要性进行了汇总[3132]。

数据收集

总共有866个数据,从患有卵巢,宫颈和胁迫(精神)紊乱等疾病的患者的各种诊断中心收集。从正在经历宫颈癌的人中收集161例女性患者的数据。数据从包含25个属性的一组问卷中收集。522例卵巢癌患者采访了含有46个风险因素的规定问题。已提供宫颈癌和卵巢癌的一组质询仪(附加档案1和附加文件2) 分别。

数据预处理

数据清洁,数据集成,数据选择,数据转换是数据预处理的四个主要任务,以将数据集转换为从嘈杂,不一致的数据到适合采矿和学习可预测性的格式。患者提供损坏或扭曲的数据,其中患者提供的缺陷信息,同时回答问卷是嘈杂的数据。在数据清洁阶段,删除了那些嘈杂,冲突和不一致的数据。有价值的数据在数据集成阶段加入。从数据选择阶段的数据集中检索适合分析的数据。最后,在数据转换中,数据转换为适当的结构,适合数据挖掘和机器学习分析。要忽略数据的碰撞,更改了少量数据。

机器学习模型的性能评估

在这节课中,我们使用了8个分类器分别是SVM, Random Forest, Logistic Regression, AdaBoost, Naïve Bayes, Neural Network, kNN, CN2 rules Inducer进行评价,用橘黄色和将近10个分类器分别是SVM, Random Forest, Logistic Regression, AdaBoost, Naïve Bayes, Neural Network, kNN,高斯过程,Decision Tree,采用二次分类器对机器学习模型进行评价。在这种情况下,使用诸如ROC曲线下面积(AUC)、精度、分类准确性、回忆率、特异性、F测量、支持度等标准指标来衡量表现。利用子宫颈、卵巢和应激数据集的重要影响因素构建决策树。

性能指标:分析了数据集的分类准确率。对于每个数据集,识别出两个类,即正类和负类。一个预测有四种可能性,即真阳性、真阴性、假阳性、假阴性。真正的积极和真正的消极被描述为做出了多少正确的预测。假阳性和假阴性提供了有多少错误的预测是由正类和负类,当它们属于正类和负类。

准确性:它定义了从比率EQ的预测总数正确分类的正确预测的数量。(1

$$精确率= \ FRAC {TP + TN} {{TP + TN + FP + FN}} $$
(1)

精度:从正面预测的总数中解释分类器正确分类出的正面预测的数量(2

$$ precision = \ frac {tp} {{tp + fp}} $$
(2)

回忆:描述整个方程式方程式(3.

$$recall = \frac{TP}{{TP + FN}}$$
(3)

F测量:它预测精度的平均值并召回EQ。(4.

$$F - measure = \ $ frac{{2 \times \left({precision \times recall} \right)}}{precision + recall}$$
(4)

特异性:衡量分类器Eq正确识别的整体负预测的数量(5.

$$专一性= \frac{TN}{{TN + FP}}$$
(5)

支持:定义培训后分析并拆分整个数据集的数据集数。从我的分析中,看到Sklearn只使用了24%的整个数据集。(6.

$$支持= 0.24 \ times no。\,\,data \中的\,dataset $$
(6)

第一个和最重要的概念来判断概率是通过各种分析找到重要的因素。该研究具有许多衍生品和算法来找出重大因素。使用信息增益,GAIN比率,GINI指数获得了重要因素的水平。信息增益:它是对不确定度降低的测量。它从熵估计。熵是测量处理信息的可变性的概率。熵越高,越难以从该数据方程中进行任何确定。(7.

$$ \ begined {对齐} entopy \ left({p_ {1},p_ {2} \ ldots p_ {n}}&= - p_ {1} \ log p_ {1} - p_ {2} \log p_ {2} \ ldots \ ldots - p_ {n} \ log p_ {n} \\ left(x \ light)&= \ mathop \ sum \ limits_ {i = 1} ^ {c} - p_ {\ log p_ {i} \\ e \ left({t,x} \ oled)&= \ mathop \ sum \ limits_ {c \ in x} p \ left(c \ light)e \ left(c \右)\\ \结束{aligned} $$
(7)

值概率的总和倍率相同标签的日志概率。通过扣除标签和特征从标签信息增益的熵的值获得EQ。(8.

$$增益\ left({t,x} \右)= e \ left(t \ recte) - e \ left({t,x} \右)$$
(8)

增益比率:通过将忽略的信息视为忽略的信息来修改信息增益,包括减少信息增益EQ的偏差的分支的数量和大小。(9.10

$ $ SplitEntropy \离开({T X} \右)= \ mathop \总和\ limits_ {X c \} - \压裂{{T_ {X}识别}}{T} \ log \压裂{{T_ {X}识别}}{T} $ $
(9)
$$ gainratio = \ frac {{gain \ left({s,a} \ revent)}} {{splitentropy \ left({s,a} \ revile)}} $$
(10)

GINI索引:测量单个功能的杂质。通过从一个等式中减去平方概率的总和来获得它。(1112

$$ gini \ left(x \右)= 1 - \ mathop \ sum \ limits_ {i = 1} ^ {c} \ left({p_ {i}} \ revally)^ {2} $$
(11)
$$ Pr * * * * * * * * * * * * * *
(12)

通过信息获取,我们获得了特定标签个体特征的确定性。增益比为我们提供了同样的信息,包括数据集的内在信息。基尼指数(Gini index)提供了一个个体因素的“肮脏程度”。所有这些值都是用0和1表示的。方程分析卡方检验和特征选择评价的结果,我们发现最显著的因素是在宫颈癌和卵巢癌与压力相关。然后根据这些因素的显著性水平给予不同的分数。随后,情商。12。被定义为分离个人的风险水平。

结果和讨论

在本节中讨论和分析了结果和讨论部分。已经应用了一些数据挖掘和机器学习技术。我们已经分析了宫颈和卵巢的数据集,发现了常见的模式重大属性。选择属性是常见的和高度重要的因素,并与宫颈癌或卵巢癌的可能性相关。表格1显示了信息增益、基尼指数和参数增益比的值。表格1还显示了Chi-Square测试值以及排名值。从统计分析获取Chi-Square值,并从数据挖掘算法中找到排名值。使用不同的属性评估器进行对参数的不同分析,并已显示在表中2

表1信息增益,增益比,GINI指数,CHI广场和Ranker值的属性值
表2不同算法排序和不同子评价器的属性值

属性在不同属性中的序列位置是指该属性在相应子评价者排名表中的位置。

数字1表示实际和预测数据的逻辑回归分析值。在x轴中,总共25个值表示25个单独的参数,参数的序列式与表的串行相同2。第24个参数与妇女的心理健康或压力有关。下图显示线性逻辑回归显示受影响妇女的no较高。图KDE图。2倾向于估计受影响和非受影响女性的概率分布功能。The sub-parameters were assigned numeric values e.g., 1 represents above 60, 2 represents 46–60 etc. The affected plot varies from 1 to 1.45 means a higher number of affected women rely on age more than 60 and similarly, 2–0.7 points describe that the second most affected women had an age of 46–60. Violin plot visualizes the distribution of data and its probability density as shown in Fig.3.。根据图4的小提琴图,3-5或75岁或以上的儿童患有宫颈癌或卵巢癌。3.。0级别的小提琴意味着具有更多癌症的儿童。

图。1
图1

不同参数的线性回归概率

图2
figure2

根据年龄分布,受影响人群和未受影响人群的KDE图

图3.
图3

卵巢癌的小提琴图和没有儿童的

3.4.5.显示了根据不同机器学习分类器的精神压力,卵巢癌和宫颈癌的数据的准确性,并且还显示了可用于比较机器倾斜模型的分类精度,F1,精密度量。精度级别在0和1之间进行组织。模型的预测精度随着更接近的值而增加。它还表明了重要性。疾病的所有重要因素和子因素都是在Ranker算法的帮助下索引,然后组合以获得后来用于预期的整个图片。表格中显示了具有重量值的显着特征6.。最后,已经基于表的重量值开发了一种算法6.

表3不同机器学习算法下应力的精度
表4不同机器学习算法下卵巢癌的准确率
表5不同机器学习算法对宫颈癌的准确率
表6参数权重值

在分析宫颈癌,卵巢和应激因子的重要性之后,我们衍生出一种预测下面显示的疾病风险水平的算法,

  • 步骤1。开始

  • 步骤2。读的重量

  • 步骤3. Total_weights← \(\ \)和权重

  • 步骤4。prediction_difference←

  • 第5步。如果total_weights < = prediction_difference +\(\总和最低\)然后打印LOW RISK

  • 步骤6.否则如果Total_weights <=(prediction_difference * 2)+ \(\总和最低\)然后打印MEDIUM RISK

  • 步骤7。如果total_weights < = (prediction_difference *3) +\(\总和最低\)然后打印高风险

  • 步骤8。否则打印非常高的风险

  • 步骤9.停止

算法流程图如图所示。4.。借助上述算法,我们找到了疾病的各自流程图。最后,我们将所有的流程图和显著性因素组合在一起,以引出较优的显著性因素。然后结合子宫颈、卵巢和压力因素,我们绘制了所有这些因素的流程图。从这些流程图和使用算法预测的重要因素,我们已经准备了一个应用程序,如图所示。5.6.。该应用程序充分准备,有意将未来数据存储在用户提供的云中,并使用该信息进行进一步调查。在培训和测试模型后,我们可以获得更好的结果,这些数据使我们有信心使用用于预测这些疾病。在利用即将到来的数据之后,我们将能够更准确地预测疾病。

图4.
装具

设计算法的流程图

图5.
figure5

Android应用于癌症风险预测(女性健康)

图6.
figure6

癌症风险预测(女性健康)Android应用结果

宫颈癌和卵巢癌的联合决策树如图所示。4.,这表明如果一个女性有超过2个孩子,那么宫颈病毒有最大的机会。如果她有1-2名儿童和她的第一次交往,那么当她不到16岁时,比宫颈癌的最大可能性也是最大的。在这里,为新出现的宫颈癌进行6个珍贵因素。同样,服用15个参数,确定出现出现卵巢癌的风险。最危险的因素是堕胎,丈夫的年龄,酒精消费等。

结论

宫颈癌和卵巢癌是孟加拉国妇女死亡的主导原因。大多数人都没有意识到它。由于宫颈癌和卵巢癌,死亡是不可避免的。从调查结果中,我们得到了证据,即免疫反应可能因神经变性疾病而受损可能甚至可以增强癌症的发育。在这种审查中,小心地分析了宫颈癌和卵巢癌的危险因素。在这里,使用SVM,随机林,物流回归,Adaboost,Naïve贝叶斯,神经网络,KNN,CN2规则,决策树,已经使用了二次分类器的数据挖掘和机器学习模型,并将这些模型与两种不同的工具进行了比较。神经退行性疾病的所得结果表明,Adaboost在橙色的分类精度为78.8%,Sklearn中的79%。在宫颈癌的情况下,物流回归提供了84.8%的最佳分数,并且我们已经获得了79.3%的Sklearn。另一方面,SVM显示橙色的最佳精度为88.3%,决策树为卵巢癌的Sklearn提供98.6%的分类准确性。基于所有分析最后,通过从分析生成的重量值开发了一种算法以及智能应用程序的算法。 Future works can be done by improving the dataset size, tuning parameters, and more effective analysis.

工作摘要

子宫颈癌和卵巢癌是最可怕的疾病之一的女性接近低国家,如孟加拉国。孟加拉国社区缺乏对这两种癌症的教育和认识。先前的研究发现,压力会以某种方式影响这两种癌症。在当今时代,对孟加拉国女性宫颈癌和卵巢癌的任何预测都是不可能的。目的:探讨压力因素与最显著因素、宫颈癌、卵巢癌之间的关系。根据其价值因素及应力参数对宫颈癌和卵巢癌的发生作出预测。方法:对298例宫颈癌和522例卵巢癌患者进行病例对照研究。宫颈癌病例197例,对照组100例。对267例卵巢病例和254例对照进行数据挖掘分析。分析了几种机器学习模型的性能,如logistic回归,随机森林,AdaBoost, Naïve Bayes,神经网络,kNN, CN2规则诱导器,决策树,二次分类器与它们的标准度量进行了比较。 For certainty info gain, gain ratio, gini index were revealed of both cervical and ovarian cancer. Attributes were ranked using different feature selection evaluators. Then the most significant analysis was made with the significant factors. Factors like children, age of first intercourse, age of husband, pap test, age are significantly higher factors of cervical cancer. On the other hand, genital area infection, pregnancy problem, use of drugs, abortion, number of children important factors of ovarian cancer. The analysis was made with significant factors of stress, cervical and ovarian cancer that will help us to predict the risk of occurring cervical or ovarian cancer and may help to abate the cancer not only from Bangladesh but all over the world. After analyzing a weightage table has been created to make an algorithm which can predict risk level of two fatal cancer of Women (cervical and Overian) along with mental health.

手稿中使用的方法

所有的方法都按照相关的指南和规定进行。

知情同意/对知情同意的弃权

Daffodil国际大学软件工程系的机构审查委员会/伦理委员会免受了书面知情同意的需求。由于关注的医院数据集由用于研究目的的De-Idited二级数据组成。所有参与者的口头同意都被认为没有任何信息将被披露,数据集只能用于研究目的。

数据和材料的可用性

通讯作者仅可根据研究要求提供资料。

参考文献

  1. 1.

    癌症与神经退行性疾病之间的分子对话。中国生物医学工程学报(英文版);2010;

    中科院文章谷歌学术

  2. 2.

    子宫颈癌。留言。https://www.who.int/health-topics/cervical-cancer#tab=tab_1。2021年2月16日通过

  3. 3.

    具有较高风险的卵巢癌的患者癌症网络。留言。https://www.cancernetwork.com/view/ptsd-associated-higher-risk-ovarian-cancer.。2021年2月16日通过

  4. 4.

    癌症。留言。https://www.who.int/news-room/fact-sheets/detail/cancer。2021年2月16日通过

  5. 5.

    子宫内膜癌,卵巢癌和宫颈癌。留言。https://www.clevelandclinicmeded.com/medicalpubs/diseasemanagement/womens-health/gynecologic-malignancies/。2021年2月16日访问

  6. 6。

    世界卫生组织。2008.宫颈癌,人乳头瘤病毒(HPV)和HPV疫苗:政策制定者和卫生专业人员的关键点。世界卫生组织。

  7. 7。

    Kuroda K,Yamamoto Y,Yanagisawa M,Kawata A,Akiba N,Suzuki K,Naritaka K.危险因素和妇科癌症淋巴结切除术后下肢淋巴米肿瘤的预测模型:基于医院的回顾性队列研究。BMC妇女健康。2017; 17(1):1。

    文章谷歌学术

  8. 8。

    安德森BL。预测性心理和心理发病率,提高妇科癌症妇女的生活质量。癌症。1993; 71(S4):1678-90。

    中科院文章谷歌学术

  9. 9。

    神经退行性疾病的脑磁畴振荡。Sci众议员2021;11(1):1。

    文章谷歌学术

  10. 10。

    KEGG:整合病毒与细胞生物。核酸研究:2021;49(D1): D545-51。

    中科院文章谷歌学术

  11. 11.

    Ueda K, Yanaihara N, Iida Y, Kobayashi R, Kato S, Matsuda Y, Tomita K, Yamamura N, Saito R, Hirose S, Kuroda T.对374例早期宫颈癌患者进行危险因素分析。产科法令2021;47(1):270-8。

    文章谷歌学术

  12. 12.

    Okugawa K,Yahata H,Sonoda K,Kodama K,Yagi H,Ohgami T,Yasunaga M,Onoyama I,Kobayashi k,Kobayashi H.宫颈癌腹切除术后的辅助化疗评价:单一机构经验。int J Clin on incol。2021; 26(1):216-24。

    文章谷歌学术

  13. 13.

    人乳头瘤病毒感染:流行病学和病理生理学。Gynecol杂志。2007;107 (2):S2-5。

    中科院文章谷歌学术

  14. 14.

    insinga rp,dasbach ej,elbasha eh。人乳头瘤病毒(HPV)疾病的流行病学自然历史与临床管理:HPV动态传输模型开发中文献的关键与系统综述。BMC感染者。2009; 9(1):1-26。

    文章谷歌学术

  15. 15.

    Soo Ra,Stone Ec,Cummings Km,Jett Jr,Field JK,Grenen Hj,Mulshine JL,Yatabe Y,Bubendorf L,Dacic S,Rami-Porta R.胸廓肿瘤科学进展2016. J Thorac on Col。2017; 12(8):1183-209。

    文章谷歌学术

  16. 16。

    Roberts Al,Huang T,Koenen Kc,Kim Y,Kubzansky Ld,Tworeger SS。肿瘤后患者的癌症患者患者增加有关:卵巢癌的风险增加:一项潜在和回顾性的纵向队列研究。可以res。2019; 79(19):5113-20。

    中科院文章谷歌学术

  17. 17。

    阿斯兰D,Napuli J,Walters S. Chiropractic Colleges协会研究议程会议2020诉讼程序。j chiropred教育。2020; 34(1):66。

    谷歌学术

  18. 18。

    他,Beesley A,Kim Th,Kim Th,Ringer J,Young Sl,Jeong JW,Schammel DP,Lassy Ba,Elder JW,豆类L.在卵巢癌中患有癌症和没有子宫内膜异位症的卵巢和SIRT1的差异表达。SCI。2020; 27(1):145-51。

    中科院文章谷歌学术

  19. 19。

    jason GC, Kohn EC, Kitchener HC, Ledermann JA。卵巢癌。《柳叶刀》杂志。2014;384(9951):1376 - 88。

    文章谷歌学术

  20. 20。

    Gaba F, Blyuss O, Liu X, Goyal S, Lahoti N, Chandrasekaran D, Kurzer M, Kalsi J, Sanderson S, Lanceley A, Ahmed M。癌症。2020;12(5):1241。

    中科院文章谷歌学术

  21. 21。

    Sp N, Kang DY, Kim DH, Lee HG, Park YM, Kim IH, Lee HK, Cho BW, Jang KJ, Yang YM。甲基磺酰甲烷通过p53介导的SDHA/HPRT1在赛马骨骼肌细胞中的表达来抑制皮质醇诱导的应激:这是对抗运动应激的一个主要步骤。1 .中国生物医学工程学报;

    中科院PubMed谷歌学术

  22. 22。

    Colon-Echevarria CB,Ortiz T,Maldonado L,Hidalgo-Vargas MJ,Pérez-莫拉莱斯J,Aquino-Acevedo A,Herrera-Noriega R,Bonilla-Claudio M,Castro Em,Armaiz-Pena GN。唑醇酸废除抑制应激诱导的巨噬细胞浸润,PDGF-AA表达和卵巢癌生长。癌症。2020; 12(9):2671。

    中科院文章谷歌学术

  23. 23。

    除了老年人之外,癌症已经超过心脏病成为导致死亡的主要原因。中华肿瘤杂志;2005;30(5):531 - 531。

    文章谷歌学术

  24. 24.

    Cassidy A, Duffy SW, Myles JP, Liloglou T, Field JK。肺癌风险预测:早期发现的工具。国际癌症杂志。2007;120(1):1 - 6。

    中科院文章谷歌学术

  25. 25.

    Rebbeck TR, Burns-White K, Chan AT, Emmons K, Freedman M, Hunter DJ, Kraft P, Laden F, Mucci L, Parmigiani G, Schrag D.精确预防和早期发现癌症:基本原则。癌症。2018;8(7):803 - 11所示。

    文章谷歌学术

  26. 26.

    Gordon R.皮肤癌:流行病学概述和危险因素。在:肿瘤院护理研讨会2013年8月1日(第3卷,第3页,第3页,第160-169页)。WB桑德斯。

  27. 27.

    Azad K. 1型糖尿病:孟加拉国的观点。印度j内切蛋白代谢。2015; 19(4):S9。

    文章谷歌学术

  28. 28。

    基于机器学习和数据挖掘技术的心脏病预测。心说。2015;7(1):129 - 37。

    谷歌学术

  29. 29。

    Scikit-Learn:Python-Scikit的机器学习 - 学习0.24.1文档。(N.D.)。https://scikit-learn.org/stable/。2021年2月16日访问

  30. 30.

    Kumar UK,Nikhil MS,Sumangali K.使用投票分类器技术预测乳腺癌。:2017年IEEE智能技术和管理层国际智能技术会议,用于计算,通信,控制,能源和材料(ICSTM);IEEE。2017. p。108-14。

  31. 31.

    Shouman M,Turner T,Stocker R.使用决策树诊断心脏病患者。在:第九张澳大利亚数据挖掘会议 - 第121卷的诉讼程序。23-30。

  32. 32。

    关键词:慢性肾病(CKD),混合滤波包装器,内嵌特征选择,预后中华医学会临床医学分册第7期(9):2511-30页。

    谷歌学术

下载参考

确认

作者感谢Nahid Farhana Chowdhury(妇科医生)和Tonusree Chakraborty博士(助理外科医生)来完成调查问卷并收集数据集。作者感谢那些参与这项研究的人,也很感谢那些在案件和控制团体的人,并为进行这项研究提供了有价值的信息。

资金

这项研究没有资金。

作者信息

隶属关系

作者

贡献

Sayed Asaduzzaman(通讯作者、第一作者):概念化;方法;验证;数据管理;监督;Md. Raihan Ahmed:软件;方法;正式的分析;原创作品草案;之内瑞哈娜:调查; Writing—Original Draft; Formal analysis; Setu Chakraborty: Data Curation; Resources; Md. Shariful Islam: Data Curation; Resources; Touhid Bhuiyan: Writing—Review & Editing; Project administration. All authors read and approved the final manuscript.

通讯作者

对应到赛义德Asaduzzaman

道德声明

伦理批准和同意参与

该研究经奥克塞尔国际大学软件工程系的机构审查委员会/伦理委员会批准。

同意出版

不适用。

利益争夺

所有作者之间没有兴趣冲突。

额外的信息

出版商的注意事项

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

额外的文件1。

宫颈癌数据收集的样本质询。

额外的文件2。

卵巢癌数据收集的样本质询。

权利和权限

开放获取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料包括在文章的创作共用许可中,除非在材料的信用线中另有说明。如果材料没有包含在文章的创作共用许可证中,而您的预期使用不被法律法规允许或超过允许的使用,您将需要直接获得版权持有人的许可。如欲浏览本许可证的副本,请浏览http://creativecommons.org/licenses/by/4.0/。“创作共用公共领域”豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

Asaduzzaman,S.,Ahmed,M.R.,Rehana,H.et al。机器学习揭示妇科癌症的一个敏锐的风险预测框架及其对女性心理的影响:孟加拉国的观点。欧宝娱乐合法吗22,213(2021)。https://doi.org/10.1186/s12859-021-04131-6

下载引用

关键字

  • 妇科癌症
  • 重大风险因素
  • 智能预测工具
  • 女性心理学
  • 机器学习
  • 数据挖掘
\