资源类型:
收录情况:
◇ 中华系列
文章类型:
机构:
[1]昆明理工大学信息工程与自动化学院,650500
[2]云南省第一人民医院肿瘤内科,昆明650032
内科片
肿瘤内科
云南省第一人民医院
出处:
ISSN:
关键词:
非小细胞肺癌
不平衡
特征选择
生存预测
摘要:
目的 利用机器学习方法预测非小细胞肺癌(NSCLC)患者的5年生存状况,提高预测效率与预测准确性.方法 采用SEER数据库的NSCLC数据进行实验.针对患者数据存在的不平衡问题,使用Borderline-SMOTE法进行数据采样,采用基于扰动理论的特征选择(PFS)方法和决策树(DT)算法筛选特征并构建患者术后生存预测模型.结果 平衡后的数据集纳入了年龄、组织学分级、种族、发病部位、肿瘤分期、病理类型、手术类型共7项预后相关变量.与LASSO、Tree-based、PFS-SVM和PFS-kNN模型相比,使用PFS-DT构建的模型具有最优的预测效果.结论 基于PFS-DT的患者生存预测模型有效提高了NSCLC患者术后生存预测的准确率,可为医生提供治疗和改善预后方面的参考.
基金:
国家自然科学基金(81760022);国家博士后科学基金(2016M592894XB);云南省重大科技专项(2018ZF017)
第一作者:
第一作者机构:
[1]昆明理工大学信息工程与自动化学院,650500
通讯作者:
推荐引用方式(GB/T 7714):
赵阳,汪晓洁,马磊,等.基于Borderline-SMOTE和PFS构建非小细胞肺癌生存预测模型[J].国际生物医学工程杂志.2019,42(4):336-341.