학술논문

基于机器学习算法筛选鼻咽癌诊断基因标志物的研究 / Screening of genetic markers for diagnosis of nasopharyngeal carcinoma based on machine learning algorithm
Document Type
Academic Journal
Source
实用临床医药杂志 / Journal of Clinical Medicine in Practice. 27(7):6-11
Subject
鼻咽癌
基因组学
机器学习
生物信息学
支持向量机递归特征消除
套索回归
Language
Chinese
ISSN
1672-2353
Abstract
目的 基于最小绝对收缩和选择算子(LASSO)算法与支持向量机递归特征消除(SVM-RFE)算法筛选用于鼻咽癌(NPC)诊断的特征基因标志物.方法 从GEO数据库下载基因表达微阵列数据集GSE53819、GSE13597作为训练集,从GTEx数据库、ICGC数据库分别下载转录组测序数据集GTEx-NPC、ICGC-NPC作为训练集、验证集.通过基因表达差异分析筛选NPC相关差异表达基因(DEGs),再通过LASSO算法和SVM-RFE算法分别筛选3个训练集中的NPC诊断特征基因.结合外部验证集,通过受试者工作特征(ROC)曲线的曲线下面积(AUC)评估特征基因对NPC的诊断效能.结果 本研究共筛选出582个NPC相关DEGs,包括156个高表达DEGs和426个低表达DEGs;基于LASSO算法与SVM-RFE算法,GSE53819、GSE13597、GTEx-NPC数据集均筛选出3个关键诊断特征基因HOXA10、AFF3、SHISA3,且GTEx-NPC数据集另有1个特征基因PLAU;ROC曲线分析结果显示,特征基因HOXA10、AFF3、SHISA3、PLAU在各数据集中诊断NPC的AUC均大于0.7,具有良好的诊断效能.结论 基于LASSO算法和SVM-RFE算法可筛选出4个潜在的NPC诊断特征基因标志物,且外部验证结果显示这些基因标志物在诊断NPC方面具有良好效能,这为NPC的早期诊断和相关基因的分子机制研究提供了有价值的参考.