文摘目的:探索焦亡相关基因在多囊卵巢综合征(polycystic ovary syndrome,PCOS)发病机制中的作用,并构建PCOS的精确预测模型。方法:利用从基因表达公共数据库(Gene Expression Omnibus,GEO)中获取的3个微小RNA(microRNA,mRNA)表达谱,分析PCOS患者与正常健康女性之间焦亡相关基因(pyroptosis-related gene,PRG)的表达差异。采用广义线性模型(generalized linear model,GLM)、随机森林(random forest,RF)、支持向量机(support vector machine,SVM)和极限梯度提升(extreme gradient boosting,XGB)这4种机器学习算法来识别疾病特征基因。采用实时定量聚合酶链反应(real-time quantitative polymerase chain reaction,RT-qPCR)法检测10例PCOS患者和10例正常健康女性血浆中特征基因的表达量。结果:建立了基于PRG的PCOS预测模型和列线图。XGB显示出最高的准确性,决策曲线分析进一步支持了这一结果。一致聚类显示PCOS病例中有两个亚组,组2比组1表现出更多的免疫浸润。差异表达分析鉴定两个亚型之间的差异表达基因,并对基因进行富集分析。临床验证结果显示,含CARD结构域的凋亡相关斑点样蛋白(apoptosis associated speck like protein containing a CARD,又称PYD and CARD domain containing,PYCARD)、黑素瘤缺乏因子2(absent in melanoma 2,AIM2)、染色质修饰蛋白4B(chromatin modifying protein 4B,CHMP4B)和NOD样受体蛋白2(NOD-like receptor family pyrin domain containing 2,NLRP2)在PCOS患者组中的表达量明显高于正常对照组,差异有统计学意义,验证了基于PRG的PCOS预测模型的准确性。结论:本研究为PCOS与焦亡之间的关系提供了初步见解,并提出了PCOS的精确预测模型。