期刊文献+
共找到1,287篇文章
< 1 2 65 >
每页显示 20 50 100
使用开源代码训练大模型的著作权法评价——以全球首例机器学习诉讼为研究样本 被引量:1
1
作者 张韬略 《知识产权》 北大核心 2025年第3期47-70,共24页
从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源... 从法解释论视角评价使用开源代码训练大模型行为的著作权法合法性时,应先分析在先许可协议对开源代码使用的约定。尽管大模型开发商可能违反了开源许可协议,且在模型训练或者输出阶段可能存在复制、修改、传播开源代码乃至删除作品来源信息的行为,但训练数据集不公开在多方面限制了著作权侵权认定。司法机关以大模型输出端为规制对象并以合理使用为利益调节器的务实思路,向大模型产业传递了友好信号,刺激了降重技术的开发,并可能进一步降低著作权人提起侵权诉讼的概率和理论正当性。个案分析过程还暴露出我国著作权法在应对大模型训练著作权侵权问题时的优缺点。我国亟需修正合理使用制度以应对大模型开发对数据训练的需求,同时应从立法和技术角度推动训练数据著作权权属信息的透明化,以保护作者著作人身权和电子权利管理信息。 展开更多
关键词 开源代码 模型 机器学习 著作权侵权 合理使用
在线阅读 下载PDF
数字经济何以赋能新质生产力:基于生产关系理论与双重机器学习模型 被引量:1
2
作者 吴小军 《暨南学报(哲学社会科学版)》 北大核心 2025年第4期29-44,共16页
数字经济作为推动城市高质量发展的新引擎,在提升新质生产力和实现可持续发展方面具有重要意义。立足生产关系视角,选取2011-2022年282个地级市面板数据,基于双重机器学习模型探究数字经济对新质生产力的作用机制。研究发现,数字经济能... 数字经济作为推动城市高质量发展的新引擎,在提升新质生产力和实现可持续发展方面具有重要意义。立足生产关系视角,选取2011-2022年282个地级市面板数据,基于双重机器学习模型探究数字经济对新质生产力的作用机制。研究发现,数字经济能有效赋能城市新质生产力发展,且数字经济对新质劳动对象的影响最大。就区域而言,数字经济对新质生产力的影响程度从大到小依次为东部地区、西部地区、中部地区、东北地区,与经济发展水平低的城市相比,经济发展水平高的城市数字经济对新质生产力的促进作用更大,且在不同资源禀赋下数字经济对新质生产力的影响程度从大到小依次为再生型城市、成长型城市、衰退型城市、非资源型城市、成熟型城市。机制检验结果表明,数字经济能够通过要素配置优化、产业结构转型等机制驱动新质生产力水平的提升。 展开更多
关键词 数字经济 双重机器学习模型 新质生产力 生产关系
在线阅读 下载PDF
基于机器学习的巷道围岩变形融合分析及预测模型
3
作者 王猛 袁春玉 +4 位作者 李鑫磊 胡超 袁瑞甫 尚栋煌 王成 《采矿与岩层控制工程学报》 北大核心 2025年第4期75-91,共17页
为解决巷道变形预测和破坏区定位困难等问题,建立了多重扰动底抽巷围岩数值分析模型,选取围岩强度、侧压系数等地质参数,巷道断面尺寸、抽采钻孔、支护强度等开采参数作为研究对象,获取了多因素扰动下底抽巷顶板变形数据集,采用随机森... 为解决巷道变形预测和破坏区定位困难等问题,建立了多重扰动底抽巷围岩数值分析模型,选取围岩强度、侧压系数等地质参数,巷道断面尺寸、抽采钻孔、支护强度等开采参数作为研究对象,获取了多因素扰动下底抽巷顶板变形数据集,采用随机森林、极端随机树、GBDT、XGBoost等机器学习算法,分别建立了单一基学习器巷道变形预测模型,以弹性网算法为元学习器,利用Stacking融合方法,对不同基学习器输出模型进行了融合处理,构建了多重扰动底抽巷围岩变形融合预测模型,评价了各特征因素对巷道变形的抑促效应,识别了影响底抽巷围岩稳定的主控因素。以赵固二矿14040运输巷底抽巷为工程背景,利用建立的巷道变形预测模型,以巷道实际生产地质条件和开采参数作为输入项,通过设置巷道期望变形量,逆向运算并输出了试验巷道建议支护强度,并指导了现场巷道支护设计及关键参数确定。现场应用结果表明,采用建议支护强度后,巷道实测变形值处于决策模型规定的允许范围内,顶板变形量仅为原支护的52%,有效控制了巷道围岩大变形。基于机器学习建立的巷道变形预测模型为巷道稳定维护提供了一条新途径,促进了煤矿巷道智能运维技术的发展。 展开更多
关键词 巷道变形 机器学习 预测模型 智能运维 围岩控制
在线阅读 下载PDF
比较多种机器学习模型预测肺移植术后受者生存
4
作者 史灵芝 刘亚灵 +7 位作者 严浩吉 喻赠玮 侯森林 刘明昭 杨航 吴波 田东 陈静瑜 《器官移植》 北大核心 2025年第2期264-271,共8页
目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随... 目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随机生存森林(RSF)和极端梯度提升树(XGBoost)构建预后模型,使用综合曲线下面积(iAUC)和时间依赖曲线下面积(t AUC)进行模型性能评估。结果 训练集和验证集的各变量差异均无统计学意义。基于VIMP筛选排名前15的变量用于建模并确定重症监护室(ICU)住院时间为最重要的因素。与XGBoost模型相比,RSF模型在预测受者生存期方面表现出更好的性能(i AUC0.773比0.723)。在预测受者6个月生存期(tAUC6个月0.884比0.809,P=0.009)和1年生存期(tAUC1年0.896比0.825,P=0.013)方面,RSF模型也表现出更好的性能。基于两种算法的预测截断值,将LTx术后受者分为高风险组和低风险组,两种模型的生存分析结果均显示高风险组受者的生存率低于低风险组(P<0.001)。结论 与XGBoost相比,基于RSF算法开发的机器学习预后模型可以更好地预测LTx受者的生存期。 展开更多
关键词 肺移植 机器学习 预测模型 随机生存森林 极端梯度提升树 生存期 比例风险回归模型 重症监护室
在线阅读 下载PDF
基于不同机器学习方法构建非心脏手术老年患者术后谵妄预测模型
5
作者 石金云 陈荣 +2 位作者 李文媛 纪木火 李青 《临床麻醉学杂志》 北大核心 2025年第3期240-245,共6页
目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等... 目的采用不同机器学习方法构建非心脏手术老年患者术后谵妄(POD)的预测模型其性能。方法收集2022年4月至2024年4月行非心脏手术的905例老年患者围术期资料,包括人口学特征、既往合并症、术前认知功能评估、实验室检查结果、麻醉记录单等共102个变量。采用单因素分析初步筛选危险因素,将有统计学差异(P<0.05)的变量纳入最小绝对收缩与选择算子(LASSO)筛选特征变量,应用随机森林(RF)、支持向量机(SVM)、自适应增强算法(Adaboost)和神经网络(NN)4种机器学习方法构建POD预测模型,采用受试者工作特征曲线下面积(AUROC)、精确度-召回率(PR)曲线的平均精度(AP)、Brier评分等对模型进行综合评估,引入Shapley加性解释(SHAP)对最优机器学习模型进行可解释化分析。结果有155例(17%)患者发生POD,经LASSO回归分析后,确定10个特征变量用于构建机器学习模型。4种机器学习模型中,RF的AUROC最高为0.90(95%CI 0.86~0.93),AP为0.8,Brier评分为0.086。SHAP模型解释性分析显示,对POD贡献度最高的是手术时间。结论在应用4种机器学习方法构建的非心脏手术老年患者POD预测模型中,RF的预测效能最佳。 展开更多
关键词 非心脏外科手术 术后谵妄 机器学习 预测模型 Shapley加性解释
在线阅读 下载PDF
通过机器学习预测模型理解荔枝开花过程
6
作者 苏钻贤 宁振辰 +1 位作者 汪情 陈厚彬 《果树学报》 北大核心 2025年第5期1045-1056,共12页
[目的]荔枝开花的早晚影响果实成熟期、成花率和产量,也影响荔枝产业的高质量发展。针对荔枝开花期预测的空白,旨在构建气象因子、植株状态与荔枝开花进程的关系模型,为实现成熟期调控提供依据。[方法]通过收集2009-2020年荔枝物候期、... [目的]荔枝开花的早晚影响果实成熟期、成花率和产量,也影响荔枝产业的高质量发展。针对荔枝开花期预测的空白,旨在构建气象因子、植株状态与荔枝开花进程的关系模型,为实现成熟期调控提供依据。[方法]通过收集2009-2020年荔枝物候期、品种、树龄和气象数据,建立物候生态特征数据集,并利用随机森林(RF)和逐步回归(STR)算法构建荔枝花穗发育和开花持续期双阶段预测模型体系,经过5倍交叉验证、999次鲁棒性测试和2 a(年)盲测数据验证。[结果]花穗发育持续期模型均方根误差为3.6~3.7 d,相关系数0.97,盲测数据集验证相关系数0.98~0.99;开花持续期模型均方根误差1.2~2.6 d,相关系数0.88~0.97,盲测数据集验证相关系数为0.96~0.98。大于5℃日积温、日平均温度、风级和降雨量对荔枝开花过程有显著影响,大于24℃和18℃日积温分别对花穗发育期和开花续期起较大作用,上述因子共同构成影响荔枝开花过程的关键气象要素。[结论]建立的模型具有高鲁棒性和预测拟合度,有助于精准调控荔枝成熟期,所筛选的特征变量有助于理解气象因子对荔枝成花过程的影响。 展开更多
关键词 机器学习 预测模型 物候期 花穗发育持续期 开花持续期
在线阅读 下载PDF
基于可解释机器学习的混凝土重力坝变形安全监控模型
7
作者 程琳 袁喜娜 +2 位作者 马春辉 贾冬焱 徐笑颜 《水利水电科技进展》 北大核心 2025年第3期77-85,共9页
针对目前基于机器学习的大坝安全监控模型无法给出模型预测解释的问题,引入SHAP值理论,并结合LightGBM模型,建立了一种具备可解释性的混凝土重力坝变形安全监控模型,且该模型可以量化每个影响因子的具体贡献。工程实例验证结果表明,该... 针对目前基于机器学习的大坝安全监控模型无法给出模型预测解释的问题,引入SHAP值理论,并结合LightGBM模型,建立了一种具备可解释性的混凝土重力坝变形安全监控模型,且该模型可以量化每个影响因子的具体贡献。工程实例验证结果表明,该模型考虑了变形与环境量之间复杂的非线性关系,更接近真实情况,不仅具有良好的拟合精度和预测精度,还能对模型进行全局和局部的解释。 展开更多
关键词 混凝土重力坝 变形安全监控 可解释机器学习 SHAP值理论 LightGBM模型
在线阅读 下载PDF
基于自动化机器学习构建胆总管结石自发排石预测模型及应用程序
8
作者 陈健 夏开建 +3 位作者 高福利 刘罗杰 王甘红 徐晓丹 《临床肝胆病杂志》 北大核心 2025年第3期518-527,共10页
目的鉴于胆总管结石患者治疗决策的复杂性,本研究利用自动化机器学习算法,开发一款能够预测胆总管结石患者自发排石的预测模型及应用程序,从而减少非必要内镜逆行胰胆管造影(ERCP)。方法回顾性收集2022年1月—2024年6月通过影像学手段... 目的鉴于胆总管结石患者治疗决策的复杂性,本研究利用自动化机器学习算法,开发一款能够预测胆总管结石患者自发排石的预测模型及应用程序,从而减少非必要内镜逆行胰胆管造影(ERCP)。方法回顾性收集2022年1月—2024年6月通过影像学手段明确诊断胆总管结石后拟行ERCP取石的患者数据,数据来自常熟市第一人民医院(数据集1)和常熟市中医院(数据集2),共835例。数据集1用于机器学习模型训练、内部验证和开发应用程序,数据集2用于外部测试。纳入22个潜在预测变量,用于构建和内部验证LASSO回归模型及自动化机器学习模型。通过受试者操作特征曲线下面积(AUC)、敏感度、特异度、准确率等评估模型性能,选取最佳模型。使用特征重要性图、力图和SHAP图对模型进行解释。利用Python Dash库和最佳模型构建Web应用程序,在数据集2上进行外部测试。使用Kolmogorov-Smirnov检验确定数据是否符合正态分布;对于不符合正态分布的连续变量,使用Mann-Whitney U检验进行2组间比较;分类变量通过χ^(2)检验或Fisher精确检验来分析组间差异。结果纳入835例患者中,152例(18.20%)出现自发排石。在训练集(n=588)和验证集(n=171)中,LASSO模型的AUC分别为0.875、0.864,重要性排名前5的预测因素为单发胆总管结石、胆总管不扩张、胆总管结石直径、血清ALP降低和GGT降低。通过自动化机器学习构建了55个模型,其中梯度提升机(GBM)表现最佳,其AUC为0.891,95%CI为0.859~0.927,优于极端随机树(XRT)、深度学习(DL)、广义线性模型(GLM)和分布式随机森林(DRF)模型。在测试集(n=76)中,GBM模型的预测准确率、敏感度和特异度分别为0.855、0.846和0.857。变量重要性分析显示,单发胆总管结石、胆总管不扩张、胆总管结石直径<8 mm、血清ALP降低和GGT降低这5个因素对预测自发排石具有重要影响。基于GBM模型的SHAP图分析显示,当患者出现单发胆总管结石、胆总管不扩张、胆总管结石直径<8 mm、血清ALP及GGT降低时,出现自发性排石的概率明显增加。结论基于自动化机器学习算法构建的GBM模型及应用程序,在预测胆总管结石患者自发排石方面展现出良好的预测性能和使用便捷性。该应用程序能够帮助避免非必要的ERCP,从而降低手术风险和医保支出。 展开更多
关键词 胆总管结石病 胰胆管造影术 内窥镜逆行 机器学习 预测模型
在线阅读 下载PDF
端到端机器学习代理模型构建及其在爆轰驱动问题中的应用
9
作者 柏劲松 刘洋 +1 位作者 陈翰 钟敏 《爆炸与冲击》 北大核心 2025年第5期19-30,共12页
人工智能/机器学习方法能够发现数据中隐藏的物理规律,构建状态参数与动态结果之间端到端的代理模型,可高效解决强耦合、非线性、多物理等复杂工程问题。在高度非线性的爆炸与冲击动力学领域,选择了一个经典的爆轰驱动问题作为研究对象... 人工智能/机器学习方法能够发现数据中隐藏的物理规律,构建状态参数与动态结果之间端到端的代理模型,可高效解决强耦合、非线性、多物理等复杂工程问题。在高度非线性的爆炸与冲击动力学领域,选择了一个经典的爆轰驱动问题作为研究对象,以数值模拟结果作为机器学习代理模型的训练数据,将正向模拟与逆向设计有机结合起来,基于深度神经网络技术,构建了特征位置速度剖面、材料动态变形与工程因素之间端到端的代理模型,给出了代理模型的计算精确度,验证了代理模型从速度剖面反演工程因素的能力。结果表明:端到端代理模型具有较高的预测能力,其预测的速度剖面与工程因素估计的相对误差均小于1%,可用于高度非线性的爆炸与冲击动力学问题的快速设计、高精度预测和敏捷迭代。 展开更多
关键词 计算爆炸力学 爆轰驱动 人工智能 机器学习 端到端代理模型 深度神经网络
在线阅读 下载PDF
居民健康不平等预测模型构建及影响因素研究——基于机器学习的证据
10
作者 苏敏 赵文菲 李政蓉 《卫生经济研究》 北大核心 2025年第7期23-29,35,共8页
当前,我国仍面临显著的健康不平等问题,迫切需要识别影响居民健康不平等的关键因素。对此,引入“样本外预测”的思路,基于健康社会决定因素的分层模型纳入预测因子,结合多种机器学习算法,构建高维预测模型,评估多维因素对居民健康不平... 当前,我国仍面临显著的健康不平等问题,迫切需要识别影响居民健康不平等的关键因素。对此,引入“样本外预测”的思路,基于健康社会决定因素的分层模型纳入预测因子,结合多种机器学习算法,构建高维预测模型,评估多维因素对居民健康不平等的预测能力。研究发现,随机森林模型的预测性能最佳,年龄、个人总收入、受教育程度、职业类型和家庭经济状况是最具预测能力的变量,与居民健康不平等之间存在非线性及复杂交互关系;建议针对不同人群的具体需求制定差异化的健康政策,以有效缓解健康不平等,最终推动人口健康和社会可持续发展。 展开更多
关键词 健康不平等 机器学习 预测模型
在线阅读 下载PDF
测井智能解释中机理模型—机器学习联合驱动范式及应用
11
作者 谭茂金 白洋 张博栋 《石油地球物理勘探》 北大核心 2025年第4期966-977,共12页
地球物理测井是探测地下油气储层流体类型和评价储层参数的重要手段,传统测井解释方法面临挑战。人工智能(AI)算法先进,精度高,在测井解释方面具有独特的优势,“测井+AI”是当前测井解释研究的新领域。然而,智能测井解释中,样本规模小... 地球物理测井是探测地下油气储层流体类型和评价储层参数的重要手段,传统测井解释方法面临挑战。人工智能(AI)算法先进,精度高,在测井解释方面具有独特的优势,“测井+AI”是当前测井解释研究的新领域。然而,智能测井解释中,样本规模小、训练模型泛化能力弱导致单纯机器学习的测井解释方法难以推广应用。物理模型包含从测井数据到地质目标的内在机理,将数据驱动与机理驱动相结合是提高测井解释精度的有效途径。现有的数据—机理联合驱动缺乏范式遵循,为此,聚焦智能测井解释参数预测,提出了数据—机理联合驱动的概念、思路,并总结出两个范式:一是数据引导的物理建模,以物理建模为主导,其中关键步骤或参数采用数据驱动获得,数据驱动为辅;二是物理引导的机器学习,以机器学习为主导,知识模型或物理机理为辅助,对输入数据、损失函数、训练过程进行监督和约束。因此,提出了物理模型增广数据集、知识驱动样本加权和岩石物理知识迁移三种数模双驱模式。将上述数模双驱的范式或模式应用于致密砂岩、有机页岩储层参数预测和矿物含量预测。与单纯数据驱动的机器学习相比,数据—机理联合的双轮驱动范式能够显著提高测井解释模型对小样本、差样本的学习能力,模型的稳健性更好,泛化能力更强,解释精度更高。 展开更多
关键词 测井解释 机理模型 机器学习 联合驱动 储层智能评价
在线阅读 下载PDF
基于数学统计与机器学习模型耦合的滑坡易发性评价方法优化 被引量:1
12
作者 刘山东 李军 +2 位作者 江兴元 杨义 赵荣乾 《科学技术与工程》 北大核心 2025年第5期1827-1839,共13页
滑坡地质灾害易发性评价是防灾减灾的一种重要手段,易发性评价模型的选取和优化至关重要。以思南县为研究区,选取高程、坡度、曲率、地层、土地利用、年平均降雨量等16个评价因子,采用频率比(frequency ratio,FR)模型与支持向量机(suppo... 滑坡地质灾害易发性评价是防灾减灾的一种重要手段,易发性评价模型的选取和优化至关重要。以思南县为研究区,选取高程、坡度、曲率、地层、土地利用、年平均降雨量等16个评价因子,采用频率比(frequency ratio,FR)模型与支持向量机(support vector machine,SVM)模型和随机森林(random forest,RF)模型相耦合,引入网格搜索方法来获取SVM模型、RF模型及其耦合模型最优参数组合并用于模型训练,最终构建SVM、RF、FR-SVM及FR-RF模型对整个研究区进行滑坡易发性预测,并进行了受试者操作特征(receiver operating characteristics,ROC)曲线验证。结果表明:与单一机器学习模型相比,耦合机器学习有更多的滑坡灾害样本落于高易发区和极高易发区,有更高的准确率。单一模型中,RF模型有较多的滑坡灾害样本落于高易发区和极高易发区,耦合模型中,FR-RF模型有较多的滑坡灾害样本落于高易发区和极高易发区,且FR模型和FR-RF模型中没有滑坡灾害样本落在极低易发区,表明无论是单一模型还是耦合模型,RF模型的性能优于SVM模型。4种模型的ROC预测曲线的曲线下面积(area under the curve,AUC)分别为0.8316、0.8439、0.8644、0.9104,说明FR模型与RF模型结合的耦合模型有更高的准确率,该模型更适用于思南县的滑坡易发性评价研究,评价结果可为当地滑坡地质灾害的防灾减灾提供一定的参考。 展开更多
关键词 滑坡易发性评价 频率比模型 机器学习模型 耦合模型 ROC曲线 思南县
在线阅读 下载PDF
多模态数据融合+动态机器学习构建ICU患者MDRO感染早期预警模型的研究 被引量:1
13
作者 左蝶 赵佳 +4 位作者 龙晓艳 马学先 刘冰 王小燕 李萍 《海南医科大学学报》 北大核心 2025年第6期421-432,共12页
目的:多模态数据融合+动态机器学习构建ICU患者多重耐药菌(multi-drug resistant organism,MDRO)感染风险预测模型,优选出最优预测模型为医院MDRO感染提供有效的评估工具。方法:选取某三甲医院ICU 2018年1月1日~2023年8月30日的1200名患... 目的:多模态数据融合+动态机器学习构建ICU患者多重耐药菌(multi-drug resistant organism,MDRO)感染风险预测模型,优选出最优预测模型为医院MDRO感染提供有效的评估工具。方法:选取某三甲医院ICU 2018年1月1日~2023年8月30日的1200名患者,按照8∶2的比例随机分为训练集(n=960)和测试集(n=240),基于单因素分析将P<0.05的变量作为构建模型的纳入因素,运用随机森林(RF)、极度梯度提升(XGBoost)、决策树中的分类与回归树(classification and regression trees,CART)和logistic回归分别建立ICU患者MDRO感染风险预测模型,通过准确率、灵敏度、特异度、阳性预测值、阴性预测值、Kappa值、AUC值、决策曲线和校准曲线对4种模型的预测性能进行比较。结果:RF模型在训练集和测试集中表现最佳,其准确率、灵敏度、特异度、阳性预测值、阴性预测值及Kappa值均高于其他模型。AUC值从大到小顺序排列,训练集:RF>XGBoost>CRAT>logistic回归;测试集:RF>CRAT>logistic回归>XGBoost。本研究结果显示肺部感染、脑血管疾病、低蛋白血症及侵入性操作为4种模型的高风险预测因子是MDRO感染筛查及进行临床干预的重要理论依据。结论:基于RF算法建立的风险预测模型对ICU患者MDRO感染风险的预测性能优于其他三个机器算法构建的模型。 展开更多
关键词 ICU患者 MDRO感染风险 机器学习 预测模型
在线阅读 下载PDF
利用可解释机器学习模型判别豫西巩义市康店镇黄土地质灾害易发性 被引量:1
14
作者 包峻帆 陈婕 +10 位作者 杨文涛 杨泽强 侯文青 陈恪 袁野 杨明权 景斐媛 刘淼昕 刘哲 张媛媛 黄灿 《科学技术与工程》 北大核心 2025年第15期6200-6219,共20页
黄土丘陵区是地质灾害高发频发的地区之一,亟需采用合适的评价因子和训练模型开展地质灾害易发性评价研究。以郑州“7·20”特大暴雨期间受灾最严重的乡镇巩义市康店镇为研究区,基于卫星遥感解译、实地调查、无人机航拍及相关资料收... 黄土丘陵区是地质灾害高发频发的地区之一,亟需采用合适的评价因子和训练模型开展地质灾害易发性评价研究。以郑州“7·20”特大暴雨期间受灾最严重的乡镇巩义市康店镇为研究区,基于卫星遥感解译、实地调查、无人机航拍及相关资料收集,构建覆盖黄土界面、人类工程活动、水动力作用3个主控因素13个影响因子的评价体系,采用CatBoost模型、XGBoost模型和LightGBM模型共3种机器学习算法,开展地质灾害易发性评价研究,基于性能最优的机器学习模型,运用SHAP(shapley additive explanations)算法完成特征全局解释与依赖性分析。结果表明:CatBoost模型的精度高于其他模型(XGBoost和LightGBM),在AUC(area under curve)值、SHAP准确度、精确率、召回率、F_(1)分数和野外验证中均表现最优,其极高、高、中、低、极低易发区域面积占比分别为3.19%、1.40%、2.04%、5.93%、87.44%,极高、高易发区域主要分布在人类活动强烈的冲沟两侧,切坡建房是地质灾害发生的重要诱因。本次研究旨在优化建模思路,对建模过程的不确定性和可解释性进行研究,对机器学习的易发性决策机理进行解释分析,为豫西黄土丘陵区地质灾害防治提供科学依据。 展开更多
关键词 黄土丘陵区 地质灾害易发性 机器学习模型 SHAP 模型解释
在线阅读 下载PDF
基于机器学习的乒乓球混双技战术评估模型构建与应用 被引量:1
15
作者 曹烨程 张千轶 +1 位作者 陈辉 刘敏 《河南师范大学学报(自然科学版)》 北大核心 2025年第3期149-156,I0010-I0014,共13页
在运动项目技战术分析领域引入机器学习算法,以场胜负为标签,以各段与轮次的得分率与使用率构造的得分效率密度和全局得分能力两个新指标作为特征,使用机器学习模型中的随机森林模型、LightGBM模型、XGBoost模型对乒乓球混双比赛28个技... 在运动项目技战术分析领域引入机器学习算法,以场胜负为标签,以各段与轮次的得分率与使用率构造的得分效率密度和全局得分能力两个新指标作为特征,使用机器学习模型中的随机森林模型、LightGBM模型、XGBoost模型对乒乓球混双比赛28个技战术指标的特征重要性进行排序,提取了2个二级评价指标和8个三级评价指标.最后应用构造的评估模型对王楚钦/孙颖莎与林高远/王曼昱的2场混双决赛进行了技战术分析与评价,验证了机器学习方法构建的乒乓球技战术评估模型具有较高的实用性和准确性. 展开更多
关键词 机器学习 乒乓球 技战术 评估模型
在线阅读 下载PDF
基于机器学习筛选猪活体肌内脂肪含量间接选育和构建预测模型的关键性状 被引量:2
16
作者 吴建 杨文 +2 位作者 孟孜 查成万 吴望军 《南京农业大学学报》 CAS 北大核心 2025年第1期161-170,共10页
[目的]本研究旨在探究猪断奶重、屠宰前活体重、背膘厚等性状因素对猪肌内脂肪(intramuscular fat,IMF)含量的影响,确定影响猪IMF含量的关键性状因素。[方法]以805头皮特兰×[杜洛克×(长白×大白)]四元商品猪群为试验对象... [目的]本研究旨在探究猪断奶重、屠宰前活体重、背膘厚等性状因素对猪肌内脂肪(intramuscular fat,IMF)含量的影响,确定影响猪IMF含量的关键性状因素。[方法]以805头皮特兰×[杜洛克×(长白×大白)]四元商品猪群为试验对象,记录性别,测定初生重、断奶重、屠宰前活体重和IMF含量等14个性状,然后通过相关性分析从14个性状中初步筛选出影响IMF含量的性状因素,再通过随机森林模型评估各性状因素对IMF含量影响的重要性,进一步通过LASSO回归和逐步回归筛选出影响IMF含量的关键性状因素;在此基础上,利用广义线性模型(generalized linear model,GLM)分析关键性状因素不同水平对IMF含量的影响。[结果]相关性分析结果显示,猪IMF含量与断奶重(r=0.13, P<0.001)和屠宰前活体重(r=0.22, P<0.001)呈显著相关;与不同位置背膘厚呈极显著相关(P<0.001),相关系数为0.21~0.26。另外,IMF含量与肉色红度值a*、黄度值b*、色调角H0和色度C*值也呈显著相关(P<0.05),相关系数为0.08~0.13。随机森林模型分析结果显示,胸腰结合处背膘厚对IMF含量的贡献最大,其次是屠宰前活体重。LASSO回归和逐步回归分别筛选出9个和5个显著影响IMF含量的性状因素,其中性别、断奶重、屠宰前活体重、胸腰椎结合处背膘厚4个活体可测性状为2种方法共同筛选出的关键性状因素。GLM分析结果显示,4个活体可测性状对IMF含量均具有显著影响,并且阉公猪平均IMF含量(2.52%)显著高于母猪(2.41%)(P<0.05);断奶重小于5 kg组平均IMF含量(2.24%)显著低于其他3组(P<0.05);屠宰前活体重小于85 kg组的平均IMF含量(2.27%)显著低于115 kg以上组(2.67%)(P<0.05),当屠宰前活体重大于100 kg后,各水平组间平均IMF含量差异不显著(P>0.05)。胸腰椎结合处背膘厚大于26 mm组的平均IMF含量(2.73%)显著高于其他背膘厚组(P<0.05),而5~12 mm与12~19 mm背膘厚组的平均IMF含量差异不显著(P>0.05)。[结论]本研究通过机器学习确定了性别、断奶重、屠宰前活体重和胸腰椎结合处背膘厚4个与IMF含量显著相关的活体可测定性状,并发现平均IMF含量随着屠宰前活体重和胸腰椎结合处背膘厚的增加呈明显的上升趋势。 展开更多
关键词 肌内脂肪 间接选择 模型构建 机器学习 活体可测定性状
在线阅读 下载PDF
急性缺血性脑卒中预后预测研究的应用进展:以机器学习预测模型为例 被引量:1
17
作者 杜慧杰 刘星雨 +5 位作者 徐明欢 杨学智 张慧琴 莫佳丽 卢依 况杰 《中国全科医学》 CAS 北大核心 2025年第5期554-560,共7页
急性缺血性脑卒中(AIS)具有高致残率、高病死率及高复发率等特点,给患者及社会造成沉重的负担。随着大数据时代的到来,预测模型在患者的诊治决策、预后管理以及卫生资源配置等方面的应用越来越多,其价值也愈发重要。机器学习方法是预测... 急性缺血性脑卒中(AIS)具有高致残率、高病死率及高复发率等特点,给患者及社会造成沉重的负担。随着大数据时代的到来,预测模型在患者的诊治决策、预后管理以及卫生资源配置等方面的应用越来越多,其价值也愈发重要。机器学习方法是预测AIS患者预后的重要方法之一,且已广泛应用。本文以机器学习方法为重点,就AIS预后预测研究的最新进展予以综述,并提出机器学习预测模型目前所面临的问题与挑战,为AIS患者预后结局早期评估与预测在方法上提供新的思路和参考。 展开更多
关键词 缺血性卒中 预后预测 机器学习 预测模型 综述
在线阅读 下载PDF
基于三种机器学习方法研究骨质疏松性骨折危险因素及构建列线图预测模型 被引量:1
18
作者 云思敏 王雄毅 +5 位作者 谢伊代·如则 朱柯雨 翁程伟 郑苗 魏祺 徐又佳 《中华骨质疏松和骨矿盐疾病杂志》 北大核心 2025年第1期36-48,共13页
目的运用3种机器学习方法探讨骨质疏松症患者发生骨质疏松性骨折的危险因素,并构建列线图预测模型。方法选取2021年10月至2023年5月苏州大学附属第二医院289例骨质疏松症患者作为研究对象,按是否骨折分为骨折组(93例)和非骨折组(196例)... 目的运用3种机器学习方法探讨骨质疏松症患者发生骨质疏松性骨折的危险因素,并构建列线图预测模型。方法选取2021年10月至2023年5月苏州大学附属第二医院289例骨质疏松症患者作为研究对象,按是否骨折分为骨折组(93例)和非骨折组(196例)。采用R语言开展相关研究。运用拉索回归(least absolute shrinkage and selection operator,LASSO)、极端梯度提升(extreme gradient boosting,XGBoost)、随机森林(random forest,RF)3种机器学习方法平行评估“变量”与骨质疏松性骨折风险的相关性,分析3种机器学习方法“重叠覆盖”的风险因素,采用多因素Logisitic回归方法验证结果的独立预测性。基于机器学习和多因素Logisitic回归分析筛选出的独立危险因素构建“列线图预测模型”,采用Bootstrap方法进行内部和外部验证,通过受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)、Hosmer-Lemeshow拟合优度检验、校准曲线及决策曲线(decision curve analysis,DCA)评估列线图预测模型的准确性和临床适用性。结果3种机器学习方法各自筛选到不同风险因素,经过“重叠覆盖”分析得到6项共同的骨质疏松性骨折重要风险因素:年龄、甘油三酯、Ca、血清25羟维生素D、股骨颈T值、血清白蛋白。多因素Logistic回归分析显示其中5个因素是脆性骨折的独立危险因素:年龄(OR=1.075,95%CI:1.017~1.136,P=0.011)、甘油三酯(OR=0.207,95%CI:0.103~0.415,P<0.001)、Ca(OR=0.010,95%CI:0.000~0.602,P=0.028)、股骨颈T值(OR=0.443,95%CI:0.245~0.800,P=0.007)、血清25羟维生素D(OR=0.902,95%CI:0.830~0.980,P=0.015)。基于5个预测危险因素构建的列线图预测模型验证结果显示:模型训练集AUC值为0.934(95%CI:0.897~0.972),内部验证集的AUC值为0.893(95%CI:0.802~0.984),外部验证集的AUC值为0.849(95%CI:0.792~0.905),预测效能良好。校准曲线显示预测值与理想曲线有较好一致性。Hosmer-Lemeshow拟合优度检验(训练集:χ^(2)=9.842,P=0.276;内部验证集:χ^(2)=5.174,P=0.739;外部验证集:χ^(2)=12.828,P=0.118)表明模型有较高的预测准确性。DCA表示该模型临床效能表现良好。结论3种机器学习方法共同指出的骨质疏松性骨折高风险因素有6项,经多因素Logistic回归分析认为高龄、低甘油三酯、低Ca、低血清25羟维生素D、低股骨颈T值为独立危险因素,其中低甘油三酯、低血清25羟维生素D危险因素以往报道较少。基于3种机器学习方法构建的列线图预测模型有较好便捷性、准确性,可帮助临床医生识别骨质疏松性骨折高危患者,有益实施早期干预。 展开更多
关键词 骨质疏松性骨折 机器学习 列线图 预测模型
在线阅读 下载PDF
地下水位机器学习模型中的特征筛选及应用效果分析 被引量:1
19
作者 郭敏丽 刘天航 +3 位作者 毕二平 胡晓斌 肖颖 刘春时 《水资源保护》 北大核心 2025年第3期179-186,221,共9页
为提高地下水位机器学习模型模拟效果,采用偏相关分析方法、皮尔逊相关系数法、最大相关-最小冗余(mRMR)法和随机森林(RF)法,对构建的密怀顺区域3种地下水位机器学习模型的输入参数进行特征筛选,并对参数特征筛选前后的模型模拟效果进... 为提高地下水位机器学习模型模拟效果,采用偏相关分析方法、皮尔逊相关系数法、最大相关-最小冗余(mRMR)法和随机森林(RF)法,对构建的密怀顺区域3种地下水位机器学习模型的输入参数进行特征筛选,并对参数特征筛选前后的模型模拟效果进行了比较。结果表明:不同参数适合不同的特征筛选方法,地下水位及滞后值特征参数可由偏相关系数法获取,人工回补量及滞后值、降水量及滞后值特征参数需由mRMR法和RF法联合确定,其中mRMR法侧重于降水量及滞后值的筛选,RF法侧重于人工回补量及滞后值的筛选;特征筛选有效提高了极限学习机(ELM)模型和RF模型的模拟精度,提升了带有外部输入的非线性自回归神经网络(NARX)模型的运行速度;密怀顺区域3种地下水位机器学习模型应用经过特征筛选后的参数进行模拟,ELM模型的均方根误差、纳什效率系数和决定系数分别提升了63%、98%和45%,RF模型分别提升了49%、6%和2%,NARX模型的运行速度提升了11倍。 展开更多
关键词 地下水位 机器学习模型 特征筛选 密怀顺区域
在线阅读 下载PDF
基于机器学习筛选共同性外斜视术后早期复发的风险因素及Nomogram预测模型的建立 被引量:1
20
作者 谢婧 蒲丽 +3 位作者 王正静 胡红芳 冯亮 赵粟 《眼科新进展》 北大核心 2025年第2期115-119,共5页
目的分析共同性外斜视术后早期复发的相关风险因素,建立Nomogram预测模型。方法回顾性分析我院2015年10月至2021年10月收治的243例(486眼)共同性外斜视患者,按7:3的比例将其分为训练集(n=170)、验证集(n=73)。利用Lasso回归、Boruta算... 目的分析共同性外斜视术后早期复发的相关风险因素,建立Nomogram预测模型。方法回顾性分析我院2015年10月至2021年10月收治的243例(486眼)共同性外斜视患者,按7:3的比例将其分为训练集(n=170)、验证集(n=73)。利用Lasso回归、Boruta算法、随机森林算法筛选共同性外斜视术后早期复发的风险变量。通过Spearman相关性分析及膨胀因子(VIF)评估变量之间的共线性,利用多因素Cox回归建立Nomogram预测模型。对该模型在术后6个月、18个月、24个月的受试者工作曲线、校准曲线、临床决策曲线进行效能评价。结果通过3种机器学习方法:Lasso回归、Boruta算法、随机森林算法,在训练集及验证集的22个风险变量中筛选出6个可能导致斜视术后早期复发的重要变量:斜视类型、发病年龄、术前斜视度数、右眼最佳矫正视力(BCVA)、左眼BCVA、手术方式,6个变量之间不存在共线性(r<0.6,VIF<5)。多因素Cox回归发现,斜视类型(间歇性外斜视)、术前斜视度数、右眼BCVA、左眼BCVA、手术方式(单侧外直肌后徙术)是共同性外斜视术后早期复发的风险因素,并构建Nomogram预测模型。受试者工作曲线、校准曲线及临床决策曲线提示该预测模型具有较好的准确度、一致性及临床适用度。结论Nomogram预测模型能较好预测共同性外斜视患者术后的早期复发风险,为眼科医生对患者进行早期干预提供参考。 展开更多
关键词 共同性外斜视 早期复发 Nomogram预测模型 机器学习
在线阅读 下载PDF
上一页 1 2 65 下一页 到第
使用帮助 返回顶部