期刊文献+
共找到5,569篇文章
< 1 2 250 >
每页显示 20 50 100
有序多分类logistic模型在违约概率测算中的应用 被引量:26
1
作者 彭建刚 屠海波 +1 位作者 何婧 周颖辉 《财经理论与实践》 CSSCI 北大核心 2009年第4期2-7,共6页
初始违约概率的测算是商业银行实施经济资本管理的必要环节。针对我国商业银行的现状,结合贷款五级分类,通过对银行的公司类客户的财务指标作时间加权化处理、因子分析、ROC检验以及使用有序多分类logistic模型对初始违约概率的测算作... 初始违约概率的测算是商业银行实施经济资本管理的必要环节。针对我国商业银行的现状,结合贷款五级分类,通过对银行的公司类客户的财务指标作时间加权化处理、因子分析、ROC检验以及使用有序多分类logistic模型对初始违约概率的测算作了有价值的探索,并通过算例分析论证了其可行性。 展开更多
关键词 违约概率 因子分析 有序多分类logistic模型
在线阅读 下载PDF
非吸烟女性肺癌危险因素的多分类logistic模型分析 被引量:30
2
作者 项永兵 高玉堂 《中国卫生统计》 CSCD 北大核心 2005年第2期66-70,共5页
目的利用多分类logistic模型分析和评价非吸烟女性不同组织学类型肺癌的危险因素。方法资料来源于非吸烟女性肺癌病例504例及人群对照601例,拟合多分类logistic回归模型估计各因素的比数比。结果影响女性腺癌发病的危险因素是厨房小环... 目的利用多分类logistic模型分析和评价非吸烟女性不同组织学类型肺癌的危险因素。方法资料来源于非吸烟女性肺癌病例504例及人群对照601例,拟合多分类logistic回归模型估计各因素的比数比。结果影响女性腺癌发病的危险因素是厨房小环境污染、经常食用菜油、BMI较低、一级亲属肺癌家族史,而保护因素是活产次数较多和胡罗卜素。女性鳞癌的危险因素则是厨房小环境污染和一级亲属肺癌家族史,保护因素是饮茶。女性其他类型肺癌危险因素主要是油炸烹饪次数较多等,而类型不明肺癌发病的危险因素类似于腺癌。结论不同组织学类型的非吸烟女性肺癌病因可能存在一定的差异。 展开更多
关键词 非吸烟女性 肺癌 危险因素 多分类logistic模型分析 流行病学
在线阅读 下载PDF
基于多分类logistic模型的我国城乡居民选择医疗服务机构的影响因素研究 被引量:21
3
作者 张开翼 褚越亚 石鹏 《中国卫生统计》 CSCD 北大核心 2021年第3期405-408,共4页
目的居民的就医行为直接影响医疗卫生服务的发生、发展和变化,探究居民的医疗服务利用偏好将为推进分级诊疗格局的形成提供有力支撑。方法利用2018年中国家庭追踪调查数据,建立安德森卫生服务利用行为模型,采用多分类logistic回归模型... 目的居民的就医行为直接影响医疗卫生服务的发生、发展和变化,探究居民的医疗服务利用偏好将为推进分级诊疗格局的形成提供有力支撑。方法利用2018年中国家庭追踪调查数据,建立安德森卫生服务利用行为模型,采用多分类logistic回归模型分析当前影响居民医疗服务利用的多种关键因素。结果9950名调查对象中女性4094例,男性5856例。40.6%(4044例)被调查对象选择综合医院作为一般就医机构。性别、年龄、婚姻状况、教育水平、个人户口、工作总收入、医疗保险类型、看病点满意度、看病点医疗水平、健康状况是居民选择就医机构的影响因素(P<0.05)。结论多种因素影响我国居民医疗服务机构的选择。大力开展基层医生培养、鼓励高水平医师多点执业、加快推进医联体及医共体建设有利于合理配置社会医疗资源,将分级诊疗制度落到实处。 展开更多
关键词 分级诊疗 就医机构选择 安德森卫生服务利用行为模型 多分类logistic模型
在线阅读 下载PDF
基于多分类logistic模型的铁路水害分级警戒概率预报研究 被引量:8
4
作者 吴凡 阙志萍 《灾害学》 CSCD 2017年第1期17-21,共5页
利用2004-2014年鹰厦线的铁路水害资料和降水资料,分析了鹰厦铁路水害的时空分布特征,研究了两种地形的铁路水害分级警戒概率预报模型。结果表明:鹰厦铁路水害的年际变化差异大且分布不均,发生时间集中在汛期,局地性较强;山脉地型铁路... 利用2004-2014年鹰厦线的铁路水害资料和降水资料,分析了鹰厦铁路水害的时空分布特征,研究了两种地形的铁路水害分级警戒概率预报模型。结果表明:鹰厦铁路水害的年际变化差异大且分布不均,发生时间集中在汛期,局地性较强;山脉地型铁路水害分级警戒概率预报模型检验的出巡警戒、限速警戒以及封锁警戒的准确率分别为78.3%、58.8%以及74.4%;相对平坦地形铁路水害分级警戒概率预报模型检验的出巡警戒、限速警戒以及封锁警戒的准确率分别为85.0%、75.8%以及87.7%;在铁路防洪调度中结合水害概率预报模型以及3个因子的降水量值共同判断警戒级别的效果更优,可为铁路安全运营和高效调度提供一定的指导。 展开更多
关键词 鹰厦铁路 铁路水害 分级警戒 降水 多分类logistic回归
在线阅读 下载PDF
基于NGDR和Logistic模型的高速公路图像雾浓度检测算法
5
作者 温立民 杨睿 +1 位作者 聂磊 吴锋 《中山大学学报(自然科学版)(中英文)》 北大核心 2025年第3期119-128,共10页
提出了基于Logistic函数拟合S型散点图的雾浓度评定算法。首先,提取LIVE标准图集归一化灰度差-比散点图先验;基于散点曲线与视场雾浓度的一一对应关系,引入Logistic函数并推导出适合回归分析的模型。其次,采用迭代搜索法确定纵向高斯分... 提出了基于Logistic函数拟合S型散点图的雾浓度评定算法。首先,提取LIVE标准图集归一化灰度差-比散点图先验;基于散点曲线与视场雾浓度的一一对应关系,引入Logistic函数并推导出适合回归分析的模型。其次,采用迭代搜索法确定纵向高斯分布的最佳回代样本点,以提高检测精度。最后,建立参数估计(β̂,γ̂)的查找表,采用计算相关系数和遍历搜索查找的方法实现雾浓度等级评定。同场景不同浓度图像样本1的测试表明,真实图像的PM2.5与查找表PM2.5的相关系数达0.99,检测误差小于2.9%;近似场景不同浓度高速公路图像样本2的测试表明,真实图像PM2.5与查找表PM2.5值的相关系数达0.98,检测误差小于1.8;执行效率对比测试表明,本文算法对于300 kB样本图像的处理时间为19.8 s,低于同精度数据驱动的深度视觉算法;检测精度对比测试表明,本文算法优于其它典型算法。 展开更多
关键词 高速公路 图像 雾浓度检测 NGDR logistic模型 回归分析 查找表
在线阅读 下载PDF
基于logistic-倒J模型的产品需求弱信号演化趋势预测研究
6
作者 赵动员 唐中君 韩中亚 《情报杂志》 北大核心 2025年第8期146-152,145,共8页
[研究目的]实现对产品需求弱信号演化趋势的有效预测,以此减少新产品开发的认知偏差,拓宽新产品开发思路。[研究方法]将需求弱信号演化趋势预测问题转化为需求弱信号信息量预测问题,通过需求弱信号信息量的变化映射需求弱信号演化趋势... [研究目的]实现对产品需求弱信号演化趋势的有效预测,以此减少新产品开发的认知偏差,拓宽新产品开发思路。[研究方法]将需求弱信号演化趋势预测问题转化为需求弱信号信息量预测问题,通过需求弱信号信息量的变化映射需求弱信号演化趋势规律。首先提出了能表示需求弱信号S型演化趋势的logistic模型,其次构建了能表示倒J型演化趋势的倒J模型,并利用新能源汽车需求弱信号评论数据验证模型的合理性以及两种趋势的存在。[研究结果/结论]结果表明,需求弱信号演化趋势确实存在S型和倒J型两种情况。研究结果能够提升需求弱信号的演化趋势分析精度,提高企业新产品研发效率。 展开更多
关键词 需求弱信号 演化预测 评论文本 logistic模型 倒J模型 新能源汽车
在线阅读 下载PDF
基于Logistic回归的砀山春霜冻预测模型研究与应用
7
作者 张欣然 《安徽农学通报》 2025年第4期108-112,共5页
本研究利用2011—2018年3—5月砀山国家基本气象观测站日最低草面温度、日最低气温、日最低0 cm地温、日平均相对湿度、日最小相对湿度以及日平均露点温度观测数据和春霜冻资料,使用Logistic回归分析建立春霜冻预测模型,并对预测模型进... 本研究利用2011—2018年3—5月砀山国家基本气象观测站日最低草面温度、日最低气温、日最低0 cm地温、日平均相对湿度、日最小相对湿度以及日平均露点温度观测数据和春霜冻资料,使用Logistic回归分析建立春霜冻预测模型,并对预测模型进行计算和检验,利用MICAPS软件对模型进行应用。结果表明,采用Logistic回归方法得到的影响砀山春霜冻出现的解释因子为日最低气温、日最低0 cm地温以及日平均露点温度,将这3个因子作为变量建立预测模型。该模型的检验准确率和应用准确率均在90%以上。综上,本研究建立的春霜冻预测模型使用方便快捷、预测准确率高,可应用于实际生产。 展开更多
关键词 梨树 春霜冻 logistic回归 预测模型
在线阅读 下载PDF
基于Logistic模型的广西甘蔗株高生长发育研究
8
作者 陆思宇 匡昭敏 李莉 《热带农业科学》 2025年第5期58-62,共5页
以桂柳05/136、桂糖42、桂糖44的新植蔗和宿根蔗为试验材料,通过测定甘蔗生长发育期间的株高变化,结合Logistic模型分析,研究不同种植方式下甘蔗株高的生长发育规律。结果表明:甘蔗株高生长发育趋势呈单“S”形曲线,株高生长终极值与实... 以桂柳05/136、桂糖42、桂糖44的新植蔗和宿根蔗为试验材料,通过测定甘蔗生长发育期间的株高变化,结合Logistic模型分析,研究不同种植方式下甘蔗株高的生长发育规律。结果表明:甘蔗株高生长发育趋势呈单“S”形曲线,株高生长终极值与实测值之间的相关性达到极显著水平(p<0.01);Logistic拟合系数除桂糖44宿根蔗为0.95外,其余均大于0.98。因此,Logistic模型可准确预测甘蔗株高生长发育。通过拟合模型可确定甘蔗株高的发育时间节点,整个生长期可分为3个阶段:(1)伸长初期,即5月前,株高小,生长慢。(2)快速伸长期,生长最旺盛的时期,持续60.4~109.8 d,7月中旬至下旬增长最快,同一品种宿根蔗的起始时间均早于新植蔗,持续时间也更长,其中桂糖44起始时间最早、持续时间最长、最大相对生长速率最小(宿根蔗仅有1.46 cm/d);桂柳05/136起始时间最晚、持续时间最短、最大相对生长速率最大(新植蔗可达3.03 cm/d);桂糖42介于二者之间。(3)伸长后期,即9月后,株高生长渐趋缓慢乃至停止。研究结果可为科学评估甘蔗株高和提高管理水平提供参考。 展开更多
关键词 新植蔗 宿根蔗 株高 生长发育 logistic模型
在线阅读 下载PDF
大语言模型安全性:分类、评估、归因、缓解、展望 被引量:2
9
作者 黄河燕 李思霖 +7 位作者 兰天伟 邱昱力 柳泽明 姚嘉树 曾理 单赢宇 施晓明 郭宇航 《智能系统学报》 北大核心 2025年第1期2-32,共31页
大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的... 大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的内容存在违法、泄密、仇恨、偏见、错误等问题。并且在实际应用中,大语言模型可能被滥用,生成的内容可能引起国家、人群和领域等多个层面的困扰。本文旨在深入探讨大语言模型面临的安全性风险并进行分类,回顾现有的评估方法,研究安全性风险背后的因果机制,并总结现有的解决措施。具体而言,本文明确了大语言模型面临的10种安全性风险,并将其归类为模型自身安全性风险与生成内容的安全性风险两个方面,并对每种风险进行了详细的分析和讲解。此外,本文还从生命周期和危害程度两个角度对大语言模型的安全风险进行了系统化的分析,并介绍了现有的大语言模型安全风险评估方法、大语言模型安全风险的出现原因以及相应的缓解措施。大语言模型的安全风险是亟待解决的重要问题。 展开更多
关键词 大语言模型 模型自身安全性 生成内容安全性 安全性分类 安全性风险评估 安全性风险归因 安全性风险缓解措施 安全性研究展望
在线阅读 下载PDF
基于矢量分类的NPC型三电平双三相PMSM的改进模型预测电压控制 被引量:2
10
作者 袁庆庆 步凡 +1 位作者 谢晓彤 夏鲲 《中国电机工程学报》 北大核心 2025年第2期758-768,I0030,共12页
多电平多相电机驱动系统存在电压矢量数目多、冗余复杂及多目标非线性约束等问题。以二极管钳位型三电平六相逆变器驱动双三相永磁同步电机为研究对象,以电机谐波电流抑制和逆变器直流侧中点电位平衡控制为目标,提出一种基于电压矢量三... 多电平多相电机驱动系统存在电压矢量数目多、冗余复杂及多目标非线性约束等问题。以二极管钳位型三电平六相逆变器驱动双三相永磁同步电机为研究对象,以电机谐波电流抑制和逆变器直流侧中点电位平衡控制为目标,提出一种基于电压矢量三角区域分类的改进模型预测电压控制策略。首先,以基波子平面大投影幅值为原则,对729个电压矢量进行初筛;接着,基于三角区域分类方法对筛选后的电压矢量进行分类,并对期望电压进行所属三角区域定位、确定候选矢量。设计满足电机定子电流谐波抑制及逆变器中点电位平衡控制的目标函数;根据电机数学模型和逆变器特征研究多目标控制权重因子的理论设计方法。不同工况下的有效性及对比实验表明,所研究的控制策略不仅能改善多电平多相电机驱动系统的多目标控制性能,还能有效降低控制器计算负担。 展开更多
关键词 二极管钳位型三电平六相逆变器 双三相永磁同步电机 矢量分类 谐波电流 中点电位 模型预测电压控制 权重因子
在线阅读 下载PDF
发生带状疱疹后神经痛的影响因素的logistic模型分析 被引量:3
11
作者 郭洪飞 李文娟 马学良 《中国卫生统计》 CSCD 北大核心 2024年第2期251-253,共3页
目的了解带状疱疹后神经痛(postherpetic neuralgia,PHN)的影响因素,为针对性地防治PHN提供依据。方法于2022年1月-12月选取某院就诊的带状疱疹患者480例为研究对象,收集患者的人口学情况、临床相关内容、心理状态、饮食依从性和运动情... 目的了解带状疱疹后神经痛(postherpetic neuralgia,PHN)的影响因素,为针对性地防治PHN提供依据。方法于2022年1月-12月选取某院就诊的带状疱疹患者480例为研究对象,收集患者的人口学情况、临床相关内容、心理状态、饮食依从性和运动情况。采用多因素logistic模型分析PHN发生的影响因素。结果共纳入480人,单因素分析结果显示,年龄较高、皮损面积大、NRS评分高、不用激素治疗、冠心病、饮食习惯不良、缺乏体育锻炼者的PHN发生率较高(P<0.05)。多因素分析结果显示,年龄、皮损面积、激素治疗、冠心病、饮食依从性、体育锻炼是PHN的影响因素(P<0.05)。结论年龄、冠心病、疼痛程度、皮损面积、激素治疗、饮食依从性、体育锻炼影响PHN的发生,根据影响因素采用多种措施开展有针对性健康干预,从而帮助患者正确面对疾病,降低PHN的发生率,提高生活质量。 展开更多
关键词 带状疱疹 神经痛 影响因素 多因素logistic模型
在线阅读 下载PDF
决策树和Logistic回归模型对体外受精-胚胎移植患者妊娠结局的预测价值比较 被引量:1
12
作者 李娜 苗聪秀 +2 位作者 苗卉 李丹 李敏 《暨南大学学报(自然科学与医学版)》 CAS 北大核心 2024年第5期493-501,共9页
目的:比较决策树和Logistic回归模型对体外受精-胚胎移植(in vitro fertilization and embryo transfer,IVF-ET)患者妊娠结局的预测价值。方法:纳入2021年1月至2022年10月在长治医学院附属和平医院接受IVF-ET的患者350例为研究对象,根... 目的:比较决策树和Logistic回归模型对体外受精-胚胎移植(in vitro fertilization and embryo transfer,IVF-ET)患者妊娠结局的预测价值。方法:纳入2021年1月至2022年10月在长治医学院附属和平医院接受IVF-ET的患者350例为研究对象,根据妊娠结局分为妊娠成功组(215例)和妊娠失败组(135例)。收集患者临床资料,建立IVF-ET患者妊娠结局Logistic回归和决策树预测模型,并在是否基于Logistic回归结果条件下建立决策树分析模型(决策树1和决策树2),采用受试者工作特征(receiver operating characteristic,ROC)曲线对模型预测效果进行评价。结果:350例患者中,妊娠成功患者占61.43%,妊娠失败者占38.57%。妊娠失败组年龄≥35岁、不孕年限≥5年、周期次数≥1次、有心理精神障碍的患者比例及HCG日血清孕酮水平均高于妊娠成功组,获卵数≥10枚、受精率≥75%的患者比例及HCG日子宫内膜厚度、优质胚胎数小于妊娠成功组(P<0.05)。多因素Logistic回归分析结果显示,年龄、HCG日血清孕酮水平、优质胚胎数及心理精神障碍均是IVF-ET患者妊娠结局的影响因素(P<0.05)。决策树模型显示,年龄、HCG日血清孕酮水平、优质胚胎数为IVF-ET患者妊娠结局的影响因素。Logistic回归模型曲线下面积(area under curve,AUC)为0.832,预测敏感度、特异度和准确度分别为87.3%、71.4%、83.5%;决策树1的AUC为0.859,预测敏感度、特异度和准确度分别为85.1%、76.8%、85.6%;决策树2的AUC为0.820,预测敏感度、特异度和准确度分别为83.7%、73.2%、82.4%。决策树1的AUC大于决策树2(P<0.05),但与Logistic回归模型的AUC比较差异无统计学意义(P>0.05)。结论:Logistic回归模型和决策树模型对于IVF-ET患者妊娠结局均有一定的预测价值。 展开更多
关键词 体外受精-胚胎移植 妊娠结局 决策树 logistic回归模型
在线阅读 下载PDF
基于特征融合的复杂场景树种跨域泛化分类模型
13
作者 陈广胜 温林郅 +3 位作者 张文均 李超 于鸣 景维鹏 《林业科学》 北大核心 2025年第4期33-45,共13页
【目的】针对不同区域因气候、土壤等生态因子差异导致的域偏移问题,提出一种基于全局-局部特征融合的单域泛化方法,提升复杂森林场景下无标签树种识别的泛化性能,为跨域树种分类研究提供理论依据和实践支持。【方法】选取德国巴登-符... 【目的】针对不同区域因气候、土壤等生态因子差异导致的域偏移问题,提出一种基于全局-局部特征融合的单域泛化方法,提升复杂森林场景下无标签树种识别的泛化性能,为跨域树种分类研究提供理论依据和实践支持。【方法】选取德国巴登-符腾堡州南部和中国黄山市祁门县西部为源域,德国图林根州中部和中国黄山市祁门县东部为目标域,构建一种全局-局部特征融合网络(HUFNet)模型进行树种分类,HUFNet模型包含基于CNN的编码器层、基于Transformer的解码器层、全局-局部特征融合机制(GLAFE)、特征精炼头(FRH)和边界优化模块(ERV)。模型经源域数据集训练后,在目标域上测试验证其泛化能力,实现复杂场景跨域树种分类。【结果】通过多个源域和目标域数据集的对比验证,HUFNet模型在目标域HainichUAV数据集上对针叶和阔叶树种的分类总体准确率(OA)为75.1%,平均交并比(mIoU)为58.3%,相比基于自注意力机制的分类架构分别提升13.7%与11.7%。在目标域HuangshanEast数据集上,HUFNet模型的OA为71.7%,mIoU为56.8%,相比ViT-R50作为编码器的混合架构,OA提升1.2%。【结论】HUFNet模型的跨域树种分类性能明显提升,不仅保持了高精度的识别能力,而且在目标域上展现出强大的跨域泛化能力,同时大幅降低了模型的时间复杂度和空间复杂度,适用于资源受限的环境。该模型基于全局-局部特征融合的单域泛化方法,为跨域树种分类提供了新的研究思路。 展开更多
关键词 遥感影像 树种分类 单域泛化 语义分割 轻量化模型
在线阅读 下载PDF
基于中心锚困难三元组损失和多视图特征融合的三维模型分类
14
作者 高雪瑶 张澐凯 张春祥 《电子与信息学报》 北大核心 2025年第6期1937-1949,共13页
多视图可以全面表征3维模型的视觉特性以及潜在的空间结构信息,但现有方法容易忽视不同视图间的差异性和互补性。针对上述问题,该文提出一种基于中心锚困难3元组损失和多视图特征融合的3维模型分类方法。首先,以3维模型的多视图集为输入... 多视图可以全面表征3维模型的视觉特性以及潜在的空间结构信息,但现有方法容易忽视不同视图间的差异性和互补性。针对上述问题,该文提出一种基于中心锚困难3元组损失和多视图特征融合的3维模型分类方法。首先,以3维模型的多视图集为输入,利用深度残差收缩网络(DRSN)提取视图特征并融合2维形状分布特征D1,D2和D3得到视图融合特征;其次,根据3维模型视图融合特征,通过香农熵来衡量视图分类的不确定性,并将3维模型的多视图按视图显著性由高到低排序;然后,搭建基于注意力-长短期记忆网络(Att-LSTM)的3元组多视图特征融合网络,利用LSTM学习多视图之间的上下文信息,并融入多头注意力机制充分捕捉多视图间的相关信息;最后,引入度量学习并提出了一种新颖的中心锚困难3元组损失(CAH Triplet Loss),并联合交叉熵损失(CE Loss)来优化多视图特征融合网络,减小同类样本、增大异类样本在特征空间上的距离,加强网络对3维模型区分性特征的学习。实验表明:该方法在3维模型数据集ModelNet10上的分类准确率达到93.83%,分类性能突出。 展开更多
关键词 3维模型分类 多视图特征融合 注意力机制 3元组损失
在线阅读 下载PDF
融合大语言模型和数据增强的文本情感分类模型研究
15
作者 杨巍 肖强 《情报杂志》 北大核心 2025年第8期172-179,197,共9页
[研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比... [研究目的]探索应用大语言模型(LLMs)的内容理解能力和生成能力,提升现有情感分类模型的准确性。[研究方法]提出了融合LLMs内容理解能力和生成能力的文本情感分类模型LLMGen4Sent,以深入挖掘文本所蕴含的情感内涵,并通过增强数据和对比学习技术,提升样本的多样性和情感语义表征准确性。[研究结果/结论]实验结果表明,LLMGen4Sent在ChnSentiCorp和IMDB数据集上均取得了优异的性能;相对TextCNN模型,ACC准确率提升了12.22%、12.99%;相对Bert模型,ACC准确率提升了5.72%、5.88%;同时,通过消融实验也论证了LLMGen4Sent模型中各个模块的有效性。LLMGen4Sent模型能够有效捕捉文本的深层情感特征,并通过生成式数据增强技术和对比学习技术显著提高现有文本情感分类模型的准确性。 展开更多
关键词 情感分类模型 大语言模型 内容理解 数据增强 LLMGen4Sent
在线阅读 下载PDF
KAACNN:融合知识图谱和预训练模型的短文本多标签分类方法
16
作者 陶冶 徐锴 +2 位作者 刘天宇 鲁超峰 王浩杰 《中文信息学报》 北大核心 2025年第3期96-106,共11页
短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训... 短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训练语言模型提高短文本的文本表示能力;另一方面从外部知识库中检索短文本概念知识,并利用注意力机制将其与短文本结合用于分类任务。此外,针对数据集类别分布不均衡的问题,该文提出基于领域类别知识图谱的数据增强方法。在三个公共数据集和一个汽车领域客户原话数据集上进行了实验,结果表明,引入知识图谱和预训练语言模型的分类方法优于目前先进的短文本分类方法,证明了外部知识库和预训练语言模型的先验知识在短文本分类中的有效性。 展开更多
关键词 知识图谱 注意力机制 预训练语言模型 数据增强 短文本分类
在线阅读 下载PDF
大语言模型幻觉现象的分类识别与优化研究 被引量:3
17
作者 何静 沈阳 谢润锋 《计算机科学与探索》 北大核心 2025年第5期1295-1301,共7页
随着大语言模型在自然语言理解和生成任务上的广泛应用,其在医疗、法律和科研等高精度领域的表现被愈发关注。然而,幻觉现象作为大语言模型普遍存在的问题,极大制约了其在这些领域的实际应用。当前,针对大语言模型幻觉现象的评估和优化... 随着大语言模型在自然语言理解和生成任务上的广泛应用,其在医疗、法律和科研等高精度领域的表现被愈发关注。然而,幻觉现象作为大语言模型普遍存在的问题,极大制约了其在这些领域的实际应用。当前,针对大语言模型幻觉现象的评估和优化尚存在显著不足:缺乏高质量的高精度领域幻觉评估数据集;现有幻觉评估方法大多依赖单一模型,未能充分利用多模型间的差异性优势;不同模型在幻觉类型和幻觉率上表现存在较大差异,尚未有有效方法来降低高幻觉率模型的幻觉现象。该研究采用数据集构建-群体智能选举-幻觉分类与量化-先验知识优化的系统流程,全面评估和优化了大语言模型在医疗问答领域的幻觉现象。根据公开数据集Huatuo,结合GPT4生成问题答案和人工标注的形式构建了医疗问答领域大模型幻觉评估数据集;使用GPT4o、GPT4、ChatGLM4、Baichuan-13B和Claude 3.5等先进的大语言模型对数据集中的问题生成答案。通过一种基于群体智能的方法,选举出一个LeaderAI,它将各模型的回答与参考答案进行比较,从而确定各模型的幻觉率。进一步将幻觉分为事实性幻觉和忠实性幻觉两类。研究结果表明,在LeaderAI的指导下,被评估的大模型的幻觉率显著下降,特别是忠实性幻觉率明显降低。 展开更多
关键词 大语言模型 幻觉识别 幻觉分类 模型优化
在线阅读 下载PDF
我国尺度兼容和树种分类的材积源森林碳储量模型 被引量:2
18
作者 张聪 刘琪 +2 位作者 李海奎 刘鹏举 詹思颖 《林业科学》 北大核心 2025年第1期57-69,共13页
【目的】提出一种简单方便的森林碳储量估算方法,构建考虑林分特征的尺度兼容和树种分类的材积源森林碳储量模型,为估算多尺度和多树种森林碳储量提供方法和技术支持。【方法】基于第6~9次全国森林资源清查数据和异速生长方程,分别利用... 【目的】提出一种简单方便的森林碳储量估算方法,构建考虑林分特征的尺度兼容和树种分类的材积源森林碳储量模型,为估算多尺度和多树种森林碳储量提供方法和技术支持。【方法】基于第6~9次全国森林资源清查数据和异速生长方程,分别利用含哑变量的非线性最小二乘法的独立模型和非线性似然无关回归的联立方程组模型,构建考虑起源、龄组2个主要林分特征的尺度兼容和树种分类的森林碳储量模型,通过加权回归消除异方差,采用决定系数(R^(2))、估计值的标准差(SEE)、平均预估误差(MPE)、总相对误差(TRE)和差异百分比(VP)对模型进行评价;同时利用2021年林草综合监测数据,比较不同尺度模型估算全国森林碳储量的差异。【结果】1)共构建2974类尺度兼容的森林碳储量模型,与独立模型相比,联立方程组模型的R^(2)无明显差异。独立模型和联立方程组模型分别为1383和1591类,模型R^(2)的平均值分别为0.9661和0.9652,MPE分别为0.75%和0.78%,联立方程组模型的R^(2)仅下降0.0009,MPE仅上升0.03%。2)共构建2520类树种分类的森林碳储量模型,与尺度兼容模型结果一样,独立模型和联立方程组模型的R^(2)无明显差异。独立模型和联立方程组模型均为1260类,模型R^(2)的平均值分别为0.9443和0.9424,MPE分别为0.48%和0.49%,联立方程组模型的R^(2)仅下降0.0019,MPE仅上升0.01%。3)构建4种不同建模方式(独立-尺度模型、独立-树种模型、联立-尺度模型、联立-树种模型)的森林碳储量模型。相比独立模型,联立方程组模型的参数变动幅度更小。4种不同建模方式共包含参数a和参数b分别为46157和23935个。独立模型和联立方程组模型参数a的平均值分别为0.5965和0.6200,极差分别为2.3186和2.1922,独立模型的参数极差偏高0.1264;参数b的平均值分别为0.9332和0.9318,极差分别为0.6723和0.5065,独立模型的参数极差偏高0.1667。4)不同尺度模型估算全国森林碳储量时,无论何种尺度,独立模型的估算差异均大于联立方程组模型,但总体上各种尺度模型的估算差异均在3%以内。【结论】1)本研究提出的从森林蓄积量直接到森林碳储量的材积源森林碳储量模型数据有效、方法可靠,可用于直接估算森林碳储量。2)基于含哑变量的非线性似然无关的联立方程组方法,可更好地建立尺度兼容和树种分类的森林碳储量模型。3)本研究构建的森林碳储量模型平均R^(2)在0.95以上,MPE在1%以内,可用于林业实践中快速准确估算森林碳储量。4)根据模型的拟合精度以及参数的稳定性,建议使用以联立-尺度(以尺度为建模总体的联立树种分类模型)为建模方式的森林碳储量模型。5)在5%精度要求下,可使用国家尺度考虑林分起源、龄组的树种分类模型估算全国森林碳储量。 展开更多
关键词 森林碳储量模型 非线性似然无关 哑变量 参数库 尺度兼容 树种分类
在线阅读 下载PDF
使用Logistic回归模型进行中文文本分类 被引量:10
19
作者 李新福 赵蕾蕾 +1 位作者 何海斌 李芳 《计算机工程与应用》 CSCD 北大核心 2009年第14期152-154,共3页
使用Logistic回归模型进行中文文本分类,通过实验,比较和分析了不同的中文文本特征、不同的特征数目、不同文档集合的情况下,基于Logistic回归模型的分类器的性能。并将其与线性SVM文本分类器进行了比较,结果显示它的分类性能与线性SVM... 使用Logistic回归模型进行中文文本分类,通过实验,比较和分析了不同的中文文本特征、不同的特征数目、不同文档集合的情况下,基于Logistic回归模型的分类器的性能。并将其与线性SVM文本分类器进行了比较,结果显示它的分类性能与线性SVM方法相当,表明这种方法应用于文本分类的有效性。 展开更多
关键词 logistic回归模型 支持向量机 文本分类 特征
在线阅读 下载PDF
应用分类树模型筛选logistic回归中的交互因素 被引量:30
20
作者 赵自强 郑明 《中国卫生统计》 CSCD 北大核心 2007年第2期114-116,共3页
目的探索自动筛选logistic模型中交互作用因素的方法。方法借助一个实例,说明分层、分类树与lo-gistic模型之间的关系,借助分类树模型自动进行筛选logistic模型中交互作用因素。结果本例分析结果表明,可以应用分类树为logistic模型筛选... 目的探索自动筛选logistic模型中交互作用因素的方法。方法借助一个实例,说明分层、分类树与lo-gistic模型之间的关系,借助分类树模型自动进行筛选logistic模型中交互作用因素。结果本例分析结果表明,可以应用分类树为logistic模型筛选交互作用因素,并用logistic模型对可能的交互作用因素作最后检验,并通过实例说明应用要点。结论在logistic回归分析中,分类树可以有效地用于自动筛选可能的交互效应因素。 展开更多
关键词 分类 logistic回归模型 交互作用
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部