期刊文献+
共找到226篇文章
< 1 2 12 >
每页显示 20 50 100
BP神经网络在效能评估中的样本训练 被引量:12
1
作者 史彦斌 高运泉 张安 《火力与指挥控制》 CSCD 北大核心 2007年第4期120-122,共3页
根据WSEIAC模型建立了地面防空导弹武器系统效能评估的指标体系,并依此模型建立与之对应的三层BP神经网络。简要分析了BP算法的实现过程,利用专家打分法和模糊层次法相结合的方式取得该神经网络应用于地面防空导弹武器系统效能评估时的... 根据WSEIAC模型建立了地面防空导弹武器系统效能评估的指标体系,并依此模型建立与之对应的三层BP神经网络。简要分析了BP算法的实现过程,利用专家打分法和模糊层次法相结合的方式取得该神经网络应用于地面防空导弹武器系统效能评估时的训练样本,并对此神经网络进行学习训练,直至达到精度要求。经验证,该网络在评价地面防空导弹武器系统效能时减少了评估中的人因影响,使评估结果更为科学。 展开更多
关键词 BP神经网络 效能评估 样本训练
在线阅读 下载PDF
遥感结合机器学习利用优化的训练样本识别山东省灌溉农田
2
作者 孙佑涛 于砚宁 +5 位作者 葛冰洋 张佳华 白雲 吴喜芳 杨姗姗 张莎 《农业工程学报》 北大核心 2025年第6期154-164,共11页
了解灌溉农田分布对合理利用水资源、及时调整农业生产政策和保障粮食安全具有重要意义。已有基于机器学习方识别灌溉农田的研究多采用二值化样本标注(即仅标注为灌溉和非灌溉),可能会导致灌溉样本遗漏,造成灌溉农田的识别精度较低。为... 了解灌溉农田分布对合理利用水资源、及时调整农业生产政策和保障粮食安全具有重要意义。已有基于机器学习方识别灌溉农田的研究多采用二值化样本标注(即仅标注为灌溉和非灌溉),可能会导致灌溉样本遗漏,造成灌溉农田的识别精度较低。为避免该问题,该研究提出一种为训练样本赋值灌溉分数的方案。首先,使用归一化植被指数、增强型植被指数和绿度植被指数结合统计灌溉面积数据分别生成3幅初步灌溉地图;然后,结合3幅不同的初步灌溉地图,使用该研究提出的方案为每个像元赋值不同的灌溉分数并获取训练样本;再使用随机森林(random forest,RF)和卷积神经网络(convolutional neural network,CNN)2种机器学习方法分别预测研究区逐年逐像元的灌溉分数,识别山东省2018—2022年250 m分辨率的灌溉农田;最后,通过验证样本和统计数据进行验证,获取山东省2018—2022年的灌溉农田空间分布,并分析灌溉农田的时空分布特征。结果表明:1)相比2种二值化处理获取训练样本的方法,使用该研究提出的方案获取训练样本并识别灌溉农田时,RF和CNN识别灌溉农田的县级R~2高达0.95和0.93;RF识别山东省灌溉农田的精度评价指标均优于CNN,且在不同年份表现较为稳定;2)2018—2022年山东省的灌溉农田空间分布较为一致,主要分布在鲁西北及鲁南地区,胶东半岛及鲁中地区分布较为稀少,近5年山东省的统计灌溉面积呈小幅增长趋势,2022年识别灌溉农田面积相较于2018年也有小幅增长。该研究提出的针对训练样本进行赋值灌溉分数的方案能够有效提高山东省灌溉农田识别的精度,是识别区域尺度灌溉农田的一种可靠、有效的方法。 展开更多
关键词 机器学习 随机森林 卷积神经网络 训练样本赋值 灌溉农田识别
在线阅读 下载PDF
考虑训练样本分布不均衡的超短期风电功率概率预测 被引量:6
3
作者 李丹 方泽仁 +3 位作者 缪书唯 胡越 梁云嫣 贺帅 《电网技术》 EI CSCD 北大核心 2024年第3期1133-1145,共13页
提出一种考虑训练样本分布不均衡的超短期风电概率预测方法。首先构建深度信念混合密度网络,通过深度信念网络独特的预训练和微调机制提取输入变量的隐特征,利用Beta混合概率分布的有界性准确表征风电预测功率的概率分布,实现隐特征与... 提出一种考虑训练样本分布不均衡的超短期风电概率预测方法。首先构建深度信念混合密度网络,通过深度信念网络独特的预训练和微调机制提取输入变量的隐特征,利用Beta混合概率分布的有界性准确表征风电预测功率的概率分布,实现隐特征与预测功率概率分布参数之间的非线性映射;然后引入训练样本分布平滑策略,其中特征分布平滑技术用于校准输入特征,标签分布平滑技术用于对各样本误差赋予差异化权重,从输入和输出两方面改善训练样本分布不均衡现象对预测结果的不利影响。实际算例结果表明,与常见风电功率概率预测模型相比,所提模型在点预测和概率预测方面均能获得较高的预测精度,尤其能有效提高低密度样本区域的预测精度。 展开更多
关键词 风电功率概率预测 深度信念网络 混合密度网络 训练样本分布不均衡 特征分布平滑 标签分布平滑
在线阅读 下载PDF
基于改进K均值聚类的光谱重建训练样本选择研究 被引量:1
4
作者 刘振 刘莉 +2 位作者 樊硕 赵安然 刘思鲁 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第1期29-35,共7页
光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,... 光谱反射率重建过程中,训练样本的选择方法及样本容量与重建精度密切相关,寻找一种高效的训练样本选择方法是光谱重建的目标之一。K均值聚类计算复杂度小,计算效率高,但因聚类初始值选择的随机性,以及离群点的影响致使聚类结果不稳定,进而影响光谱重建的精度。基于此,提出了一种改进K均值聚类的训练样本选择方法。首先,将训练样本集的几何中心作为聚类中心的初始值;其次,基于高斯函数构建样本空间分布概率密度函数,并以欧几里德(欧式)距离作为其他聚类中心的度量依据;最后,在训练样本集中,基于簇内平方差度量光谱反射率样本间的相似度,将每个聚类子集中与中心距离最近的样本作为训练样本。为验证该方法的有效性,通过主成分分析法进行光谱重建。实验结果表明,所提的方法相较于传统的方法,光谱重建精度有一定的提高,重建光谱的平均均方根误差小于4%, CIE DE2000色差小于3.756 7。提出的改进的K均值聚类的训练样本选择方法,能够一定程度上提高了光谱重建精度,基本满足复制再现图像的要求。 展开更多
关键词 光谱重建 训练样本 聚类算法 改进K均值聚类
在线阅读 下载PDF
小样本条件下动力电池容量和内阻协同估计 被引量:1
5
作者 朱建功 张仁杰 +2 位作者 姜波 戴海峰 魏学哲 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第12期14-23,共10页
锂离子电池的容量和内阻分别是表征电池系统能量和功率特性的重要参数,准确估计容量和内阻对于电动汽车电池管理系统有至关重要的作用.提出了一种数据驱动的电池容量和内阻估计方法.该方法首先从电池的恒流充电片段提取容量增量(increme... 锂离子电池的容量和内阻分别是表征电池系统能量和功率特性的重要参数,准确估计容量和内阻对于电动汽车电池管理系统有至关重要的作用.提出了一种数据驱动的电池容量和内阻估计方法.该方法首先从电池的恒流充电片段提取容量增量(incremental capacity,IC)特征,经过重采样方法构建特征向量.然后将IC特征输入弹性网络模型进行训练,从而实现容量和内阻估计.应用KIT数据集对所提方法进行验证.结果表明:该模型可以在相同特征输入下实现高精度的容量和内阻协同估计,且在小样本训练(仅使用2个电池作为训练集)时保持容量估计误差在2%以内,内阻的估计误差在3%以内.最后提出了基于容量和内阻双参量的“三段式”电池评价方法. 展开更多
关键词 锂离子电池 数据驱动 容量和内阻估计 样本训练 电池评价方法
在线阅读 下载PDF
基于单样本的ART神经网络训练算法
6
作者 陈宁 《广西师范大学学报(自然科学版)》 CAS 北大核心 2008年第3期133-136,共4页
由于成本和客观条件的限制,样本集合不可能无限大,很多时候只能是单样本的情况。将多尺度金字塔算法引入图像处理,将单样本转化成为系列低精度的子图像,作为ART神经网络的训练集合,训练ART神经网络中的注意机制,这符合人的视觉认知原理... 由于成本和客观条件的限制,样本集合不可能无限大,很多时候只能是单样本的情况。将多尺度金字塔算法引入图像处理,将单样本转化成为系列低精度的子图像,作为ART神经网络的训练集合,训练ART神经网络中的注意机制,这符合人的视觉认知原理,即调节注意焦点实现由粗到精的认知图像的过程。进一步,多项式样条金字塔算法被采用,提高了计算效率,降低了复杂度。 展开更多
关键词 ART 样本训练 视觉注意机制 多尺度
在线阅读 下载PDF
不同训练样本对识别系统的影响 被引量:15
7
作者 刘刚 张洪刚 郭军 《计算机学报》 EI CSCD 北大核心 2005年第11期1923-1928,共6页
分析了训练样本对于识别系统性能的影响,将训练样本分为三种:好样本、差样本和边界样本,分析了它们在训练中所起的作用,并结合基于HMM的手写数字识别系统,给出了一种简单的边界样本定义和选择的方法;通过实验证明了采用边界样本训练可... 分析了训练样本对于识别系统性能的影响,将训练样本分为三种:好样本、差样本和边界样本,分析了它们在训练中所起的作用,并结合基于HMM的手写数字识别系统,给出了一种简单的边界样本定义和选择的方法;通过实验证明了采用边界样本训练可使系统误识率降低17.51%,并证明了边界样本的重要性,且指出非边界样本的存在会影响训练的效果. 展开更多
关键词 训练样本 样本分类 边界样本 HMM
在线阅读 下载PDF
基于主成分分析的光谱重建训练样本选择方法研究 被引量:12
8
作者 李婵 万晓霞 +2 位作者 刘强 梁金星 李俊锋 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2016年第5期1400-1405,共6页
训练样本构成是影响光谱重建精度的一个重要因素,针对学习型光谱重建算法中训练样本选择问题,提出了一种基于主成分分析的训练样本选择方法。为了保证训练样本与重建样本的相似度,首先根据欧式距离最小原则从待选样本集中选择与重建样... 训练样本构成是影响光谱重建精度的一个重要因素,针对学习型光谱重建算法中训练样本选择问题,提出了一种基于主成分分析的训练样本选择方法。为了保证训练样本与重建样本的相似度,首先根据欧式距离最小原则从待选样本集中选择与重建样本相机响应值相似的样本,并去掉其中的重复样本;然后进行主成分分析;设定阈值筛选各主成分系数较大的样本作为训练样本,最后得到与主成分个数相同的训练样本子集。为验证该方法的有效性,通过在镜头前加载宽带滤色片搭建多通道图像获取系统采集多通道图像信息,将得到的各样本子集用作训练样本,利用伪逆法重建光谱信息,最后将重建的光谱精度与常用的训练样本及训练样本选择方法得到的重建光谱精度进行比较。实验结果表明:提出的方法显著提高了光谱重建的色度精度和光谱精度,优于常用的样本选择方法,能较大程度满足高精度颜色复制要求。 展开更多
关键词 训练样本选择 主成分分析 光谱重建 多通道图像采集
在线阅读 下载PDF
植被高光谱遥感分类中训练样本的选择方法 被引量:6
9
作者 陶秋香 张连蓬 李红梅 《国土资源遥感》 CSCD 2005年第2期33-35,共3页
针对植被高光谱遥感分类过程中参考光谱训练样本的选择问题,研究分类过程中常用训练样本的选择方法,并在此基础上提出2种新的训练样本选择(纯化)方法,然后结合具体的OMIS-I高光谱遥感数据,验证方法的有效性。
关键词 植被高光谱遥感分类 训练样本选择 训练样本纯化
在线阅读 下载PDF
基于稀疏重构的机载雷达训练样本挑选方法 被引量:6
10
作者 刘汉伟 张永顺 +1 位作者 王强 吴亿锋 《系统工程与电子技术》 EI CSCD 北大核心 2016年第7期1532-1537,共6页
针对空时自适应处理中训练样本受目标信号污染时检测性能下降的问题,提出了一种基于稀疏重构技术的训练样本选取方法。该方法首先将接收数据由阵元-脉冲-距离域转换到阵元-多普勒-距离域,然后采用改进的正则化FOCUSS算法进行空域稀疏重... 针对空时自适应处理中训练样本受目标信号污染时检测性能下降的问题,提出了一种基于稀疏重构技术的训练样本选取方法。该方法首先将接收数据由阵元-脉冲-距离域转换到阵元-多普勒-距离域,然后采用改进的正则化FOCUSS算法进行空域稀疏重构,估计待检测多普勒通道对应的阵元-距离域数据得到高分辨角度-距离谱,利用杂波多普勒与角度的先验关系,剔除角度-距离谱上明显偏离角度期望的样本,实现对训练样本的有效选择。仿真表明,相比传统样本选择方法,该方法无须估计协方差矩阵,在小样本集情况下依然能够剔除被污染的样本,有较大优势。 展开更多
关键词 空时自适应处理 干扰目标 先验知识 稀疏重构 训练样本
在线阅读 下载PDF
一种SVM训练样本集寻优算法 被引量:5
11
作者 吴东洋 业巧林 +2 位作者 业宁 张训华 武波 《计算机应用与软件》 CSCD 2010年第9期14-16,19,共4页
首先运用Bagging算法解决样本数据变化带来的不稳定性,然后运用网格搜索法寻找合适的训练样本尺寸,再结合两者的特点,提出了一种自助网格搜索算法,从多个支持向量机(SVM)分类器中寻求一个最优的SVM分类器。实验结果表明,算法有效地提高... 首先运用Bagging算法解决样本数据变化带来的不稳定性,然后运用网格搜索法寻找合适的训练样本尺寸,再结合两者的特点,提出了一种自助网格搜索算法,从多个支持向量机(SVM)分类器中寻求一个最优的SVM分类器。实验结果表明,算法有效地提高了分类器的学习精度与学习性能,对大样本数据来说,可以用相对较少的样本进行训练后的性能来预测它对一个非常庞大的训练集的性能,大大减少了SVM训练的时间。 展开更多
关键词 SVM分类器 BAGGING算法 自助网格搜索算法 训练样本数量
在线阅读 下载PDF
训练样本对农作物遥感分类的精度影响研究 被引量:14
12
作者 潘洪涛 王轩 王晓飞 《红外与激光工程》 EI CSCD 北大核心 2017年第B12期143-150,共8页
为了比较好地研究和分析训练样本的数量和质量对农作物分类精度的影响,选取黑龙江省海伦市作为研究所需要的实验区,以Landsat 8遥感影像作为数据源,利用最大似然、神经网络、支持向量机3种分类方法分别去研究训练样本数量与质量对分类... 为了比较好地研究和分析训练样本的数量和质量对农作物分类精度的影响,选取黑龙江省海伦市作为研究所需要的实验区,以Landsat 8遥感影像作为数据源,利用最大似然、神经网络、支持向量机3种分类方法分别去研究训练样本数量与质量对分类精度的影响,并且对3种分类方法进行了多次实验。最终的研究结果表明:(1)在训练样本质量相对恒定下,同一种分类方法对相同数量的训练样本的响应程度以及不同分类方法对训练样本数量的响应程度是不同的,并且分类精度存在不同程度的波动,随着训练样本数量的增加,这种波动会减小,当训练样本的数量达到一定程度,分类精度的均值将趋于相对稳定;(2)在训练样本数量恒定下,同一种分类方法以及不同种分类方法对相同质量等级的训练样本的响应程度是不同的;同一种分类方法对不同质量等级的训练样本响应程度也是不同的。 展开更多
关键词 遥感图像分类 农作物分类 训练样本 分类精度
在线阅读 下载PDF
宽带光谱成像系统最优训练样本选择方法研究 被引量:3
13
作者 万晓霞 梁金星 刘强 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第6期641-646,共6页
为解决现有标准色卡或颜色样本集因数量大、存在严重颜色冗余而导致的光谱成像工作繁重的问题,提出一种基于宽带光谱成像系统光谱重建误差最小化的最优训练样本选择方法.通过现有颜色样本集中最有效样本的选择,实现宽带光谱成像系统训... 为解决现有标准色卡或颜色样本集因数量大、存在严重颜色冗余而导致的光谱成像工作繁重的问题,提出一种基于宽带光谱成像系统光谱重建误差最小化的最优训练样本选择方法.通过现有颜色样本集中最有效样本的选择,实现宽带光谱成像系统训练样本的优化.研究通过伪逆方法进行光谱重建,以光谱均方根误差作为评价依据,从颜色样本集中逐步挑选训练样本,实现每次迭代所确定训练样本对样本集重建光谱误差的最小化.实验结果表明,在选择相同数量训练样本条件下,本研究方法所构建训练样本的光谱和色度精度明显优于现有方法. 展开更多
关键词 光谱成像 训练样本 光谱重建 误差分析
在线阅读 下载PDF
基于正交设计的神经网络训练样本的选择方法及其在冷挤压工艺设计中的应用研究 被引量:6
14
作者 高军 张承瑞 +1 位作者 季廷炜 赵国群 《塑性工程学报》 EI CAS CSCD 北大核心 2006年第5期32-35,共4页
冷挤压件的形状是制定冷挤压工艺方案时需要考虑的最重要的因素之一,基于目的性和方便性原则,该文针对冷挤压件的形状特征进行分类,并在此基础上分别建立基于正交实验设计的人工神经网络训练样本子集,最后将所有子集进行整合,形成初始... 冷挤压件的形状是制定冷挤压工艺方案时需要考虑的最重要的因素之一,基于目的性和方便性原则,该文针对冷挤压件的形状特征进行分类,并在此基础上分别建立基于正交实验设计的人工神经网络训练样本子集,最后将所有子集进行整合,形成初始训练测试样本集。结合典型冷挤压件,分析了采用正交设计方法选取人工神经网络训练样本的过程,研究了基于正交设计的人工神经网络的训练、测试方法,实现了基于人工神经网络的冷挤压工艺设计。 展开更多
关键词 冷挤压工艺设计 人工神经网络 训练样本 正交设计
在线阅读 下载PDF
训练样本对湿地分类精度的影响 被引量:3
15
作者 卢小平 杜晓贝 +1 位作者 王懿 李冰 《河南理工大学学报(自然科学版)》 CAS 北大核心 2018年第5期55-59,共5页
为探寻训练样本数量对湿地遥感影像分类精度的影响规律,基于统计学理论提出面向对象的分类方法,以GF-2影像为数据源,在构建标准训练样本集的基础上,研究KNN算法和SVM算法的线性函数、多项式函数、径向基函数在湿地分类中的适用性和有效... 为探寻训练样本数量对湿地遥感影像分类精度的影响规律,基于统计学理论提出面向对象的分类方法,以GF-2影像为数据源,在构建标准训练样本集的基础上,研究KNN算法和SVM算法的线性函数、多项式函数、径向基函数在湿地分类中的适用性和有效性。根据分类统计和对比分析结果,得到了提取湿地要素时能够满足精度所需的最少训练样本数量。利用该方法在河南省三门峡市天鹅湖公园进行试验,提取3~10倍波段数的训练样本,对每个样本进行3次试验,得到96张分类图。结果表明,选取6倍波段数的样本数量,总体分类精度达到85%,Kappa系数达到0.8,符合分类精度要求,且训练样本数量较基于像素的监督分类方法大大减少,SVM算法分类精度优于KNN算法。 展开更多
关键词 训练样本 湿地 遥感分类精度 面向对象
在线阅读 下载PDF
利用粒子群算法缩减大规模数据集SVM训练样本 被引量:3
16
作者 曾联明 吴湘滨 刘鹏 《计算机科学》 CSCD 北大核心 2009年第9期215-217,共3页
对于大规模SVM训练样本数据,在分类前采用粒子群算法进行样本缩减,每一个粒子的维对应一个样本状态,通过更新粒子的速度和位置信息,调整训练样本的状态,引导粒子向分类最优的样本状态组合方向移动,去除样本中对分类不起作用的非支持向... 对于大规模SVM训练样本数据,在分类前采用粒子群算法进行样本缩减,每一个粒子的维对应一个样本状态,通过更新粒子的速度和位置信息,调整训练样本的状态,引导粒子向分类最优的样本状态组合方向移动,去除样本中对分类不起作用的非支持向量和冗余的支持向量所对应的样本,生成新的缩减样本,进行分类训练,从而达到提高训练效率的目的。基于大规模遥感图像数据集的分类实验表明,此方法在确保不降低分类精度的前提下减少了分类时间。 展开更多
关键词 粒子群 支持向量机 训练样本 海量数据
在线阅读 下载PDF
基于判别公共向量的单训练样本人脸识别 被引量:2
17
作者 李瑞东 祝磊 +1 位作者 余党军 陈偕雄 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2008年第2期181-184,共4页
提出一种新的基于判别公共向量(Discriminative Common Vector)的单样本人脸识别算法.该方法基于人脸类内方差相似的假定,通过引入单人多样本的辅助人脸集来估计类内方差,解决了单训练样本情况下样本类内方差无法估计的问题.在FERET人... 提出一种新的基于判别公共向量(Discriminative Common Vector)的单样本人脸识别算法.该方法基于人脸类内方差相似的假定,通过引入单人多样本的辅助人脸集来估计类内方差,解决了单训练样本情况下样本类内方差无法估计的问题.在FERET人脸库的测试结果表明,在面部细节、光照、表情变化的情况下,该方法都具有较好的识别效果. 展开更多
关键词 判别公共向量 训练样本 人脸识别
在线阅读 下载PDF
基于小训练样本的AdaBoost人脸检测 被引量:3
18
作者 师黎 吴敏 张娟 《计算机工程》 CAS CSCD 北大核心 2011年第8期199-201,共3页
AdaBoost算法已被广泛地应用于人脸检测系统中,但往往需要大量的训练样本。针对其训练过程复杂冗长的缺陷,选择研究基于少量训练样本的人脸检测问题。采用协方差特征代替图像统计的直方图进行特征提取。为达到更好的分类效果,应用基于Fi... AdaBoost算法已被广泛地应用于人脸检测系统中,但往往需要大量的训练样本。针对其训练过程复杂冗长的缺陷,选择研究基于少量训练样本的人脸检测问题。采用协方差特征代替图像统计的直方图进行特征提取。为达到更好的分类效果,应用基于Fisher判别式分析的线性超平面分类器,通过AdaBoost算法构成多层级联分类器进行人脸检测。在小数据库里可以看到,与目前用于多数人脸检测系统的类Haar特征相比,该算法在减少训练样本的同时能获得更好的检测效果。 展开更多
关键词 人脸检测 协方差特征 Fisher判别式分析 训练样本
在线阅读 下载PDF
采用虚拟训练样本的二次判别分析方法 被引量:16
19
作者 王卫东 杨静宇 《自动化学报》 EI CSCD 北大核心 2008年第4期400-407,共8页
小样本问题会造成各类协方差矩阵的奇异性和不稳定性.本文采用对训练样本进行扰动的方法来生成虚拟训练样本,利用这些虚拟训练样奉克服了各类协方差矩阵的奇异性问题,从而可以直接使用二次判别分析(Quadratic discriminant analysis,QDA... 小样本问题会造成各类协方差矩阵的奇异性和不稳定性.本文采用对训练样本进行扰动的方法来生成虚拟训练样本,利用这些虚拟训练样奉克服了各类协方差矩阵的奇异性问题,从而可以直接使用二次判别分析(Quadratic discriminant analysis,QDA)方法.本文方法克服了正则化判别分析(Regularized discriminant analysis,RDA)需要进行参数优化的问题.实验结果表明,QDA的模式识别率优于参数最优化时RDA算法的识别率. 展开更多
关键词 样本问题 二次判别分析 虚拟训练样本 扰动方法 分类器 人脸识别
在线阅读 下载PDF
基于训练样本集扩展的隐式篇章关系分类 被引量:3
20
作者 朱珊珊 洪宇 +3 位作者 丁思远 严为绒 姚建民 朱巧明 《中文信息学报》 CSCD 北大核心 2016年第5期111-120,共10页
隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习... 隐式篇章关系分类主要任务是在显式关联线索缺失的情况下,自动检测特定论元之间的语义关系类别。前人研究显示,语言学特征能够有效辅助隐式篇章关系的分类。目前,主流检测方法由于缺少足够的已标注隐式训练样本,导致分类器无法准确学习各种分类特征,分类精确率仅约为40%。针对这一问题,该文提出一种基于训练样本集扩展的隐式篇章关系分类方法。该方法首先借助论元向量,以原始训练样本集为种子实例,从外部数据资源中挖掘与其在语义以及关系上一致的"平行训练样本集";然后将"平行训练样本集"加入原始训练样本集中,形成扩展的训练样本集;最后基于扩展的训练样本集,实现隐式篇章关系的分类。该文在宾州篇章树库(Penn Discourse Treebank,PDTB)上对扩展的训练样本集进行评测,结果显示,相较于原始训练样本集,使用扩展的训练样本集的实验系统整体性能提升8.41%,在四种篇章关系类别上的平均性能提升5.42%。与现有主流分类方法性能对比,识别精确率提升6.36%。 展开更多
关键词 隐式篇章关系 语义向量 训练样本集扩展 篇章分析
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部