期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于层叠跳跃链条件随机场模型的因果关系标注 被引量:2
1
作者 马建红 郝亚娟 张亚梅 《郑州大学学报(理学版)》 CAS 北大核心 2016年第4期54-59,共6页
针对因果关系事件中对象、属性及其相互作用关系抽取工作的不足和因果关系中的长距离依赖问题,定义了创新问题的因果关系表达方式,提出了基于层叠跳跃链条件随机场的因果关系标注方法.首先通过低层线性链条件随机场模型对预处理过的候... 针对因果关系事件中对象、属性及其相互作用关系抽取工作的不足和因果关系中的长距离依赖问题,定义了创新问题的因果关系表达方式,提出了基于层叠跳跃链条件随机场的因果关系标注方法.首先通过低层线性链条件随机场模型对预处理过的候选集进行因果关系边界标注,其次对标注结果进行降噪和扩充,将其作为新的特征传递给高层跳跃链条件随机场模型用于识别因果角色,最后对高层结果进行指代消解和降噪.对多种类别的真实语料进行了实验,结果表明应用本方法可取得较好的标注效果. 展开更多
关键词 因果关系 跳跃链条件随机场模型 层叠跳跃链条件随机场模型 高层降噪模型
在线阅读 下载PDF
基于条件随机场模型的“评价特征-评价词”对抽取研究 被引量:8
2
作者 李志义 王冕 赵鹏武 《情报学报》 CSSCI CSCD 北大核心 2017年第4期411-421,共11页
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻... 自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用Arbor.js对〈评价特征,评价词〉对进行了可视化展示。从实验结果看,本方法能提高评价特征提取的准确性,并能正确地获取观点信息,为极性判断和完整的观点挖掘做了铺垫。 展开更多
关键词 条件随机场模型 评价特征 评价词 抽取 语义分析 挖掘
在线阅读 下载PDF
基于条件随机场模型的汉语功能块自动标注 被引量:7
3
作者 李国臣 王瑞波 李济洪 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期336-343,共8页
汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不... 汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不同的标注模型,分别构建基本块层面的特征集合,并使用条件随机场模型进行汉语功能块的自动标注.实验数据来自清华大学TCT语料库,并且按照8∶2的比例切分形成训练集和测试集.实验结果表明,与仅使用词层面信息的标注模型相比,基本块特征信息的适当加入可以显著提高功能块标注性能.当使用人工标注的基本块信息时,汉语功能块自动标注的准确率达到88.47%,召回率达到89.93%,F值达到89.19%.当使用自动标注的基本块信息时,汉语功能块的标注的准确率为84.27%,召回率为85.57%,F值为84.92%. 展开更多
关键词 汉语基本块 汉语功能块 条件随机场模型 句法分析 序列标注
在线阅读 下载PDF
基于高阶条件随机场模型的改进型图像分割算法 被引量:4
4
作者 王灵矫 钟益群 +1 位作者 郭华 彭志强 《计算机工程》 CAS CSCD 北大核心 2016年第6期241-246,共6页
在图像分割中,将条件随机场(CRF)模型及其高阶模型广泛用作能量函数,后者以二阶CRF模型为基础,通过引入高阶势函数反映各分割块内像素标记的一致性,使分割的目标边缘更加精确,但能量最小化的计算效率不理想。针对该问题,提出一种基于鲁... 在图像分割中,将条件随机场(CRF)模型及其高阶模型广泛用作能量函数,后者以二阶CRF模型为基础,通过引入高阶势函数反映各分割块内像素标记的一致性,使分割的目标边缘更加精确,但能量最小化的计算效率不理想。针对该问题,提出一种基于鲁棒P^nPotts高阶CRF模型的改进型图像分割算法。根据给定的标记集合运行最大流/最小割算法得到局部最优解,再用局部最优解修改节点的标记,对未确定标记的节点运行α扩展算法,并在每次迭代过程中动态更新图的流和边的剩余容量,使得每次迭代的时间快速减少。实验结果表明,与α扩展算法相比,改进算法在保持原有分割效果的基础上,相同图像的能量最小化收敛速度比原算法快2倍~3倍。 展开更多
关键词 高阶条件随机场模型 图像分割 能量最小化 最大流/最小割 局部最优解 α扩展算法
在线阅读 下载PDF
基于多条件随机场模型的图像3D空间布局理解 被引量:2
5
作者 刘威 周婷 +1 位作者 袁淮 赵宏 《电子学报》 EI CAS CSCD 北大核心 2017年第2期328-336,共9页
图像3D空间布局理解在自动驾驶系统以及目标识别中扮演着重要的角色.本文提出一种基于多条件随机场模型集成的图像3D空间布局理解算法.首先,基于多次图像分割生成多个不同尺度的超像素图像;然后,结合LBP表面纹理特征、LM滤波器组获得的... 图像3D空间布局理解在自动驾驶系统以及目标识别中扮演着重要的角色.本文提出一种基于多条件随机场模型集成的图像3D空间布局理解算法.首先,基于多次图像分割生成多个不同尺度的超像素图像;然后,结合LBP表面纹理特征、LM滤波器组获得的方向纹理特征、颜色特征以及图像中超像素的位置和形状特征,建立各尺度的超像素图像中超像素的特征表达;最后,为各尺度的超像素图像分别构建相应的条件随机场模型,并应用D-S证据合成理论对多个条件随机场模型的推断结果进行集成,实现对图像3D空问布局的理解.在公共数据集GC和KITTI Layout上的实验结果表明,同已有算法相比,本文提出的算法提高了图像3D空间布局理解的准确率. 展开更多
关键词 3D空间布局 多次图像分割 超像素特征表达 条件随机场模型 证据合成
在线阅读 下载PDF
基于条件随机场模型的数据异常检测算法 被引量:3
6
作者 王文珂 文雅玫 蔡喆 《计算机工程与科学》 CSCD 北大核心 2015年第9期1756-1760,共5页
企业数据中心作为辅助决策的重要工具,保证其数据的及时性、准确性和科学性是最基本的要求和最核心的原则。对于数据异常的情况,若仅依靠人为的经验在海量数据中进行判断是很困难的,也是不科学且低效的。针对企业购销存数据的准确性问题... 企业数据中心作为辅助决策的重要工具,保证其数据的及时性、准确性和科学性是最基本的要求和最核心的原则。对于数据异常的情况,若仅依靠人为的经验在海量数据中进行判断是很困难的,也是不科学且低效的。针对企业购销存数据的准确性问题,研究了基于机器学习的数据异常检测算法。由于购销存数据是由一组相对固定的数据项组成,可以看作是一个结构化数据序列,因此选择了解决结构化序列预测问题最为有效的条件随机场模型CRFs。通过对大量历史数据进行学习,分析出数据的自身规律以及关联关系,使计算机具备自动检测异常的能力。实验结果表明了该算法的有效性。 展开更多
关键词 数据中心 机器学习 数据异常检测 条件随机场模型
在线阅读 下载PDF
基于层叠条件随机场模型的电子病历文本信息抽取 被引量:13
7
作者 梁立荣 李长伟 +3 位作者 沈晔 周立娟 景行 童朝晖 《计算机应用与软件》 北大核心 2019年第10期47-54,112,共9页
自然语言处理技术已用于非结构化中文电子病历信息抽取,并且新的算法或模型不断出现,但其应用效果的证据较少。共收集北京某大型三甲综合医院呼吸专科住院电子病历38218份,通过对数据预处理,抽象文本特征与定义语法规则,产生训练数据集... 自然语言处理技术已用于非结构化中文电子病历信息抽取,并且新的算法或模型不断出现,但其应用效果的证据较少。共收集北京某大型三甲综合医院呼吸专科住院电子病历38218份,通过对数据预处理,抽象文本特征与定义语法规则,产生训练数据集和测试集,构建层叠条件随机场模型,并评估该模型的识别效果。结果表明,针对入院记录、出院记录、辅助检查报告3大类共39种非结构化文本,该模型可准确、快速地处理病历文本信息,应用效果较为理想。 展开更多
关键词 医疗电子病历 自然语言处理 机器学习 层叠条件随机场模型 信息抽取
在线阅读 下载PDF
基于多条件随机场的短时交通流预测模型 被引量:4
8
作者 邓箴 任静 刘立波 《计算机工程与设计》 北大核心 2017年第10期2887-2891,共5页
为有效解决传统的短时交通流预测方法较为单一,特征没有得到良好体现的问题,提出一种基于多条件随机场的短时交通流量预测模型,用4类特征函数建立多个CRF特征子集反映交通数据的多累特征,依据改进的势函数体现短时交通数据流的前后相关... 为有效解决传统的短时交通流预测方法较为单一,特征没有得到良好体现的问题,提出一种基于多条件随机场的短时交通流量预测模型,用4类特征函数建立多个CRF特征子集反映交通数据的多累特征,依据改进的势函数体现短时交通数据流的前后相关性,经训练拟合得到MCRF模型。利用智能交通信号系统和高清道路监控系统的数据,验证了拟合后的MCRF模型比其它模型具有更高的可行性和有效性。 展开更多
关键词 短时交通流 条件随机场模型 势函数 特征提取 预测模型
在线阅读 下载PDF
基于条件随机场的汉语框架语义角色自动标注 被引量:8
9
作者 宋毅君 王瑞波 +1 位作者 李济洪 李国臣 《中文信息学报》 CSCD 北大核心 2014年第3期36-47,共12页
在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华... 在给定目标词及其所属框架的条件下,汉语框架语义角色标注可以分为语义角色识别和角色分类两个步骤。该文将此任务通过IOB2标记策略形式化为词序列标注问题,以词为基本标注单元,采用条件随机场模型进行自动标注实验。先对语料使用清华大学的基本块自动分析器进行分析,提取出15个块层面的新特征,并将这些特征标记形式化到词序列上。以文献[20]已有的12个词层面特征以及15个块层面特征共同构成候选特征集,采用正交表方法来选择模型的最优特征模板。在与文献[20]相同的语料上,相同的3组2折交叉验证实验下,语义角色标注的总性能的F1-值比文献[20]的F1-值提高了近1%,且在显著水平0.05的t-检验下显著。实验结果表明:(1)基于词序列模型,新加入的15个块层面特征可以显著提高标注模型的性能,但这类特征主要对角色分类有显著作用,对角色识别作用不显著;(2)基于词序列的标注模型显著好于以基本块为标注单元以及以句法成分为标注单元的标注模型。 展开更多
关键词 汉语框架语义知识库 语义角色标注 条件随机场模型 基本块
在线阅读 下载PDF
基于高阶CRF模型的图像语义分割 被引量:7
10
作者 毛凌 解梅 《计算机应用研究》 CSCD 北大核心 2013年第11期3514-3517,共4页
图像语义分割方法大多基于点对条件随机场模型,不能定位到单个目标,并且难以利用全局形状特征,造成误识。针对这些问题,提出一种新的高阶条件随机场模型,将基于全局形状特征的目标检测结果和点对条件随机场模型统一在一个概率模型框架中... 图像语义分割方法大多基于点对条件随机场模型,不能定位到单个目标,并且难以利用全局形状特征,造成误识。针对这些问题,提出一种新的高阶条件随机场模型,将基于全局形状特征的目标检测结果和点对条件随机场模型统一在一个概率模型框架中,同时完成图像分割、目标检测与识别的任务。利用目标检测器和前背景分割算法获取图像中目标区域,在目标区域上定义新的高阶能量项。新的高阶条件随机场模型就是高阶能量项和点对条件随机场模型的加权混合模型,其最优解即为图像语义分割结果。在MSRC-21类数据库上进行的实验验证了该模型能够显著提升图像语义分割性能,并定位到单个目标。 展开更多
关键词 计算机视觉 图像语义分割 条件随机场模型 高阶能量项 基于可形变部件模型
在线阅读 下载PDF
稀疏字典驱动高阶依赖的RGB-D室内场景语义分割 被引量:1
11
作者 刘天亮 徐高帮 +2 位作者 戴修斌 曹旦旦 罗杰波 《南京邮电大学学报(自然科学版)》 北大核心 2017年第5期13-18,共6页
为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视... 为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视觉特征,构建超像素标签池并用于训练支持向量机分类器。接着,计算超像素一元势能和相邻超像素成对项势能;同时,以每一类超像素区域内关键点特征的稀疏编码子之和的直方图统计作为高阶势能。最后,利用融合自顶向下的判别性类别成本的条件随机场模型推理实现语义标注。实验表明,与其他方法相比,该方法能得到视觉表现力更强、准确率更高的语义标签图。 展开更多
关键词 语义分割 条件随机场模型 稀疏字典学习 结构化支持向量机
在线阅读 下载PDF
基于BiLSTM-CRF模型的食品安全事件词性自动标注研究 被引量:15
12
作者 徐飞 叶文豪 宋英华 《情报学报》 CSSCI CSCD 北大核心 2018年第12期1204-1211,共8页
词性自动标注的准确率和召回率直接影响到后续食品安全事件各个层面知识和应对策略挖掘的整体效果,不仅直接影响食品安全事件中术语、实体抽取的性能,而且在一定程度上决定了与食品安全事件相关的分类、聚类和关联知识挖掘的精准度。本... 词性自动标注的准确率和召回率直接影响到后续食品安全事件各个层面知识和应对策略挖掘的整体效果,不仅直接影响食品安全事件中术语、实体抽取的性能,而且在一定程度上决定了与食品安全事件相关的分类、聚类和关联知识挖掘的精准度。本文分别基于CRF、RNN、BiLSTM和BiLSTM-CRF等传统机器学习模型与深度学习模型对食品安全事件文本进行词性自动标注实验。四十组实验结果表明,在未加入任何人工特征的条件下,深度学习模型的标注调和平均值高于传统的条件随机场模型,其中RNN和BiLSTM的调和平均值分别高出了2.43%和3.93%。而有机融合了BiLSTM和条件随机场模型两者最优特征的BiLSTM-CRF模型整体性能达到了最优,其中调和平均值比BiLSTM高出了7.12%,并且其中最优模型的调和平均值达到了95.89%。 展开更多
关键词 词性标注 食品安全事件 深度学习模型 条件随机场模型
在线阅读 下载PDF
多级层次三维卷积神经网络的牙颌模型分割与识别技术 被引量:4
13
作者 田素坤 戴宁 +3 位作者 袁福来 张贝 俞青 程筱胜 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2020年第8期1218-1227,共10页
牙齿分割是计算机辅助口腔正畸治疗的重要技术.针对传统牙齿分割方法因交互操作复杂、手工干预程度高导致分割效率和精度较低的问题,提出一种基于多级层次三维卷积神经网络的牙颌模型自动分割与识别方法.首先利用基于哈希表的八叉树稀... 牙齿分割是计算机辅助口腔正畸治疗的重要技术.针对传统牙齿分割方法因交互操作复杂、手工干预程度高导致分割效率和精度较低的问题,提出一种基于多级层次三维卷积神经网络的牙颌模型自动分割与识别方法.首先利用基于哈希表的八叉树稀疏表达模型对牙颌模型进行标签化预处理;然后采用构建的Level-1网络和Level-2网络,分别实现普通牙齿间类别和高相似度牙齿间类别的区分;最后采用基于深度卷积特征的多级层次分割网络实现牙齿与牙龈以及牙齿间的分割,并利用条件随机场模型对龈缘区及齿间接触区的局部细节特征进行建模与优化.实验结果表明,在自行采集的牙齿数据集上的牙齿识别准确率均维持在0.858以上,单颗牙齿的分割准确率为0.898,与同类分割方法对比,验证了层次特征学习方法具有较高的准确率和鲁棒性,适用于各种不同程度畸形牙患者的牙齿分割,在计算机辅助口腔治疗诊断中具有巨大的应用潜力. 展开更多
关键词 牙齿分割 三维卷积神经网络 八叉树 条件随机场模型 口腔正畸
在线阅读 下载PDF
基于CRFs和歧义模型的越南语分词 被引量:2
14
作者 熊明明 李英 +2 位作者 郭剑毅 毛存礼 余正涛 《数据采集与处理》 CSCD 北大核心 2017年第3期636-642,共7页
通过对越南语词法特点的研究,把越南语的基本特征融入到条件随机场中(Condition random fields,CRFs),提出了一种基于CRFs和歧义模型的越南语分词方法。通过机器标注、人工校对的方式获取了25 981条越南语分词语料作为CRFs的训练语料。... 通过对越南语词法特点的研究,把越南语的基本特征融入到条件随机场中(Condition random fields,CRFs),提出了一种基于CRFs和歧义模型的越南语分词方法。通过机器标注、人工校对的方式获取了25 981条越南语分词语料作为CRFs的训练语料。越南语中交叉歧义广泛分布在句子中,为了克服交叉歧义的影响,通过词典的正向和逆向匹配算法从训练语料中抽取了5 377条歧义片段,并通过最大熵模型训练得到一个歧义模型,并融入到分词模型中。把训练语料均分为10份做交叉验证实验,分词准确率达到了96.55%。与已有越南语分词工具VnTokenizer比较,实验结果表明该方法提高了越南语分词的准确率、召回率和F值。 展开更多
关键词 条件随机场模型 越南语分词 词法 基本特征 最大熵 歧义模型
在线阅读 下载PDF
基于ALBERT预训练模型的事件抽取技术研究 被引量:3
15
作者 杜洁 骆力明 孙众 《计算机工程与科学》 CSCD 北大核心 2023年第4期711-717,共7页
信息抽取技术用于从非结构化文本数据中提取关注度较高的信息。事件抽取技术是信息抽取研究领域中具有挑战的研究方向。事件抽取的目的是从非结构化文本数据中抽取描述事件的关键元素,并以结构化的方式呈现。事件抽取被看作序列标注任务... 信息抽取技术用于从非结构化文本数据中提取关注度较高的信息。事件抽取技术是信息抽取研究领域中具有挑战的研究方向。事件抽取的目的是从非结构化文本数据中抽取描述事件的关键元素,并以结构化的方式呈现。事件抽取被看作序列标注任务,首先采用ALBERT预训练模型学习特征,其次引入条件随机场CRF模型提高序列标注性能,最后完成事件类型以及事件要素的识别分类。在ACE2005标准语料库上的实验结果表明,与现有模型相比,ALBERT-CRF模型在触发词识别和分类任务上的召回率和F值均有所提高。 展开更多
关键词 事件抽取 序列标注 ALBERT模型 条件随机场模型
在线阅读 下载PDF
国家社科基金学科类别自动判定模型构建研究
16
作者 沈思 翁小颖 +1 位作者 孙豪 王东波 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第4期118-124,共7页
在把所获取的国家社科基金项目标题按照词表示成训练和测试语料的基础上,基于条件随机场模型和双向长短时记忆模型对所构建的国家社科基金项目学科类别判定模型,进行了多个角度和层面的验证,并与支持向量机模型的实验结果进行对比.基于... 在把所获取的国家社科基金项目标题按照词表示成训练和测试语料的基础上,基于条件随机场模型和双向长短时记忆模型对所构建的国家社科基金项目学科类别判定模型,进行了多个角度和层面的验证,并与支持向量机模型的实验结果进行对比.基于相应的模型性能评价指标,验证了传统机器学习模型在小规模语料上的整体性能,证明增加了人工特征模型后的条件随机场模型的整体性能并未突出,同时对条件随机场的性能进行个案分析. 展开更多
关键词 机器学习 条件随机场模型 国家社科基金 文本挖掘
在线阅读 下载PDF
基于方剂数据集的知识图谱构建研究 被引量:3
17
作者 李灿 镇可涵 +1 位作者 唐东昕 解丹 《世界中医药》 CAS 北大核心 2024年第9期1329-1333,共5页
目的:构建基于方剂数据集的知识图谱,以系统性地展示方剂实体及其之间的关系。方法:首先建立方剂数据处理与知识图谱构建的规范化流程,获取方剂数据集,然后在4种常用命名实体识别模型中遴选最优模型进行实体抽取,最后利用Neo4j图数据库... 目的:构建基于方剂数据集的知识图谱,以系统性地展示方剂实体及其之间的关系。方法:首先建立方剂数据处理与知识图谱构建的规范化流程,获取方剂数据集,然后在4种常用命名实体识别模型中遴选最优模型进行实体抽取,最后利用Neo4j图数据库构建知识图谱。结果:最终遴选出基于Transformer的双向编码模型-双向长短期记忆网络-条件随机场(BERT-BiLSTM-CRF)模型,从数据集中抽取出症状、中西医病名、中医证候等医学实体,平均F1值达90.55%,形成了规范的方剂数据集并构建了方剂知识图谱。结论:利用本文方法抽取出的医学实体为中医药的临床实践和科学研究提供了系统性展示方剂实体及其之间关系的可靠数据基础。所建立的方剂知识图谱实现了中药方剂的知识检索,不仅有助于发现方剂数据中的潜在知识与内在关系,而且为中医药领域的信息整合和知识发现提供了坚实基础,推动中医药的现代化进程。 展开更多
关键词 方剂 数据处理 知识图谱 规范化 命名实体识别 Neo4j图数据库 基于Transformer的双向编码模型-双向长短期记忆网络-条件随机场模型 中医药
在线阅读 下载PDF
多特征融合的专利功效短语抽取
18
作者 游新冬 赵颖 +1 位作者 刘佳琦 吕学强 《计算机工程与设计》 北大核心 2024年第5期1413-1419,共7页
为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到B... 为提高专利功效短语抽取的准确率和召回率,保障专利布局等研究工作的高质量进行,提出一种融合多特征的专利功效短语抽取模型。基于Bert-BiLSTM-CRF的整体框架,利用Bert模型对文本进行向量化,融合偏旁部首、五笔、词长+词性等特征输入到BiLSTM或Transformer进行编码,使用CRF解码得到对应输入的标签序列,得到专利功效短语。实验采用新能源汽车领域的专利文本作为训练数据,尝试组合不同的特征进行实验,实验结果表明,所提模型在准确率、召回率、F1值上均取得了明显提升,验证了多特征融合在功效短语抽取任务上的有效性。 展开更多
关键词 多特征融合 专利功效短语 深度学习 词语抽取 双向长短期记忆模型 条件随机场模型 词向量模型
在线阅读 下载PDF
基于多模型融合的电力运检命名实体识别 被引量:3
19
作者 孙玉芹 肖静婷 王海超 《科学技术与工程》 北大核心 2023年第36期15545-15552,共8页
为有效解决构建电力运检知识图谱的关键步骤之一的电力运检命名实体识别问题,通过构建一种基于Stacking多模型融合的隐马尔可夫-条件随机场-双向长短期记忆网络(hidden Markov-conditional random fields-bi-directional long short-ter... 为有效解决构建电力运检知识图谱的关键步骤之一的电力运检命名实体识别问题,通过构建一种基于Stacking多模型融合的隐马尔可夫-条件随机场-双向长短期记忆网络(hidden Markov-conditional random fields-bi-directional long short-term,HCB)模型方法研究了电力运检命名实体识别问题。HCB模型分为两层,第一层使用隐马尔可夫模型(hidden Markov model,HMM)、条件随机场(conditional random fields,CRF)和双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)模型进行训练预测,再将预测结果输入第二层的CRF模型进行训练,经过双层模型训练预测得出最后的命名实体。结果表明:在电力运检命名实体识别问题上HCB模型的精确率、召回率及F1值等指标明显优于单模型以及其他的融合模型。可见HCB模型能有效解决电力运检命名实体识别问题。 展开更多
关键词 电力运检知识图谱 模型融合 命名实体识别 隐马尔可夫-条件随机-双向长短期记忆网络(HCB)模型
在线阅读 下载PDF
一种基于字词联合解码的中文分词方法 被引量:42
20
作者 宋彦 蔡东风 +1 位作者 张桂平 赵海 《软件学报》 EI CSCD 北大核心 2009年第9期2366-2375,共10页
近年来基于字的方法极大地提高了中文分词的性能,借助于优秀的学习算法,由字构词逐渐成为中文分词的主要技术路线.然而,基于字的方法虽然在发现未登录词方面有其优势,却往往在针对表内词的切分效果方面不及基于词的方法,而且还损失了一... 近年来基于字的方法极大地提高了中文分词的性能,借助于优秀的学习算法,由字构词逐渐成为中文分词的主要技术路线.然而,基于字的方法虽然在发现未登录词方面有其优势,却往往在针对表内词的切分效果方面不及基于词的方法,而且还损失了一些词与词之间的信息以及词本身的信息.在此基础上,提出了一种结合基于字的条件随机场模型与基于词的Bi-gram语言模型的切分策略,实现了字词联合解码的中文分词方法,较好地发挥了两个模型的长处,能够有效地改善单一模型的性能,并在SIGHAN Bakeoff3的评测集上得到了验证,充分说明了合理的字词结合方法将有效地提高分词系统的性能,可以更好地应用于中文信息处理的各个方面. 展开更多
关键词 中文分词 联合解码 语言模型 条件随机场模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部