期刊文献+
共找到114篇文章
< 1 2 6 >
每页显示 20 50 100
Intelligent modeling method for OV models in DoDAF2.0 based on knowledge graph
1
作者 ZHANG Yue JIANG Jiang +3 位作者 YANG Kewei WANG Xingliang XU Chi LI Minghao 《Journal of Systems Engineering and Electronics》 2025年第1期139-154,共16页
Architecture framework has become an effective method recently to describe the system of systems(SoS)architecture,such as the United States(US)Department of Defense Architecture Framework Version 2.0(DoDAF2.0).As a vi... Architecture framework has become an effective method recently to describe the system of systems(SoS)architecture,such as the United States(US)Department of Defense Architecture Framework Version 2.0(DoDAF2.0).As a viewpoint in DoDAF2.0,the operational viewpoint(OV)describes operational activities,nodes,and resource flows.The OV models are important for SoS architecture development.However,as the SoS complexity increases,constructing OV models with traditional methods exposes shortcomings,such as inefficient data collection and low modeling standards.Therefore,we propose an intelligent modeling method for five OV models,including operational resource flow OV-2,organizational relationships OV-4,operational activity hierarchy OV-5a,operational activities model OV-5b,and operational activity sequences OV-6c.The main idea of the method is to extract OV architecture data from text and generate interoperable OV models.First,we construct the OV meta model based on the DoDAF2.0 meta model(DM2).Second,OV architecture named entities is recognized from text based on the bidirectional long short-term memory and conditional random field(BiLSTM-CRF)model.And OV architecture relationships are collected with relationship extraction rules.Finally,we define the generation rules for OV models and develop an OV modeling tool.We use unmanned surface vehicles(USV)swarm target defense SoS architecture as a case to verify the feasibility and effectiveness of the intelligent modeling method. 展开更多
关键词 system of systems(SoS)architecture operational viewpoint(OV)model meta model bidirectional long short-term memory and conditional random field(BiLSTM-CRF) model generation systems modeling language
在线阅读 下载PDF
融合数据增强的互花米草入侵关联要素实体识别方法
2
作者 李忠伟 张文丰 +1 位作者 李永 李明轩 《计算机工程与设计》 北大核心 2025年第2期603-609,共7页
为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要... 为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要素的上下文信息;使用BiLSTM进一步提取特征,利用CRF得到实体的标签约束。通过对比不同模型在自建数据集上的精确率、召回率和F1分数,验证了该模型在互花米草入侵领域实体识别的有效性。 展开更多
关键词 命名实体识别 互花米草入侵 深度学习 数据增强 预训练模型 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
伪标签置信度调控结直肠癌病理图像半监督语义分割
3
作者 徐晗晗 张印辉 +4 位作者 何自芬 刘珈岑 李振辉 吴琳 史本杰 《光学精密工程》 北大核心 2025年第4期591-609,共19页
为了改善结直肠癌病理图像半监督语义分割任务中存在的低置信度伪标签利用不充分、高置信度伪标签准确性亟需优化和伪标签类别不平衡等问题,本文提出了一种伪标签置信度调控方法,旨在实现结直肠癌病理图像的高质量多类别半监督语义分割... 为了改善结直肠癌病理图像半监督语义分割任务中存在的低置信度伪标签利用不充分、高置信度伪标签准确性亟需优化和伪标签类别不平衡等问题,本文提出了一种伪标签置信度调控方法,旨在实现结直肠癌病理图像的高质量多类别半监督语义分割。首先,基于教师-学生模型的半监督语义分割框架,提出在一致性正则化中嵌入类别置信度调控,通过对未训练教师模型生成的低置信度伪标签中的混淆类别进行移除以增强确定性,从而提升低置信度伪标签的贡献率。其次,提出对训练后教师模型生成的伪标签进行先筛选后细化的操作范式,通过对筛选后的高置信度伪标签进行基于条件随机场的细化操作,以改善高置信度伪标签中边界模糊和缺乏语义信息的问题。最后,为缓解伪标签数据中的类别不平衡,设计了一种基于伪标签类别数判定的自适应随机级联强数据增强的方法。通过自建结直肠癌病理图像数据集以及公开的多类别病理图像数据集进行实验验证,本文方法实现了74.09%的结直肠癌病理图像四个类的平均分割精度,相比于基准网络提高6.43%,为结直肠癌病理图像半监督语义分割提供有力的算法支持。 展开更多
关键词 结直肠癌病理图像 半监督语义分割 教师-学生模型 一致性正则化 条件随机场 数据增强
在线阅读 下载PDF
基于高分辨率重建的矿区遥感图像目标分割算法
4
作者 王晓红 苏兵 韩红章 《金属矿山》 北大核心 2025年第4期195-200,共6页
高分辨率遥感图像中的矿山目标具有复杂的形态、纹理和光照特征,给目标分割带来了挑战。为提高矿山目标分割精度和效率,提出了一种基于高分辨率重建的矿区遥感图像目标分割算法。该算法首先利用超像素分割方法将遥感图像分割成若干块,... 高分辨率遥感图像中的矿山目标具有复杂的形态、纹理和光照特征,给目标分割带来了挑战。为提高矿山目标分割精度和效率,提出了一种基于高分辨率重建的矿区遥感图像目标分割算法。该算法首先利用超像素分割方法将遥感图像分割成若干块,利用深度学习模型提取每个块的特征,并将其重建为高分辨率的特征图;然后利用标记分水岭算法对重建的特征图进行进一步分割,得到矿山目标的精细边界;最后通过条件随机场对分割结果进行优化,消除噪声和误分区域。在真实的高分辨率遥感图像上进行了试验,结果表明:该算法在矿山目标分割方面具有较高的准确率和鲁棒性,且具有较快的运行速度,适用于大规模的遥感图像处理,准确率达到了0.93,召回率为0.92,F_(1)分数为0.94,平均交并比(mIoU)达到0.85。所提算法为高分辨率遥感图像精确分割提供了一种有效方法,对于促进矿区遥感技术应用有一定的意义。 展开更多
关键词 高分辨率重建 矿区遥感图像 目标分割 深度学习模型 条件随机场
在线阅读 下载PDF
基于双向长短时记忆网络的地铁应急知识抽取与推理
5
作者 叶雨涛 王鹏玲 +2 位作者 徐瑞华 肖晓芳 葛健豪 《同济大学学报(自然科学版)》 北大核心 2025年第3期420-429,共10页
为解决文本类地铁应急处置流程存在的流程顺序关系不明确、流程执行人员模糊等问题,提出了基于BiLSTM-CRF(Bidirectional Long Short-Term Memory-Conditional Random Field)的地铁应急处置知识抽取与推理方法。首先,利用BiLSTM-CRF方... 为解决文本类地铁应急处置流程存在的流程顺序关系不明确、流程执行人员模糊等问题,提出了基于BiLSTM-CRF(Bidirectional Long Short-Term Memory-Conditional Random Field)的地铁应急处置知识抽取与推理方法。首先,利用BiLSTM-CRF方法对地铁应急处置流程的文本资料进行命名实体识别,完成文本资料的知识抽取;其次,选用TransD模型对识别后实体数据进行知识推理,从而完成以实体和属性对为节点、关系对为边的知识图谱构建;最后,利用Neo4j图数据库对构建的地铁应急处置流程知识图谱进行了可视化展示和案例分析。研究结果表明,基于BiLSTM-CRF的知识抽取模型的精确率、召回率和F1值均达到了90%以上,且基于BiLSTM-CRF的TransD模型的推理结果准确率提升了22.92%,保证了知识图谱构建的准确性,可为地铁应急管理提供决策支持。 展开更多
关键词 地铁应急处置 知识图谱 条件随机场的双向长短时网络 TransD模型 知识抽取
在线阅读 下载PDF
机床夹具设计知识图谱构建及应用
6
作者 张称心 孙家盛 段阳 《机电工程》 北大核心 2025年第1期106-116,共11页
针对目前机床夹具设计领域中存在的知识挖掘深度不足、利用率不高且过度依赖设计人员经验等问题,提出了一种基于自顶向下方式的机床夹具设计知识图谱构建方法。首先,将机床夹具设计知识分为原理规则类和功能描述类,利用本体建模语言(OWL... 针对目前机床夹具设计领域中存在的知识挖掘深度不足、利用率不高且过度依赖设计人员经验等问题,提出了一种基于自顶向下方式的机床夹具设计知识图谱构建方法。首先,将机床夹具设计知识分为原理规则类和功能描述类,利用本体建模语言(OWL)对这两类知识进行了本体建模,构建了知识图谱的模式层;其次,在模式层的指导下,以机床夹具设计原理规则文档和设计实例为数据源,利用双向长短期记忆网络-条件随机场算法(BiLSTM-CRF)对其进行了知识抽取,得到了结构化的机床夹具设计知识;然后,运用Neo4j图数据库存储结构化的机床夹具设计知识,得到了知识图谱的数据层;最后,以轴承套筒法兰的夹具设计为例,对该方法的可行性进行了验证;考虑到企业对同一夹具结构的不同技术需求,提出了一种基于图形数据科学算法(GDS)的相似元件替代法,对夹具知识图谱中47个定位元件节点进行了相似度计算,得到了1081条相似度数据样本,并构建了综合评判模型。研究结果表明:当相似度阈值设置为0.76时,将定位元件进行替换的精确率达到了84%。通过建立知识图谱,完成了机床夹具设计的两类知识的有效关联,为构建数据驱动的机床夹具智能设计奠定了基础。 展开更多
关键词 机械设计 智能设计 知识图谱 知识抽取 知识融合 本体建模语言 双向长短期记忆网络-条件随机场算法 图形数据科学算法
在线阅读 下载PDF
基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究 被引量:4
7
作者 余礼根 郭晓利 +3 位作者 赵红涛 杨淦 张俊 李奇峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期287-294,共8页
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona... 针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。 展开更多
关键词 畜禽疫病 文本分词 预训练语言模型 双向长短时记忆网络 条件随机场
在线阅读 下载PDF
融合词汇边界信息的合同实体识别方法 被引量:1
8
作者 王浩畅 和婷婷 郑冠彧 《计算机工程与设计》 北大核心 2024年第6期1757-1763,共7页
针对合同中实体表达形式复杂多变、识别粒度细的特点,及合同文本中实体较长问题,提出一种融合词汇边界信息的合同实体识别方法。利用预训练语言模型动态生成语义向量作为模型输入;运用相对位置编码对Transformer结构进行改进,使其在编... 针对合同中实体表达形式复杂多变、识别粒度细的特点,及合同文本中实体较长问题,提出一种融合词汇边界信息的合同实体识别方法。利用预训练语言模型动态生成语义向量作为模型输入;运用相对位置编码对Transformer结构进行改进,使其在编码过程中融合词汇信息,进一步丰富语义特征;通过条件随机场(CRF)结构进行解码,得到输入序列的标签预测。实验结果表明,该方法可以有效确定合同文本中的实体边界,具有良好的泛化性能。 展开更多
关键词 实体识别 合同文本 预训练语言模型 相对位置编码 转换器结构 词汇边界信息 条件随机场
在线阅读 下载PDF
基于改进DeeplabV3+的水面多类型漂浮物分割方法研究
9
作者 包学才 刘飞燕 +2 位作者 聂菊根 许小华 柯华盛 《水利水电技术(中英文)》 北大核心 2024年第4期163-175,共13页
【目的】为解决传统图像处理方法鲁棒性差、常用深度学习检测方法无法准确识别大片漂浮物的边界等问题,【方法】提出一种基于改进DeeplabV3+的水面多类型漂浮物识别的语义分割方法,提高水面漂浮的识别能力。对所收集实际水面漂浮物进行... 【目的】为解决传统图像处理方法鲁棒性差、常用深度学习检测方法无法准确识别大片漂浮物的边界等问题,【方法】提出一种基于改进DeeplabV3+的水面多类型漂浮物识别的语义分割方法,提高水面漂浮的识别能力。对所收集实际水面漂浮物进行分类,采用自制数据集进行对比试验。算法选择xception网络作为主干网络以获得初步漂浮物特征,在加强特征提取网络部分引入注意力机制以强调有效特征信息,在后处理阶段加入全连接条件随机场模型,将单个像素点的局部信息与全局语义信息融合。【结果】对比图像分割性能指标,改进后的算法mPA(Mean Pixel Accuracy)提升了5.73%,mIOU(Mean Intersection Over Union)提升了4.37%。【结论】相比于其他算法模型,改进后的DeeplabV3+算法对漂浮物特征的获取能力更强,同时能获得丰富的细节信息以更精准地识别多类型水面漂浮物的边界与较难分类的漂浮物,在对多个水库场景测试后满足实际水域环境中漂浮物检测的需求。 展开更多
关键词 深度学习 语义分割 特征提取 漂浮物识别 注意力机制 全连接条件随机场 算法模型 影响因素
在线阅读 下载PDF
基于局部Transformer的泰语分词和词性标注联合模型 被引量:1
10
作者 朱叶芬 线岩团 +1 位作者 余正涛 相艳 《智能系统学报》 CSCD 北大核心 2024年第2期401-410,共10页
泰语分词和词性标注任务二者之间存在高关联性,已有研究表明将分词和词性标注任务进行联合学习可以有效提升模型性能,为此,提出了一种针对泰语拼写和构词特点的分词和词性标注联合模型。针对泰语中字符构成音节,音节组成词语的特点,采... 泰语分词和词性标注任务二者之间存在高关联性,已有研究表明将分词和词性标注任务进行联合学习可以有效提升模型性能,为此,提出了一种针对泰语拼写和构词特点的分词和词性标注联合模型。针对泰语中字符构成音节,音节组成词语的特点,采用局部Transformer网络从音节序列中学习分词特征;考虑到词根和词缀等音节与词性的关联,将用于分词的音节特征融入词语序列特征,缓解未知词的词性标注特征缺失问题。在此基础上,模型采用线性分类层预测分词标签,采用线性条件随机场建模词性序列的依赖关系。在泰语数据集LST20上的试验结果表明,模型分词F1、词性标注微平均F1和宏平均F1分别达到96.33%、97.06%和85.98%,相较基线模型分别提升了0.33%、0.44%和0.12%。 展开更多
关键词 泰语分词 词性标注 联合学习 局部Transformer 构词特点 音节特征 线性条件随机场 联合模型
在线阅读 下载PDF
基于增强优化预训练语言模型的电力数据实体识别方法 被引量:5
11
作者 田雪涵 董坤 +1 位作者 赵剑锋 郭希瑞 《智慧电力》 北大核心 2024年第6期100-107,共8页
知识图谱可有效整合电力系统中的多源数据,提升电网的知识管理水平。针对电力文本数据集稀缺、实体类型多样、专业性强的特点,提出1种基于增强优化预训练语言模型的电力数据实体识别方法。该方法使用实体词袋替换的数据增强技术扩大原... 知识图谱可有效整合电力系统中的多源数据,提升电网的知识管理水平。针对电力文本数据集稀缺、实体类型多样、专业性强的特点,提出1种基于增强优化预训练语言模型的电力数据实体识别方法。该方法使用实体词袋替换的数据增强技术扩大原始数据集,采用增强优化预训练语言模型(RoBERTa)进行动态语义编码,利用双向长短期记忆网络(BiLSTM)和条件随机场(CRF)提取特征并优化标签。实验结果表明,该实体识别方法比传统基于深度学习的实体识别方法的平均数指标F1分数高2.17%,证实其对构建电力数据知识图谱的识别效果。 展开更多
关键词 知识图谱 实体识别 数据增强 预训练语言模型 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
基于本体驱动的航空情报表格信息结构化研究 被引量:1
12
作者 赖欣 李思宁 +1 位作者 梁昌盛 张恒嫣 《计算机科学》 CSCD 北大核心 2024年第S01期693-699,共7页
航空资料汇编是国际民航组织推荐的呈现各国航空信息的主要载体,其中以表格数据形式汇总了大量航空数据与航空运行限制信息。为实现航空汇编资料的智能查询,以及对航空资料汇编中静态数据的挖掘与利用,需要对航空汇编资料中的表格信息... 航空资料汇编是国际民航组织推荐的呈现各国航空信息的主要载体,其中以表格数据形式汇总了大量航空数据与航空运行限制信息。为实现航空汇编资料的智能查询,以及对航空资料汇编中静态数据的挖掘与利用,需要对航空汇编资料中的表格信息予以特征提取与结构化处理。将航空资料汇编中表格信息作为研究对象,提出了一种基于本体驱动的航空情报表格信息结构化抽取方法。首先构建航空情报领域信息的本体框架,实现对领域知识统一规范的描述;其次,利用Document AI对表格文档的布局结构进行研究与预处理,并利用随机森林算法与条件随机场模型进行特征实体提取验证与分析。实验结果表明,所提方法能够有效提取航空情报表格中的特征实体,为航空情报领域静态数据深入挖掘提供参考。 展开更多
关键词 航空情报 本体 命名实体识别 条件随机场 随机森林 Document AI
在线阅读 下载PDF
基于XLNET模型的开阳磷矿成矿条件相关地质实体识别与应用
13
作者 彭彬 田宜平 +2 位作者 曾斌 吴雪超 吴文明 《地质科技通报》 CAS CSCD 北大核心 2024年第4期224-234,共11页
随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立... 随着磷矿找矿难度越来越大,地质勘探成果报告也愈来愈多,通过人工识别海量文档中与磷矿成矿相关地质信息耗时低效,无法满足知识共享传播和地质报告智能管理的需求。为快速获得磷矿地质文档报告中隐藏的成矿地质知识,基于XLNET模型建立了磷矿成矿地质实体自动识别的方法。首先对实体进行BIO标注建立地质实体字典,利用XLNET作为底层预处理模型学习句子双向语义;然后使用BILSTM-Attention-CRF模型实现文本多标签的智能分类;最后通过定位磷矿实体在报告中的分布位置大致推测该处磷矿成矿条件和成矿模式。将该模型与其余3种模型比较得出结果,该模型识别的准确率(P)、召回率(R)及F1值都接近了90%,较前3种模型分别调高了2%,5%,6%。该研究为开阳磷矿地质研究人员提供了更加高效的地质实体自动识别的方法。 展开更多
关键词 地质实体识别 XLNET-BILSTM-Attention-CRF 磷矿成矿模式 预训练模型 序列标注
在线阅读 下载PDF
面向行政执法案件文本的事件抽取研究
14
作者 屈潇雅 李兵 温立强 《计算机工程》 CAS CSCD 北大核心 2024年第9期63-71,共9页
行政执法的智能化水平是国家治理能力现代化的体现,数据是智能化发展的重要依托。在行政执法领域,各行政机关存储大量以文本形式记录的历史案件,这种非结构化的数据价值密度较低、可利用性不强。利用事件抽取技术从行政执法案件文本中... 行政执法的智能化水平是国家治理能力现代化的体现,数据是智能化发展的重要依托。在行政执法领域,各行政机关存储大量以文本形式记录的历史案件,这种非结构化的数据价值密度较低、可利用性不强。利用事件抽取技术从行政执法案件文本中快速高效地抽取案件职权类型、案发时间、案发地点等结构化信息,可推动行政机关对历史案件信息的利用和智能化执法办案研究。收集整理某城市的真实案例数据,并通过人工标注构建一个行政执法领域的数据集,根据行政执法案件文本的无触发词、文档级、格式不固定等文本特征,提出结合基于Transformer的双向编码器表示(BERT)和基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型的两阶段事件抽取方法,通过文本多分类和序列标注依次完成事件类型检测和事件论元抽取任务。实验结果表明,事件类型检测任务的F1值达到99.54%,事件论元抽取任务的F1值达到97.36%,实现了对案件信息的有效抽取。 展开更多
关键词 行政执法案件 事件抽取 两阶段方法 基于Transformer的双向编码器表示模型 基于条件随机场的双向长短期记忆网络(BiLSTM-CRF)模型
在线阅读 下载PDF
基于Voronoi图与条件随机场的自然场景文本检测方法
15
作者 方炳坤 楚瀛 《计算机应用与软件》 北大核心 2024年第1期119-125,共7页
在自然场景中准确有效地检测文本是一项艰巨的任务,故提出一种基于条件随机场(CRF)框架的场景文本检测方法。通过利用贝叶斯推断估计文本极大值区域的置信度作为一元成本项,通过使用维诺图(Voronoi图)来构建CRF空间邻域信息,从而构建图... 在自然场景中准确有效地检测文本是一项艰巨的任务,故提出一种基于条件随机场(CRF)框架的场景文本检测方法。通过利用贝叶斯推断估计文本极大值区域的置信度作为一元成本项,通过使用维诺图(Voronoi图)来构建CRF空间邻域信息,从而构建图模型,通过最大流算法最小化成本函数区分文本与非文本标记;利用字符的几何特性通过聚类方法聚合成行。实验结果表明,该算法比传统基于最大稳定极值区域(MSER)算法性能有所提高,自然场景文本检测正确率能达到87%。 展开更多
关键词 贝叶斯模型 条件随机场 VORONOI图 计算机视觉 文本检测
在线阅读 下载PDF
一种基于字词联合解码的中文分词方法 被引量:42
16
作者 宋彦 蔡东风 +1 位作者 张桂平 赵海 《软件学报》 EI CSCD 北大核心 2009年第9期2366-2375,共10页
近年来基于字的方法极大地提高了中文分词的性能,借助于优秀的学习算法,由字构词逐渐成为中文分词的主要技术路线.然而,基于字的方法虽然在发现未登录词方面有其优势,却往往在针对表内词的切分效果方面不及基于词的方法,而且还损失了一... 近年来基于字的方法极大地提高了中文分词的性能,借助于优秀的学习算法,由字构词逐渐成为中文分词的主要技术路线.然而,基于字的方法虽然在发现未登录词方面有其优势,却往往在针对表内词的切分效果方面不及基于词的方法,而且还损失了一些词与词之间的信息以及词本身的信息.在此基础上,提出了一种结合基于字的条件随机场模型与基于词的Bi-gram语言模型的切分策略,实现了字词联合解码的中文分词方法,较好地发挥了两个模型的长处,能够有效地改善单一模型的性能,并在SIGHAN Bakeoff3的评测集上得到了验证,充分说明了合理的字词结合方法将有效地提高分词系统的性能,可以更好地应用于中文信息处理的各个方面. 展开更多
关键词 中文分词 联合解码 语言模型 条件随机场模型
在线阅读 下载PDF
基于层叠CRFs的中文句子评价对象抽取 被引量:19
17
作者 郑敏洁 雷志城 +1 位作者 廖祥文 陈国龙 《中文信息学报》 CSCD 北大核心 2013年第3期69-76,共8页
中文句子评价对象抽取是指在中文句子中抽取评论所针对的对象或对象的属性。目前国内相关研究工作尚未能有效识别复合词评价对象和未登陆评价对象。针对以上两种情况,该文提出了一种基于层叠条件随机场的中文句子评价对象抽取方法。该... 中文句子评价对象抽取是指在中文句子中抽取评论所针对的对象或对象的属性。目前国内相关研究工作尚未能有效识别复合词评价对象和未登陆评价对象。针对以上两种情况,该文提出了一种基于层叠条件随机场的中文句子评价对象抽取方法。该方法首先通过低层条件随机场获得候选评价对象集,然后通过降噪模型对噪声进行过滤、补充模型对缺失的候选评价对象进行补充、合并模型对复合短语候选评价对象进行合并,最后由高层模型抽取出评价对象。实验结果显示,与基于线性链条件随机场的识别方法相比,该方法准确率、召回率和F1值分别提升1.62%、5.75%和4.17%,能有效地识别复合词评价对象和未登录评价对象,从而提高中文句子评价对象的识别精度。 展开更多
关键词 评价对象 层叠条件随机场 降噪模型 补充模型
在线阅读 下载PDF
基于条件随机域的生物命名实体识别 被引量:18
18
作者 彭春艳 张晖 +1 位作者 包玲玉 陈昌平 《计算机工程》 CAS CSCD 北大核心 2009年第22期197-199,共3页
提出一种基于条件随机域模型的生物命名实体识别方法,结合单词构词特性以及距离依赖特性,在JNLPBA的GENIAV3.02数据上进行实验,测试结果表明,引入距离依赖后,系统的识别性能比只利用单特性的条件随机域方法提高2.54%,可获得较好的识别效... 提出一种基于条件随机域模型的生物命名实体识别方法,结合单词构词特性以及距离依赖特性,在JNLPBA的GENIAV3.02数据上进行实验,测试结果表明,引入距离依赖后,系统的识别性能比只利用单特性的条件随机域方法提高2.54%,可获得较好的识别效果,提高了系统的识别效率。 展开更多
关键词 生物命名实体识别 条件随机域 隐马尔科夫模型
在线阅读 下载PDF
基于条件随机场的蒙古语词切分研究 被引量:13
19
作者 赵伟 侯宏旭 +1 位作者 从伟 宋美娜 《中文信息学报》 CSCD 北大核心 2010年第5期31-35,84,共6页
词干和构形附加成分是蒙古语词的组成成分,在构形附加成分中包含着数、格、体、时等大量语法信息。利用这些语法信息有助于使用计算机对蒙古语进行有效处理。蒙古语词在结构上表现为一个整体,为了利用其中的语法信息需要识别出词干和各... 词干和构形附加成分是蒙古语词的组成成分,在构形附加成分中包含着数、格、体、时等大量语法信息。利用这些语法信息有助于使用计算机对蒙古语进行有效处理。蒙古语词在结构上表现为一个整体,为了利用其中的语法信息需要识别出词干和各构形附加成分。通过分析蒙古语词的构形特点,提出一种有效的蒙古语词标注方法,并基于条件随机场模型构建了一个实用的蒙古语词切分系统。实验表明该系统的词切分准确率比现有蒙古语词切分系统的准确率有较大提高,达到了0.992。 展开更多
关键词 蒙古语 词切分 词干 构形附加成分 条件随机场 统计语言模型
在线阅读 下载PDF
基于SVM和CRF的双层模型中文机构名识别 被引量:13
20
作者 黄德根 李泽中 万如 《大连理工大学学报》 EI CAS CSCD 北大核心 2010年第5期782-787,共6页
提出了一种基于支持向量机(SVM)和条件随机场(CRF)的双层模型进行中文机构名识别的方法.第一层模型采用CRF识别简单机构名,并将识别结果传至第二层辅助下一步的识别;第二层采用基于驱动的方法,将SVM和CRF结合进行复杂机构名的识别;最后... 提出了一种基于支持向量机(SVM)和条件随机场(CRF)的双层模型进行中文机构名识别的方法.第一层模型采用CRF识别简单机构名,并将识别结果传至第二层辅助下一步的识别;第二层采用基于驱动的方法,将SVM和CRF结合进行复杂机构名的识别;最后将两层的识别结果合并,并通过一个后续处理对置信度较低的识别结果进行修正.大规模真实语料的开放测试表明,精确率达到94.83%,召回率达到95.02%,证明了该方法的有效性. 展开更多
关键词 机构名识别 条件随机场(CRF) 支持向量机(SVM) 双层模型
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部