期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种面向军事文本的领域特征词向量描述方法 被引量:7
1
作者 秦杰 曹雷 +1 位作者 彭辉 赖俊 《计算机工程》 CAS CSCD 北大核心 2016年第8期160-165,共6页
针对军事文本信息中命名实体多、特征词领域性强的特性,提出一种领域特征词向量描述方法。从优化分词和领域特征词筛选方面压缩向量空间,完善时间、地名、部队名称和武器装备4类重要命名实体的提取规则,扩充分词词典库。改进领域相关度... 针对军事文本信息中命名实体多、特征词领域性强的特性,提出一种领域特征词向量描述方法。从优化分词和领域特征词筛选方面压缩向量空间,完善时间、地名、部队名称和武器装备4类重要命名实体的提取规则,扩充分词词典库。改进领域相关度和领域一致度相结合的领域特征词筛选算法,突出领域特征词与常用词汇之间的差别,进一步过滤领域特征词。实验结果表明,优化分词后,该方法能够提取出军事文本中的命名实体和部分专有词汇,降低特征词数量,改进后的领域特征词筛选算法将准确率和召回率分别提高20%和16.7%,提出的领域特征词向量描述方法所生成的特征词向量具有较强的领域性。 展开更多
关键词 军事文本 命名实体 向量空间 分词 领域特征词
在线阅读 下载PDF
面向军事文本的命名实体识别 被引量:50
2
作者 冯蕴天 张宏军 郝文宁 《计算机科学》 CSCD 北大核心 2015年第7期15-18,47,共5页
针对军事文本中的命名实体,提出一种基于条件随机场模型的半监督命名实体识别方法,旨在将人员军职军衔名、军事装备名、军用物资名、军事设施名、军事机构名(含部队番号)以及军用地名等军事命名实体的识别融合到一个统一的技术框架中。... 针对军事文本中的命名实体,提出一种基于条件随机场模型的半监督命名实体识别方法,旨在将人员军职军衔名、军事装备名、军用物资名、军事设施名、军事机构名(含部队番号)以及军用地名等军事命名实体的识别融合到一个统一的技术框架中。该方法针对军事文本的语法特点建立高效的特征集合,建立条件随机场模型对军事命名实体进行识别,并依次使用基于词典的方法和基于规则的方法对识别结果进行校正。实验表明,该方法在军事文本中能够出色地完成命名实体识别任务,在测试语料上的F-值最高达到90.9%,接近通用领域中命名实体识别的水平。 展开更多
关键词 军事文本 命名实体识别 条件随机场 半监督学习 军事信息处理
在线阅读 下载PDF
基于改进CNN的海军军事文本分类模型 被引量:9
3
作者 齐玉东 丁海强 +1 位作者 司维超 李程瑜 《电光与控制》 CSCD 北大核心 2020年第5期68-73,共6页
针对传统的文本分类方法在海军军事文本分类上准确度不高的问题,根据海军军事文本中重点信息的位置分布规律,改进了传统的一维卷积神经网络,并进一步设计海军军事文本分类模型。在一维卷积方面,提出变步长卷积方法,文本首尾位置采用低... 针对传统的文本分类方法在海军军事文本分类上准确度不高的问题,根据海军军事文本中重点信息的位置分布规律,改进了传统的一维卷积神经网络,并进一步设计海军军事文本分类模型。在一维卷积方面,提出变步长卷积方法,文本首尾位置采用低步长、中间位置采用高步长挖掘文本特征,提高文本首尾位置的重点特征的挖掘能力;在一维池化方面,提出带权池化方法,将文本位置信息转化为权重值参与池化运算,体现文本位置信息的重要程度。实验结果表明,与传统的支持向量机、K近邻算法、一维卷积神经网络以及长短期记忆网络模型相比,该文本分类模型的准确率、召回率、F1值均有所提高。 展开更多
关键词 海军军事文本分类 大数据 一维卷积神经网络 变步长卷积 带权池化
在线阅读 下载PDF
融合本体特征的BiLSTM-CRF军事实体识别模型 被引量:7
4
作者 齐玉东 丁海强 +1 位作者 吴晋豫 司维超 《兵器装备工程学报》 CAS 北大核心 2020年第5期118-123,共6页
针对军事实体识别依赖领域知识的特点,提出了融合本体特征的BiLSTM-CRF军事实体识别模型。通过构建军事领域本体,将分词的本体特征作为领域知识融入到词向量中,有效弥补了传统命名实体识别方法的领域知识缺乏问题,且模型加入字向量描述... 针对军事实体识别依赖领域知识的特点,提出了融合本体特征的BiLSTM-CRF军事实体识别模型。通过构建军事领域本体,将分词的本体特征作为领域知识融入到词向量中,有效弥补了传统命名实体识别方法的领域知识缺乏问题,且模型加入字向量描述分词的内部形态学特征,避免了分词不准确与未登录词对军事命名实体识别造成的影响,最后采用BiLSTM-CRF模型实现军事命名实体识别工作。实验证明,该军事实体识别模型的准确率达到91.08%,能够有效识别军事实体。 展开更多
关键词 本体 Bi-LSTM 军事文本 命名实体识别 字词向量结合
在线阅读 下载PDF
基于后缀向量拼接的军事装备命名实体识别 被引量:3
5
作者 谢德鹏 王佳 +1 位作者 邹华懿 刘进才 《火力与指挥控制》 CSCD 北大核心 2023年第10期133-138,共6页
军事命名实体识别是军事知识图谱构建和装备实体画像的基础性和关键技术,该技术进一步为军事文本智能化处理、辅助决策和情报分析等任务提供支撑。基于后缀向量拼接的军事装备命名实体识别方法,针对中英文文本结构构成具有天然差异,中... 军事命名实体识别是军事知识图谱构建和装备实体画像的基础性和关键技术,该技术进一步为军事文本智能化处理、辅助决策和情报分析等任务提供支撑。基于后缀向量拼接的军事装备命名实体识别方法,针对中英文文本结构构成具有天然差异,中文文本缺少天然分割,加之军事装备别称较多,可能会造成识别的缺失等问题,提出利用文本字向量、词向量拼接实体后缀向量的方法,对军事装备实体进行识别和发现。通过实验验证方法的合理性和先进性。 展开更多
关键词 军事文本 军事装备 实体识别 向量拼接
在线阅读 下载PDF
神经机器翻译译文评测及译后编辑研究 被引量:10
6
作者 郭望皓 胡富茂 《北京第二外国语学院学报》 2021年第5期66-82,共17页
尽管神经机器翻译技术已经取得了巨大进步,业界也正在加速推进神经机器翻译系统实用化和商品化的进程,但其在垂直领域的表现还不尽如人意。本研究以军事领域英译汉文本为研究对象,这些译文均由国内外主流神经机器翻译系统完成,在自主构... 尽管神经机器翻译技术已经取得了巨大进步,业界也正在加速推进神经机器翻译系统实用化和商品化的进程,但其在垂直领域的表现还不尽如人意。本研究以军事领域英译汉文本为研究对象,这些译文均由国内外主流神经机器翻译系统完成,在自主构建的1000个军事题材译文测试数据集中,谷歌、百度、腾讯、有道、搜狗5个翻译系统的BLEU均值仅为20.854,较之其通用语料译文BLEU值相差6.62。实验结果显示:在军事题材译文的拼写、词汇、句法和语义4大类15种共5050处错误中,军事术语翻译错误占比最高,为42.83%;其次为普通词语误译和层级结构错误。实验结果表明,目前现有的神经机器翻译系统尚不能实现高质量的军事文本翻译,无法满足现实需求,亟需进行译后编辑研究,以提高军事文本翻译的准确率。 展开更多
关键词 神经机器翻译 译文评测 译后编辑 军事文本 翻译错误类型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部