-
题名融合词向量的多特征句子相似度计算方法研究
被引量:14
- 1
-
-
作者
李峰
侯加英
曾荣仁
凌晨
-
机构
中国人民解放军后勤科学研究所
北京航空航天大学计算机学院
昆明理工大学信息工程与自动化学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2017年第4期608-618,共11页
-
基金
国家自然科学基金No.61370126
国家高技术研究发展计划(863计划)No.2015AA016004
+1 种基金
国家社会科学基金No.15GJ003-154
软件开发环境国家重点实验室探索性自主研究课题基金No.SKLSDE-2015ZX-16~~
-
文摘
在归纳常见的句子相似度计算方法后,基于《人民日报》3.4万余份文本训练了用于语义相似度计算的词向量模型,并设计了一种融合词向量的多特征句子相似度计算方法。该方法在词方面,考虑了句子中重叠的词数和词的连续性,并运用词向量模型测量了非重叠词间的相似性;在结构方面,考虑了句子中重叠词的语序和两个句子的长度一致性。实验部分设计实现了4种句子相似度计算方法,并开发了相应的实验系统。结果表明:提出的算法能够取得相对较好的实验结果,对句子中词的语义特征和句子结构特征进行组合处理和优化,能够提升句子相似度计算的准确性。
-
关键词
词向量
句子相似度
Word2vec
算法设计
-
Keywords
word embedding
sentence similarity
Word2vec
algorithm design
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种领域语料驱动的句子相关性计算方法研究
- 2
-
-
作者
李峰
黄金柱
李舟军
杨伟铭
-
机构
北京航空航天大学软件开发环境国家重点实验室
中国人民解放军后勤科学研究所
中国人民解放军外国语学院语言工程系
-
出处
《计算机科学》
CSCD
北大核心
2016年第5期188-192,208,共6页
-
基金
国家自然科学基金项目(61170189,61370126)
高等学校博士学科点专项科研基金(20111102130003)
软件开发环境国家重点实验室自选课题(SKLSDE-2013ZX-19)资助
-
文摘
句子相关性计算在自然语言处理的多个实践应用中均具有十分重要的作用,如舆情监测、信息检索、统计机器翻译等。在明确相似性与相关性之间的关系之后,设计了一种基于领域语料驱动的句子相关性计算方法,该方法基于同一领域的语料构建一个"句-段-篇"3层的领域语义空间,通过度量词语在各个层级间的共现概率、共现平均距离和句长等因子来测量词间的主题相关性。与基于字面特征、HowNet和同义词词林的方法进行了实验对比,结果表明该方法具有较好的实践应用价值。
-
关键词
句子相关度
语料驱动
主题相关性
计算模型
-
Keywords
Sentence relevance
Corpus driven
Topic relevance
Calculation model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名使用关键词扩展的新闻文本自动摘要方法
被引量:14
- 3
-
-
作者
李峰
黄金柱
李舟军
杨伟铭
-
机构
北京航空航天大学计算机学院
中国人民解放军后勤科学研究所
中国人民解放军外国语学院语言工程系
-
出处
《计算机科学与探索》
CSCD
北大核心
2016年第3期372-380,共9页
-
基金
国家自然科学基金Nos.61170189
61370126
+2 种基金
61202239
国家高技术研究发展计划(863计划)No.2015AA016004
软件开发环境国家重点实验室探索性自主研究课题基金No.SKLSDE-2015ZX-16~~
-
文摘
提出了使用关键词扩展的新闻文本自动摘要方法。该方法从大规模的语料中提取与输入文档相近主题的文本组成背景语料,并基于背景语料进行关键词的扩展,强化关键词对文摘句的指示作用,从而提高新闻文本摘要抽取质量。研究和实验表明,该方法在Rouge-1,Rouge-2评测中取得了优于基于关键词、基于TextRank和基于Manifold Ranking方法的结果。在研究中组织制定了100篇新闻文本的4份中文新闻文本标准评价集,研制了基于关键词扩展的中文新闻文本自动摘要系统,开发了面向中文的基于ROUGE原理的新闻文本摘要结果自动评测系统,初步实现了从理论到实践的转化。
-
关键词
扩展
相近文本
自动摘要
图算法
系统实现
-
Keywords
keyword expansion
similar topic text
automatic summarization
graph algorithm
system implementation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于无干扰理论的信任链传递模型
被引量:4
- 4
-
-
作者
陈亮
曾荣仁
李峰
杨伟铭
-
机构
中国人民解放军后勤科学研究所
北京航空航天大学
-
出处
《计算机科学》
CSCD
北大核心
2016年第10期141-144,181,共5页
-
文摘
针对现有的信任链传递模型可用性不强、缺乏将信任链扩展到网络环境的缺点,提出了一种新的基于无干扰理论的信任链传递模型。该模型将系统抽象为进程、动作和执行,从可信根出发,通过度量程序及其动态库完整性来保证进程静态可信;分析交互进程之间的关系,利用无干扰理论判定其合法性;通过对接入终端的可信度量,将信任链扩展到整个网络系统。最后给出了相应的形式化定义及安全性证明。
-
关键词
无干扰理论
进程可信
系统运行可信
安全接入可信
-
Keywords
Non-interference theory,Process credible,System operation credible,Secure access credible
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名VDEA词典的构建及其在情感倾向性分析中的应用
被引量:1
- 5
-
-
作者
黄金柱
李峰
张克亮
-
机构
中国人民解放军外国语学院语言工程系
北京航空航天大学软件开发环境国家重点实验室
中国人民解放军后勤科学研究所
-
出处
《计算机科学》
CSCD
北大核心
2016年第S1期430-434,共5页
-
文摘
配价语法主要以谓词为中心研究句子的深层语义结构,重点描述动词和形容词与搭配成分间的依存关系,是解决语义分析处理这个颈瓶问题的利器。以英语形容词为主体,构建了包含相关配价信息的形容词配价词典,词典包含3170个英语形容词的配价关系、格关系、释义、褒贬义、语义分类、语义特征和相关例句等信息。此外,基于该词典设计了词汇情感倾向性分析模型,取得了很好的实验结果。
-
关键词
配价语法
形容词
知识库
情感倾向性
-
Keywords
Valency grammar
Adjective
Knowledge base
Sentimental orientation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-