-
题名基于混合内容线索特征的语义组块标注研究
被引量:3
- 1
-
-
作者
白如江
冷伏海
廖君华
-
机构
山东理工大学科技信息研究所
中国科学院科技战略咨询研究院
-
出处
《情报学报》
CSSCI
CSCD
北大核心
2017年第4期382-391,共10页
-
基金
国家社会科学基金项目"未来新兴科学研究前沿识别研究"(16BTQ083)
-
文摘
大数据时代背景下,实现科技文献深层语义理解逐渐成为情报学研究的热点话题,本文利用词频统计和共词分析方法分析了科技文献内容浅层语法特征、上下文特征和核心线索词特征,构建了混合内容线索特征集合,采用条件随机场模型,对NSF碳纳米管研究领域项目数据进行了语义组块标注实验。实验结果表明,在B-SUB、I-SUB、B-ACT、I-ACT、B-GOL、I-GOL、B-IMP7种标签标注中,增加混合内容线索特征后的精度值分别达到84.43%、89.09%、84.38%、89.87%、51.33%、50.37%、37.83%,与没有增加的标注结果相比精度值有了明显提升。特别是B-SUB、I-SUB、B-ACT、I-ACT四种标签,在增加了内容线索特征后精度值提升了10%以上。
-
关键词
内容线索特征
条件随机场
语义组块标注
-
Keywords
content clues
conditional random field
semantic chunk annotation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-