-
题名基于图卷积网络的重大事件趋势预测
被引量:1
- 1
-
-
作者
耿小航
彭冬亮
张震
谷雨
-
机构
杭州电子科技大学通信信息传输与融合技术国防重点学科实验室
-
出处
《计算机工程与设计》
北大核心
2021年第11期3196-3203,共8页
-
基金
国家自然科学基金项目(61771177)。
-
文摘
针对基于公开新闻数据的重大事件趋势预测研究在文本特征提取上语义理解不足问题,提出基于图卷积网络的重大事件趋势预测方法。利用结构化事件信息构建以事件为中心的语义关联图;按时间片粒度分割出局部事件语义关联图,利用预训练词向量对节点文本初始化特征表示;将带有节点特征的局部事件语义关联图输入图卷积网络,聚合节点邻域信息计算图特征表示并输入到分类器,训练预测模型并输出预测结果。以朝鲜核行为趋势预测问题验证所提出方法的有效性,对测试集(2017年3月~2018年3月)预测准确率达到76.92%,全时间段预测准确率为89.58%。预测结果表明,该方法增强了对文本的语义理解,预测精度优于基于专家知识构建特征的方法。
-
关键词
重大事件
趋势预测
图卷积网络
事件语义关联图
结构化事件数据
-
Keywords
major event
trend prediction
graph convolution network
event semantic association graph
structured event data
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名融合单词贡献度与Word2Vec词向量的文档表示
被引量:17
- 2
-
-
作者
彭俊利
谷雨
张震
耿小航
-
机构
杭州电子科技大学通信信息传输与融合技术国防重点学科实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第4期62-67,共6页
-
基金
国家自然科学基金(61673146)。
-
文摘
针对现有文档向量表示方法受噪声词语影响和重要词语语义不完整的问题,通过融合单词贡献度与Word2Vec词向量提出一种新的文档表示方法。应用数据集训练Word2Vec模型,计算数据集中词语的贡献度,同时设置贡献度阈值,提取贡献度大于该阈值的单词构建单词集合。在此基础上,寻找文档与集合中共同存在的单词,获取其词向量并融合单词贡献度生成文档向量。实验结果表明,该方法在搜狗中文文本语料库和复旦大学中文文本分类语料库上分类的平均准确率、召回率和F1值均优于TF-IDF、均值Word2Vec、PTF-IDF加权Word2Vec模型等传统方法,同时其对英文文本也能进行有效分类。
-
关键词
单词贡献度
Word2Vec词向量
词嵌入
文档表示
文本分类
-
Keywords
Term Contribution(TC)
Word2Vec word vector
word embedding
document representation
text classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-