-
题名基于词语对狄利克雷过程的时序摘要
被引量:3
- 1
-
-
作者
席耀一
李弼程
李天彩
黄山奇
-
机构
解放军信息工程大学信息系统工程学院
[
-
出处
《自动化学报》
EI
CSCD
北大核心
2015年第8期1452-1460,共9页
-
基金
国家社会科学基金(14BXW028)资助~~
-
文摘
是按照时间顺序生成摘要,对话题的演化发展进行概括.已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息.针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法.首先通过模型推理得到句子的子话题分布;然后利用该分布计算句子的相关度和新颖度;最后按时间顺序抽取与话题相关且新颖度高的句子组成时序摘要.实验结果表明,本文方法较目前的代表性研究方法生成了更高质量的时序摘要.
-
关键词
时序摘要
狄利克雷过程
词语对
主题模型
-
Keywords
Temporal summarization, Dirichlet process, biterm, topic model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名融合传播影响力的热点事件时序摘要研究
被引量:1
- 2
-
-
作者
罗芳
汪竞航
张宇恒
何道森
蒲秋梅
-
机构
武汉理工大学计算机科学与技术学院
香港恒生大学供应链及资讯管理系
中央民族大学信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2021年第7期98-108,共11页
-
基金
教育部人文社会科学研究规划基金(18YJAZH087)
武汉理工大学自主创新研究基金(3120600100)。
-
文摘
为了从海量的热点事件社交媒体文本流中提取时序摘要,辅助用户快速获取热点事件的演化发展概况,该文在分析热点事件发展阶段的基础上,充分挖掘社交文本的时间特征和传播特征,提出了融合社交传播影响力的热点事件时序摘要方法。该方法抽取的摘要能完整反映事件发展演化过程,内容描述更合乎客观事实,同时在一定程度上解决了社交文本非结构化问题对文本句子权重度量造成的不利影响。实验结果显示,当时间与传播特征权重比值达到0.4时,该方法得到的摘要结果的ROUGE评测值达到最佳,ROUGE-1最优达到44.23%,ROUGE-2最优达到34.78%,ROUGE-S4最优达到27.86%。实验结果表明,基于时间线的文本组织能有效追踪事件发展演化过程,融入时序信息和传播影响力后的时序摘要更能提升热点事件概况的新颖度和相关度。
-
关键词
热点事件
时序摘要
演化阶段
时序特征
传播影响力
-
Keywords
hot events
temporal summarization
evolution stage
time-series feature
social influence
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合语境分析的时序推特摘要方法
被引量:3
- 3
-
-
作者
于广川
贺瑞芳
刘洋
党建武
-
机构
天津大学计算机科学与技术学院
天津市认知计算与应用重点实验室
北京大学信息科学技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2017年第10期2654-2673,共20页
-
基金
国家重点基础研究发展计划(973)(2013CB329301)
国家自然科学基金(61472277)~~
-
文摘
任务中的一个重要分支,旨在从热点事件相关的海量推特流中总结出随时间演化的简要推特集,以帮助用户快速获取信息.推特作为当今最流行的社交媒体平台,其信息量爆发式的增长以及文本碎片的非结构性,使得单纯依赖文本内容的传统摘要方法不再适用.与此同时,社交媒体的新特性也为推特摘要带来了新的机遇.将推特流视作信号,剖析了其中的复杂噪声,提出融合推特流随时序变化的宏微观信号以及用户社交上下文语境信息的时序推特摘要新方法.首先,通过小波分析对推特流全局时序信息建模,实现某一关键词相关的热点子事件时间点检测;接着,融入推特流局部时序信息和用户社交信息建立推特的随机步图模型摘要框架,为每个热点子事件生成推特摘要.在算法评估过程中,对真实推特数据集进行了专家时间点和专家摘要的人工标注,实验结果表明了小波分析和融合了时序-社交上下文语境的图模型在时序推特摘要中的有效性.
-
关键词
时序推特摘要
时序特性
用户社交权威性
小波去噪
上下文图模型
-
Keywords
temporal Twitter summarization
temporal context
social user authority
wavelet denoising
context based graph model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-