期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于全局/局部共现词对分布的汉越双语新闻事件线索分析 被引量:1
1
作者 高盛祥 余正涛 +2 位作者 龙文旭 丁硙 闫春婷 《中文信息学报》 CSCD 北大核心 2015年第6期90-97,共8页
针对汉越双语新闻事件线索分析,提出了基于全局/局部共现词对分布的汉越双语事件线索生成方法。该方法首先将新闻话题词语分布作为全局词语表征全局事件,然后用一定时间粒度下新闻片段特有的时间、人物、地点等事件元素作为局部词语,分... 针对汉越双语新闻事件线索分析,提出了基于全局/局部共现词对分布的汉越双语事件线索生成方法。该方法首先将新闻话题词语分布作为全局词语表征全局事件,然后用一定时间粒度下新闻片段特有的时间、人物、地点等事件元素作为局部词语,分析新闻片段中全局词语和局部词语的共现关系,将全局/局部词语的共现规律作为监督信息,结合RCRP算法和汉越双语新闻的对齐语料,构建有监督话题生成主题模型,获得相应时间跨度下代表事件发展进程的子话题分布,通过子话题的分布反映事件发展的线索,从而构建出在线汉越双语事件线索生成模型。实验在汉越混合新闻数据集上进行,事件线索生成对比实验结果证明了提出的方法的有效性。 展开更多
关键词 汉语-越南语 新闻事件线索 全局/局部共现词对 子话题分布 双语主题模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部