期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种面向多文本集的部分比较性LDA模型
被引量:
5
1
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1943-1953,共11页
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparati...
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
展开更多
关键词
比较性文本挖掘
部分
比较性
部分
比较性
跨
文本
集LDA模型
话题模型
GIBBS抽样
在线阅读
下载PDF
职称材料
一种面向多文本集的部分比较性混合模型
被引量:
2
2
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第11期101-107,共7页
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化...
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.
展开更多
关键词
概率分布
比较性文本挖掘
部分可比性
PCCMix模型
混合模型
在线阅读
下载PDF
职称材料
一种面向涌现的比较性话题模型
被引量:
2
3
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2013年第4期146-155,共10页
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进...
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
展开更多
关键词
比较性文本挖掘
涌现
话题模型
CDCMLDA模型
在线阅读
下载PDF
职称材料
题名
一种面向多文本集的部分比较性LDA模型
被引量:
5
1
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科学技术大学信息系统工程重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1943-1953,共11页
基金
国家自然科学基金项目(60903225)
湖南省自然科学基金项目(11JJ5044)
国防科学技术大学优秀研究生创新基金项目(S100502)
文摘
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
关键词
比较性文本挖掘
部分
比较性
部分
比较性
跨
文本
集LDA模型
话题模型
GIBBS抽样
Keywords
comparative text mining~ partial comparative~ partial comparative cross collections LDAmodel (PCCLDA) ~ topic model~ Gibbs sampling
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种面向多文本集的部分比较性混合模型
被引量:
2
2
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科学技术大学信息系统工程重点实验室
出处
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第11期101-107,共7页
基金
国家自然科学基金资助项目(60903225)
湖南省自然科学基金资助项目(11JJ5044)
国防科学技术大学优秀研究生创新基金资助项目(S100502)
文摘
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.
关键词
概率分布
比较性文本挖掘
部分可比性
PCCMix模型
混合模型
Keywords
probability distributions
comparative text mining
partial comparative
PCCMix(Partial comparative Cross Collections Mixture)model
mixture model
分类号
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种面向涌现的比较性话题模型
被引量:
2
3
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科技大学信息系统工程重点实验室
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2013年第4期146-155,共10页
基金
国家自然科学基金资助项目(60903225)
湖南省自然科学基金项目(11JJ5044)
国防科技大学优秀研究生创新基金项目(S100502)
文摘
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
关键词
比较性文本挖掘
涌现
话题模型
CDCMLDA模型
Keywords
comparative text mining
burstiness
topic model
CDCMLDA model
分类号
O212.6 [理学—概率论与数理统计]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种面向多文本集的部分比较性LDA模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《计算机研究与发展》
EI
CSCD
北大核心
2013
5
在线阅读
下载PDF
职称材料
2
一种面向多文本集的部分比较性混合模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013
2
在线阅读
下载PDF
职称材料
3
一种面向涌现的比较性话题模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2013
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部