检索结果-维普期刊中文期刊服务平台

汉语比较句识别研究被引量：16: 1; 作者黄小江万小军 +1 位作者杨建武肖建国《中文信息学报》 CSCD 北大核心 2008年第5期30-38,共9页; 比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一... 展开更多; 关键词计算机应用中文信息处理汉语比较句识别比较挖掘文本分类序列模式; 在线阅读下载PDF 职称材料

一种面向多文本集的部分比较性LDA模型被引量：5: 2; 作者谭文堂王桢文 +2 位作者殷风景葛斌肖卫东《计算机研究与发展》 EI CSCD 北大核心 2013年第9期1943-1953,共11页; 跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparati... 展开更多; 关键词比较性文本挖掘部分比较性部分比较性跨文本集LDA模型话题模型 GIBBS抽样; 在线阅读下载PDF 职称材料

一种面向涌现的比较性话题模型被引量：2: 3; 作者谭文堂王桢文 +2 位作者殷风景葛斌肖卫东《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第4期146-155,共10页; 提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进... 展开更多; 关键词比较性文本挖掘涌现话题模型 CDCMLDA模型; 在线阅读下载PDF 职称材料

一种面向多文本集的部分比较性混合模型被引量：2: 4; 作者谭文堂王桢文 +2 位作者殷风景葛斌肖卫东《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第11期101-107,共7页; 针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化... 展开更多; 关键词概率分布比较性文本挖掘部分可比性 PCCMix模型混合模型; 在线阅读下载PDF 职称材料

题名汉语比较句识别研究被引量：16: 1; 作者黄小江万小军杨建武肖建国; 机构北京大学计算机科学技术研究所; 出处《中文信息学报》 CSCD 北大核心 2008年第5期30-38,共9页; 基金国家863计划资助项目(2008AA01Z421) 国家自然科学基金资助项目(60703064) 教育部高等学校博士点新教师基金资助项目(20070001059); 文摘比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为"比较"和"非比较"两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。; 关键词计算机应用中文信息处理汉语比较句识别比较挖掘文本分类序列模式; Keywords computer application Chinese information processing Chinese comparative sentences identification comparative mining text classification sequential pattern; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名一种面向多文本集的部分比较性LDA模型被引量：5: 2; 作者谭文堂王桢文殷风景葛斌肖卫东; 机构国防科学技术大学信息系统工程重点实验室; 出处《计算机研究与发展》 EI CSCD 北大核心 2013年第9期1943-1953,共11页; 基金国家自然科学基金项目(60903225) 湖南省自然科学基金项目(11JJ5044) 国防科学技术大学优秀研究生创新基金项目(S100502); 文摘跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.; 关键词比较性文本挖掘部分比较性部分比较性跨文本集LDA模型话题模型 GIBBS抽样; Keywords comparative text mining~ partial comparative~ partial comparative cross collections LDAmodel （PCCLDA） ~ topic model~ Gibbs sampling; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名一种面向涌现的比较性话题模型被引量：2: 3; 作者谭文堂王桢文殷风景葛斌肖卫东; 机构国防科技大学信息系统工程重点实验室; 出处《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第4期146-155,共10页; 基金国家自然科学基金资助项目(60903225) 湖南省自然科学基金项目(11JJ5044) 国防科技大学优秀研究生创新基金项目(S100502); 文摘提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。; 关键词比较性文本挖掘涌现话题模型 CDCMLDA模型; Keywords comparative text mining burstiness topic model CDCMLDA model; 分类号 O212.6 [理学—概率论与数理统计]; 在线阅读下载PDF 职称材料

题名一种面向多文本集的部分比较性混合模型被引量：2: 4; 作者谭文堂王桢文殷风景葛斌肖卫东; 机构国防科学技术大学信息系统工程重点实验室; 出处《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第11期101-107,共7页; 基金国家自然科学基金资助项目(60903225) 湖南省自然科学基金资助项目(11JJ5044) 国防科学技术大学优秀研究生创新基金资助项目(S100502); 文摘针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.; 关键词概率分布比较性文本挖掘部分可比性 PCCMix模型混合模型; Keywords probability distributions comparative text mining partial comparative PCCMix（Partial comparative Cross Collections Mixture）model mixture model; 分类号 TP39 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	汉语比较句识别研究	黄小江万小军杨建武肖建国	《中文信息学报》 CSCD 北大核心	2008	16	在线阅读下载PDF 职称材料
2	一种面向多文本集的部分比较性LDA模型	谭文堂王桢文殷风景葛斌肖卫东	《计算机研究与发展》 EI CSCD 北大核心	2013	5	在线阅读下载PDF 职称材料
3	一种面向涌现的比较性话题模型	谭文堂王桢文殷风景葛斌肖卫东	《国防科技大学学报》 EI CAS CSCD 北大核心	2013	2	在线阅读下载PDF 职称材料
4	一种面向多文本集的部分比较性混合模型	谭文堂王桢文殷风景葛斌肖卫东	《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心	2013	2	在线阅读下载PDF 职称材料