期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
汉语比较句识别研究
被引量:
16
1
作者
黄小江
万小军
+1 位作者
杨建武
肖建国
《中文信息学报》
CSCD
北大核心
2008年第5期30-38,共9页
比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一...
比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为"比较"和"非比较"两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。
展开更多
关键词
计算机应用
中文信息处理
汉语
比较
句识别
比较挖掘
文本分类
序列模式
在线阅读
下载PDF
职称材料
一种面向多文本集的部分比较性LDA模型
被引量:
5
2
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1943-1953,共11页
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparati...
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
展开更多
关键词
比较
性文本
挖掘
部分
比较
性
部分
比较
性跨文本集LDA模型
话题模型
GIBBS抽样
在线阅读
下载PDF
职称材料
一种面向涌现的比较性话题模型
被引量:
2
3
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2013年第4期146-155,共10页
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进...
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
展开更多
关键词
比较
性文本
挖掘
涌现
话题模型
CDCMLDA模型
在线阅读
下载PDF
职称材料
一种面向多文本集的部分比较性混合模型
被引量:
2
4
作者
谭文堂
王桢文
+2 位作者
殷风景
葛斌
肖卫东
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第11期101-107,共7页
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化...
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.
展开更多
关键词
概率分布
比较
性文本
挖掘
部分可比性
PCCMix模型
混合模型
在线阅读
下载PDF
职称材料
题名
汉语比较句识别研究
被引量:
16
1
作者
黄小江
万小军
杨建武
肖建国
机构
北京大学计算机科学技术研究所
出处
《中文信息学报》
CSCD
北大核心
2008年第5期30-38,共9页
基金
国家863计划资助项目(2008AA01Z421)
国家自然科学基金资助项目(60703064)
教育部高等学校博士点新教师基金资助项目(20070001059)
文摘
比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为"比较"和"非比较"两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。
关键词
计算机应用
中文信息处理
汉语
比较
句识别
比较挖掘
文本分类
序列模式
Keywords
computer application
Chinese information processing
Chinese comparative sentences identification
comparative mining
text classification
sequential pattern
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种面向多文本集的部分比较性LDA模型
被引量:
5
2
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科学技术大学信息系统工程重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第9期1943-1953,共11页
基金
国家自然科学基金项目(60903225)
湖南省自然科学基金项目(11JJ5044)
国防科学技术大学优秀研究生创新基金项目(S100502)
文摘
跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
关键词
比较
性文本
挖掘
部分
比较
性
部分
比较
性跨文本集LDA模型
话题模型
GIBBS抽样
Keywords
comparative text mining~ partial comparative~ partial comparative cross collections LDAmodel (PCCLDA) ~ topic model~ Gibbs sampling
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
一种面向涌现的比较性话题模型
被引量:
2
3
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科技大学信息系统工程重点实验室
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2013年第4期146-155,共10页
基金
国家自然科学基金资助项目(60903225)
湖南省自然科学基金项目(11JJ5044)
国防科技大学优秀研究生创新基金项目(S100502)
文摘
提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
关键词
比较
性文本
挖掘
涌现
话题模型
CDCMLDA模型
Keywords
comparative text mining
burstiness
topic model
CDCMLDA model
分类号
O212.6 [理学—概率论与数理统计]
在线阅读
下载PDF
职称材料
题名
一种面向多文本集的部分比较性混合模型
被引量:
2
4
作者
谭文堂
王桢文
殷风景
葛斌
肖卫东
机构
国防科学技术大学信息系统工程重点实验室
出处
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第11期101-107,共7页
基金
国家自然科学基金资助项目(60903225)
湖南省自然科学基金资助项目(11JJ5044)
国防科学技术大学优秀研究生创新基金资助项目(S100502)
文摘
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.
关键词
概率分布
比较
性文本
挖掘
部分可比性
PCCMix模型
混合模型
Keywords
probability distributions
comparative text mining
partial comparative
PCCMix(Partial comparative Cross Collections Mixture)model
mixture model
分类号
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
汉语比较句识别研究
黄小江
万小军
杨建武
肖建国
《中文信息学报》
CSCD
北大核心
2008
16
在线阅读
下载PDF
职称材料
2
一种面向多文本集的部分比较性LDA模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《计算机研究与发展》
EI
CSCD
北大核心
2013
5
在线阅读
下载PDF
职称材料
3
一种面向涌现的比较性话题模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2013
2
在线阅读
下载PDF
职称材料
4
一种面向多文本集的部分比较性混合模型
谭文堂
王桢文
殷风景
葛斌
肖卫东
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部