期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于领域类别信息C-value的多词串自动抽取
被引量:
7
1
作者
李超
王会珍
+2 位作者
朱慕华
张俐
朱靖波
《中文信息学报》
CSCD
北大核心
2010年第1期94-98,共5页
该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价...
该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价多词串的准确率,在top-100级别上,较传统的C-value方法在三个领域中分别提高了12、12和13个百分点。实验结果验证了方法的有效性。
展开更多
关键词
计算机应用
中文信息处理
多词串抽取
多类别
c-value
领域信息
在线阅读
下载PDF
职称材料
基于C-value与TF-IDF的文献簇主题识别研究
被引量:
11
2
作者
陈仕吉
王小梅
《情报学报》
CSSCI
北大核心
2009年第6期821-826,共6页
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此...
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征。本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法。实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别。
展开更多
关键词
c-value
TF-IDF
CV-IDF
引文分析
主题识别
在线阅读
下载PDF
职称材料
基于关键名词短语聚类的中文搜索结果聚类
被引量:
1
3
作者
麻雪云
肖诗斌
+1 位作者
王弘蔚
施水才
《计算机工程与应用》
CSCD
北大核心
2009年第31期118-121,共4页
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,...
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。
展开更多
关键词
搜索结果聚类
关键名词短语抽取
c-value
算法
CHAMELEON算法
在线阅读
下载PDF
职称材料
基于短语的统计机器翻译中短语表的过滤
被引量:
1
4
作者
狄萍
周宥良
+1 位作者
贡正仙
周国栋
《计算机应用与软件》
CSCD
2011年第5期28-30,41,共4页
大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的...
大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的情况下,短语表可以缩减为原来的78%。并且当短语表缩减为原来的47.5%时,BLEU评价仍提高了0.0158。
展开更多
关键词
统计机器翻译
短语表过滤
c-value
短语粘结度
在线阅读
下载PDF
职称材料
基于音节划分及短语表优化的英汉人名音译研究
被引量:
1
5
作者
王丹丹
黄德根
高扬
《中文信息学报》
CSCD
北大核心
2016年第3期96-102,共7页
把英汉人名音译问题转换为以音节为基本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有音节划分方法存在的问题,提出一种改进的音节划分方法;其次,该文提出去除低频...
把英汉人名音译问题转换为以音节为基本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有音节划分方法存在的问题,提出一种改进的音节划分方法;其次,该文提出去除低频词法及基于C-value方法对短语表进行优化,解决了训练语料偏小导致短语表中出现杂质信息的问题;之后,融入了汉语人名中首字(词)及尾字(词)的位置特征,改善了生成的音译候选中汉字选取的不合理性;最后,提出了两阶段音节划分方法,缓解了音节划分粒度过大导致的音译错误。与基准方法相比,其音译准确率ACC由63.78%提高到67.56%。
展开更多
关键词
英汉人名音译
音节划分
短语表优化
c-value
在线阅读
下载PDF
职称材料
基于排序集成的哈萨克语固定短语抽取
6
作者
桑海岩
古丽拉·阿东别克
+1 位作者
孙瑞娜
陈莉
《计算机工程与应用》
CSCD
2014年第21期205-209,223,共6页
短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富...
短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富,这些特点给哈语固定短语的抽取带来了一定的困难。提出一个总体的固定短语抽取算法,把固定短语抽取看作一个排序问题,使用C-value、互信息和log-likelihood进行抽取排序,并设计了一个新的排序集成方法对抽取的结果进行集成。实验分析结果表明,与单独的抽取算法比较,该算法达到了更高的准确率。
展开更多
关键词
自然语言处理
固定短语
排序集成
互信息
似然比
c-value
算法
在线阅读
下载PDF
职称材料
题名
基于领域类别信息C-value的多词串自动抽取
被引量:
7
1
作者
李超
王会珍
朱慕华
张俐
朱靖波
机构
东北大学自然语言处理实验室
出处
《中文信息学报》
CSCD
北大核心
2010年第1期94-98,共5页
基金
国家自然科学基金资助项目(60873091)
辽宁省自然科学基金资助项目(20072032)
沈阳市科学技术计划资助项目(1081235-1-00)
文摘
该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价多词串的准确率,在top-100级别上,较传统的C-value方法在三个领域中分别提高了12、12和13个百分点。实验结果验证了方法的有效性。
关键词
计算机应用
中文信息处理
多词串抽取
多类别
c-value
领域信息
Keywords
computer application
Chinese information processing
multi-word terms extractionl Multi-Class C- value
domain information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于C-value与TF-IDF的文献簇主题识别研究
被引量:
11
2
作者
陈仕吉
王小梅
机构
中国农业大学图书馆
中国科学院国家科学图书馆
中国科学院研究生院
出处
《情报学报》
CSSCI
北大核心
2009年第6期821-826,共6页
文摘
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征。本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法。实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别。
关键词
c-value
TF-IDF
CV-IDF
引文分析
主题识别
Keywords
c-value
TF-IDF
CV-IDF
citation analysis
topic recognization
分类号
G350 [文化科学—情报学]
O159 [理学—基础数学]
在线阅读
下载PDF
职称材料
题名
基于关键名词短语聚类的中文搜索结果聚类
被引量:
1
3
作者
麻雪云
肖诗斌
王弘蔚
施水才
机构
北京信息科技大学中文信息处理研究中心
北京拓尔思信息技术股份有限公司
出处
《计算机工程与应用》
CSCD
北大核心
2009年第31期118-121,共4页
基金
国家高技术研究发展计划(863)No.2006AA010105
国家自然科学基金No.60772081
+2 种基金
北京市属市管高校人才强教计划项目(No.PXM2007_014224_044677
No.PXM2007_014224_044676)
北京市教委科技发展计划项目(No.KM200710772010)~~
文摘
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。
关键词
搜索结果聚类
关键名词短语抽取
c-value
算法
CHAMELEON算法
Keywords
search result clustering
key noun phrase extraction
c-value
algorithm
Chameleon algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于短语的统计机器翻译中短语表的过滤
被引量:
1
4
作者
狄萍
周宥良
贡正仙
周国栋
机构
苏州大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
2011年第5期28-30,41,共4页
基金
国家自然科学基金项目(60673041)
文摘
大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的情况下,短语表可以缩减为原来的78%。并且当短语表缩减为原来的47.5%时,BLEU评价仍提高了0.0158。
关键词
统计机器翻译
短语表过滤
c-value
短语粘结度
Keywords
Statistical machine translation Phrase table filtration
c-value
Phrase cohesion value
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于音节划分及短语表优化的英汉人名音译研究
被引量:
1
5
作者
王丹丹
黄德根
高扬
机构
大连理工大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2016年第3期96-102,共7页
基金
国家自然科学基金(61173100
61173101
+1 种基金
61272375)
福建省自然科学基金(2014J01218)
文摘
把英汉人名音译问题转换为以音节为基本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有音节划分方法存在的问题,提出一种改进的音节划分方法;其次,该文提出去除低频词法及基于C-value方法对短语表进行优化,解决了训练语料偏小导致短语表中出现杂质信息的问题;之后,融入了汉语人名中首字(词)及尾字(词)的位置特征,改善了生成的音译候选中汉字选取的不合理性;最后,提出了两阶段音节划分方法,缓解了音节划分粒度过大导致的音译错误。与基准方法相比,其音译准确率ACC由63.78%提高到67.56%。
关键词
英汉人名音译
音节划分
短语表优化
c-value
Keywords
English-Chinese name transliteration
syllabification
phrase table optimization
c-value
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于排序集成的哈萨克语固定短语抽取
6
作者
桑海岩
古丽拉·阿东别克
孙瑞娜
陈莉
机构
新疆大学信息科学与工程学院
国家语言资源监测与研究中心少数民族语言中心哈萨克和柯尔克孜语文基地
新疆财经大学统计信息学院
出处
《计算机工程与应用》
CSCD
2014年第21期205-209,223,共6页
基金
国家自然科学基金(No.61063025)
新疆多语种信息技术重点实验室开放项目(No.049807)
文摘
短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富,这些特点给哈语固定短语的抽取带来了一定的困难。提出一个总体的固定短语抽取算法,把固定短语抽取看作一个排序问题,使用C-value、互信息和log-likelihood进行抽取排序,并设计了一个新的排序集成方法对抽取的结果进行集成。实验分析结果表明,与单独的抽取算法比较,该算法达到了更高的准确率。
关键词
自然语言处理
固定短语
排序集成
互信息
似然比
c-value
算法
Keywords
natural language processing
fixed phrases
rank aggregation
mutual information
log-likelihood
c-value
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于领域类别信息C-value的多词串自动抽取
李超
王会珍
朱慕华
张俐
朱靖波
《中文信息学报》
CSCD
北大核心
2010
7
在线阅读
下载PDF
职称材料
2
基于C-value与TF-IDF的文献簇主题识别研究
陈仕吉
王小梅
《情报学报》
CSSCI
北大核心
2009
11
在线阅读
下载PDF
职称材料
3
基于关键名词短语聚类的中文搜索结果聚类
麻雪云
肖诗斌
王弘蔚
施水才
《计算机工程与应用》
CSCD
北大核心
2009
1
在线阅读
下载PDF
职称材料
4
基于短语的统计机器翻译中短语表的过滤
狄萍
周宥良
贡正仙
周国栋
《计算机应用与软件》
CSCD
2011
1
在线阅读
下载PDF
职称材料
5
基于音节划分及短语表优化的英汉人名音译研究
王丹丹
黄德根
高扬
《中文信息学报》
CSCD
北大核心
2016
1
在线阅读
下载PDF
职称材料
6
基于排序集成的哈萨克语固定短语抽取
桑海岩
古丽拉·阿东别克
孙瑞娜
陈莉
《计算机工程与应用》
CSCD
2014
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部