检索结果-维普期刊中文期刊服务平台

基于领域类别信息C-value的多词串自动抽取被引量：7: 1; 作者李超王会珍 +2 位作者朱慕华张俐朱靖波《中文信息学报》 CSCD 北大核心 2010年第1期94-98,共5页; 该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价... 展开更多; 关键词计算机应用中文信息处理多词串抽取多类别c-value 领域信息; 在线阅读下载PDF 职称材料

基于C-value与TF-IDF的文献簇主题识别研究被引量：11: 2; 作者陈仕吉王小梅《情报学报》 CSSCI 北大核心 2009年第6期821-826,共6页; 引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此... 展开更多; 关键词 c-value TF-IDF CV-IDF 引文分析主题识别; 在线阅读下载PDF 职称材料

基于关键名词短语聚类的中文搜索结果聚类被引量：1: 3; 作者麻雪云肖诗斌 +1 位作者王弘蔚施水才《计算机工程与应用》 CSCD 北大核心 2009年第31期118-121,共4页; 目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,... 展开更多; 关键词搜索结果聚类关键名词短语抽取 c-value算法 CHAMELEON算法; 在线阅读下载PDF 职称材料

基于短语的统计机器翻译中短语表的过滤被引量：1: 4; 作者狄萍周宥良 +1 位作者贡正仙周国栋《计算机应用与软件》 CSCD 2011年第5期28-30,41,共4页; 大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的... 展开更多; 关键词统计机器翻译短语表过滤 c-value 短语粘结度; 在线阅读下载PDF 职称材料

基于音节划分及短语表优化的英汉人名音译研究被引量：1: 5; 作者王丹丹黄德根高扬《中文信息学报》 CSCD 北大核心 2016年第3期96-102,共7页; 把英汉人名音译问题转换为以音节为基本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有音节划分方法存在的问题,提出一种改进的音节划分方法;其次,该文提出去除低频... 展开更多; 关键词英汉人名音译音节划分短语表优化 c-value; 在线阅读下载PDF 职称材料

基于排序集成的哈萨克语固定短语抽取: 6; 作者桑海岩古丽拉·阿东别克 +1 位作者孙瑞娜陈莉《计算机工程与应用》 CSCD 2014年第21期205-209,223,共6页; 短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富... 展开更多; 关键词自然语言处理固定短语排序集成互信息似然比 c-value算法; 在线阅读下载PDF 职称材料

题名基于领域类别信息C-value的多词串自动抽取被引量：7: 1; 作者李超王会珍朱慕华张俐朱靖波; 机构东北大学自然语言处理实验室; 出处《中文信息学报》 CSCD 北大核心 2010年第1期94-98,共5页; 基金国家自然科学基金资助项目(60873091) 辽宁省自然科学基金资助项目(20072032) 沈阳市科学技术计划资助项目(1081235-1-00); 文摘该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个领域的数据上进行实验,评价多词串的准确率,在top-100级别上,较传统的C-value方法在三个领域中分别提高了12、12和13个百分点。实验结果验证了方法的有效性。; 关键词计算机应用中文信息处理多词串抽取多类别c-value 领域信息; Keywords computer application Chinese information processing multi-word terms extractionl Multi-Class C- value domain information; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于C-value与TF-IDF的文献簇主题识别研究被引量：11: 2; 作者陈仕吉王小梅; 机构中国农业大学图书馆中国科学院国家科学图书馆中国科学院研究生院; 出处《情报学报》 CSSCI 北大核心 2009年第6期821-826,共6页; 文摘引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一。引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征。本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法。实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别。; 关键词 c-value TF-IDF CV-IDF 引文分析主题识别; Keywords c-value TF-IDF CV-IDF citation analysis topic recognization; 分类号 G350 [文化科学—情报学] O159 [理学—基础数学]; 在线阅读下载PDF 职称材料

题名基于关键名词短语聚类的中文搜索结果聚类被引量：1: 3; 作者麻雪云肖诗斌王弘蔚施水才; 机构北京信息科技大学中文信息处理研究中心北京拓尔思信息技术股份有限公司; 出处《计算机工程与应用》 CSCD 北大核心 2009年第31期118-121,共4页; 基金国家高技术研究发展计划(863)No.2006AA010105 国家自然科学基金No.60772081 +2 种基金 No.PXM2007_014224_044676) 北京市教委科技发展计划项目(No.KM200710772010)~~; 文摘目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。; 关键词搜索结果聚类关键名词短语抽取 c-value算法 CHAMELEON算法; Keywords search result clustering key noun phrase extraction c-value algorithm Chameleon algorithm; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于短语的统计机器翻译中短语表的过滤被引量：1: 4; 作者狄萍周宥良贡正仙周国栋; 机构苏州大学计算机科学与技术学院; 出处《计算机应用与软件》 CSCD 2011年第5期28-30,41,共4页; 基金国家自然科学基金项目(60673041); 文摘大多数基于短语的统计机器翻译系统将任意连续的词串看作短语,并没有考虑短语的合理性。使用了C-value以及短语粘结度两种方法,有效地对短语表进行过滤,减小了搜索空间,同时还提高了翻译质量。实验表明,在翻译结果的BLEU评价提高0.02的情况下,短语表可以缩减为原来的78%。并且当短语表缩减为原来的47.5%时,BLEU评价仍提高了0.0158。; 关键词统计机器翻译短语表过滤 c-value 短语粘结度; Keywords Statistical machine translation Phrase table filtration c-value Phrase cohesion value; 分类号 TP391.2 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于音节划分及短语表优化的英汉人名音译研究被引量：1: 5; 作者王丹丹黄德根高扬; 机构大连理工大学计算机科学与技术学院; 出处《中文信息学报》 CSCD 北大核心 2016年第3期96-102,共7页; 基金国家自然科学基金(61173100 61173101 +1 种基金 61272375) 福建省自然科学基金(2014J01218); 文摘把英汉人名音译问题转换为以音节为基本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有音节划分方法存在的问题,提出一种改进的音节划分方法;其次,该文提出去除低频词法及基于C-value方法对短语表进行优化,解决了训练语料偏小导致短语表中出现杂质信息的问题;之后,融入了汉语人名中首字(词)及尾字(词)的位置特征,改善了生成的音译候选中汉字选取的不合理性;最后,提出了两阶段音节划分方法,缓解了音节划分粒度过大导致的音译错误。与基准方法相比,其音译准确率ACC由63.78%提高到67.56%。; 关键词英汉人名音译音节划分短语表优化 c-value; Keywords English-Chinese name transliteration syllabification phrase table optimization c-value; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于排序集成的哈萨克语固定短语抽取: 6; 作者桑海岩古丽拉·阿东别克孙瑞娜陈莉; 机构新疆大学信息科学与工程学院国家语言资源监测与研究中心少数民族语言中心哈萨克和柯尔克孜语文基地新疆财经大学统计信息学院; 出处《计算机工程与应用》 CSCD 2014年第21期205-209,223,共6页; 基金国家自然科学基金(No.61063025) 新疆多语种信息技术重点实验室开放项目(No.049807); 文摘短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富,这些特点给哈语固定短语的抽取带来了一定的困难。提出一个总体的固定短语抽取算法,把固定短语抽取看作一个排序问题,使用C-value、互信息和log-likelihood进行抽取排序,并设计了一个新的排序集成方法对抽取的结果进行集成。实验分析结果表明,与单独的抽取算法比较,该算法达到了更高的准确率。; 关键词自然语言处理固定短语排序集成互信息似然比 c-value算法; Keywords natural language processing fixed phrases rank aggregation mutual information log-likelihood c-value; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于领域类别信息C-value的多词串自动抽取	李超王会珍朱慕华张俐朱靖波	《中文信息学报》 CSCD 北大核心	2010	7	在线阅读下载PDF 职称材料
2	基于C-value与TF-IDF的文献簇主题识别研究	陈仕吉王小梅	《情报学报》 CSSCI 北大核心	2009	11	在线阅读下载PDF 职称材料
3	基于关键名词短语聚类的中文搜索结果聚类	麻雪云肖诗斌王弘蔚施水才	《计算机工程与应用》 CSCD 北大核心	2009	1	在线阅读下载PDF 职称材料
4	基于短语的统计机器翻译中短语表的过滤	狄萍周宥良贡正仙周国栋	《计算机应用与软件》 CSCD	2011	1	在线阅读下载PDF 职称材料
5	基于音节划分及短语表优化的英汉人名音译研究	王丹丹黄德根高扬	《中文信息学报》 CSCD 北大核心	2016	1	在线阅读下载PDF 职称材料
6	基于排序集成的哈萨克语固定短语抽取	桑海岩古丽拉·阿东别克孙瑞娜陈莉	《计算机工程与应用》 CSCD	2014	0	在线阅读下载PDF 职称材料