检索结果-维普期刊中文期刊服务平台

基于连续段落相似度的主题划分算法被引量：10: 1; 作者傅间莲陈群秀《计算机应用》 CSCD 北大核心 2005年第9期2022-2024,共3页; 主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题。文中提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平... 展开更多; 关键词自动文摘向量空间模型段落相似度主题划分; 在线阅读下载PDF 职称材料

基于加权二部图匹配的中文段落相似度计算被引量：4: 2; 作者张绍阳曹家波 +1 位作者王子凡曲卫东《计算机工程与应用》 CSCD 北大核心 2017年第18期95-101,共7页; 为了改进传统以向量空间模型(VSM)为代表的基于词频统计的方法在中文段落相似度计算时存在的精度不高问题,在基于加权二部图匹配的思想上提出了一种计算中文段落之间相似度的方法。该方法将相似度计算分为段落和句子两个层次,将句子作... 展开更多; 关键词段落相似度句子主干提取二部图匹配向量空间模型中文分词; 在线阅读下载PDF 职称材料

基于累积Logistic回归分析的文本段落聚类策略研究被引量：1: 3; 作者徐永东徐志明王晓龙《高技术通讯》 CAS CSCD 北大核心 2006年第8期789-794,共6页; 提出一种新的文本段落聚类策略，该策略采用多特征融合思想尽可能多地挖掘段落内的特征，并采用累积Logistic回归分析方法来拟合这些特征与段落相似度之间的内在关联，使得段落相似度计算的结果更为理想。最后采用层次聚合聚类算法中的c... 展开更多; 关键词多特征融合累积Logistic回归分析段落相似度计算段落聚类; 在线阅读下载PDF 职称材料

自动文摘系统中的主题划分问题研究被引量：13: 4; 作者傅间莲陈群秀《中文信息学报》 CSCD 北大核心 2005年第6期28-35,共8页; 随着网络的发展,电子文本大量涌现,自动文摘以迅速、快捷、有效、客观等手工文摘无可比拟的优势,使得其实用价值得到充分体现。而主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题。本文提出了一个通过建立段落向量空... 展开更多; 关键词计算机应用中文信息处理自动文摘向量空间模型段落相似度主题划分; 在线阅读下载PDF 职称材料

面向自动文摘的文本结构划分被引量：2: 5; 作者朱荷香曲维光 +2 位作者卢俊之李素建邵艳秋《南京大学学报（自然科学版）》 CAS CSCD 北大核心 2008年第2期204-211,共8页; 文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,... 展开更多; 关键词文本结构自动文摘向量空间模型段落相似度意义段划分; 在线阅读下载PDF 职称材料

题名基于连续段落相似度的主题划分算法被引量：10: 1; 作者傅间莲陈群秀; 机构清华大学计算机科学与技术系智能技术与系统国家重点实验室; 出处《计算机应用》 CSCD 北大核心 2005年第9期2022-2024,共3页; 文摘主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题。文中提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平衡性。实验结果表明,该算法对多主题文章的主题划分准确率为92.4%,对单主题文章的主题划分准确率为99.1%。; 关键词自动文摘向量空间模型段落相似度主题划分; Keywords automatic abstraction VSM paragraphic similarity topic partition; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于加权二部图匹配的中文段落相似度计算被引量：4: 2; 作者张绍阳曹家波王子凡曲卫东; 机构长安大学信息工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2017年第18期95-101,共7页; 基金交通运输部科技项目(No.2012-364-223-500) 工业科技攻关-工业科技攻关(No.2016GY-137); 文摘为了改进传统以向量空间模型(VSM)为代表的基于词频统计的方法在中文段落相似度计算时存在的精度不高问题,在基于加权二部图匹配的思想上提出了一种计算中文段落之间相似度的方法。该方法将相似度计算分为段落和句子两个层次,将句子作为简单段落看待,也使用二部图匹配进行相似度计算。首先利用句子主干词汇提取算法来提取句子的主干词汇,将主干词汇作为二部图的顶点,把主干词汇之间的相似度作为二部图顶点之间的权值系数,进行句子相似度的计算。其次,将句子作为加权二部图的顶点,把句子之间的相似度作为二部图顶点之间的权值系数,进行段落之间的相似度计算。实验结果表明,该方法与VSM相比,由于它能准确识别同义词,自动匹配两个在段落中不同位置的相似词语,因而在准确度上有了很大的提高。; 关键词段落相似度句子主干提取二部图匹配向量空间模型中文分词; Keywords paragraph similarity sentence keywords bipartite graph match vector space model participle; 分类号 TP301 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名基于累积Logistic回归分析的文本段落聚类策略研究被引量：1: 3; 作者徐永东徐志明王晓龙; 机构哈尔滨工业大学计算机学院自然语言处理研究室; 出处《高技术通讯》 CAS CSCD 北大核心 2006年第8期789-794,共6页; 基金 863计划（2002AA117010-09）和国家自然科学基金（60435020）资助项目.; 文摘提出一种新的文本段落聚类策略，该策略采用多特征融合思想尽可能多地挖掘段落内的特征，并采用累积Logistic回归分析方法来拟合这些特征与段落相似度之间的内在关联，使得段落相似度计算的结果更为理想。最后采用层次聚合聚类算法中的complete—link方法对段落集合进行聚类处理：通过网络真实文本进行了段落相似度度量实验和段落聚类实验，实验结果显示了方法的可行性。; 关键词多特征融合累积Logistic回归分析段落相似度计算段落聚类; Keywords multiple features fusion, cumulative Logistic regression analysis, paragraphs similarity computation,paragraphs clustering; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名自动文摘系统中的主题划分问题研究被引量：13: 4; 作者傅间莲陈群秀; 机构清华大学计算机系智能技术与系统国家重点实验室; 出处《中文信息学报》 CSCD 北大核心 2005年第6期28-35,共8页; 文摘随着网络的发展,电子文本大量涌现,自动文摘以迅速、快捷、有效、客观等手工文摘无可比拟的优势,使得其实用价值得到充分体现。而主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题。本文提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平衡性。实验结果表明,该算法对多主题文章的主题划分准确率为92.2%,对单主题文章的主题划分准确率为99.1%。; 关键词计算机应用中文信息处理自动文摘向量空间模型段落相似度主题划分; Keywords computer application Chinese information processing automatic abstraction vector space model paragraphic similarity topic segmentation; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名面向自动文摘的文本结构划分被引量：2: 5; 作者朱荷香曲维光卢俊之李素建邵艳秋; 机构南京师范大学计算机科学系南京师范大学文学院北京大学计算语言研究所; 出处《南京大学学报（自然科学版）》 CAS CSCD 北大核心 2008年第2期204-211,共8页; 基金国家自然科学基金(60773173,60603093) 国家社会科学基金(07BYY050) +2 种基金国家973项目(2004CB318102) 江苏省社会科学基金(06JSBYY001) 国家博士后基金(20060400027); 文摘文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.; 关键词文本结构自动文摘向量空间模型段落相似度意义段划分; Keywords text structure, automatic summarization, vector space model, paragraphic similarity, topic partition; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于连续段落相似度的主题划分算法	傅间莲陈群秀	《计算机应用》 CSCD 北大核心	2005	10	在线阅读下载PDF 职称材料
2	基于加权二部图匹配的中文段落相似度计算	张绍阳曹家波王子凡曲卫东	《计算机工程与应用》 CSCD 北大核心	2017	4	在线阅读下载PDF 职称材料
3	基于累积Logistic回归分析的文本段落聚类策略研究	徐永东徐志明王晓龙	《高技术通讯》 CAS CSCD 北大核心	2006	1	在线阅读下载PDF 职称材料
4	自动文摘系统中的主题划分问题研究	傅间莲陈群秀	《中文信息学报》 CSCD 北大核心	2005	13	在线阅读下载PDF 职称材料
5	面向自动文摘的文本结构划分	朱荷香曲维光卢俊之李素建邵艳秋	《南京大学学报（自然科学版）》 CAS CSCD 北大核心	2008	2	在线阅读下载PDF 职称材料