期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于主题区域发现的中文自动文摘研究 被引量:5
1
作者 胡珀 何婷婷 姬东鸿 《计算机科学》 CSCD 北大核心 2005年第1期177-181,共5页
自动文摘是自然语言处理领域的一项重要的研究课题。文中提出了一种基于主题区域发现的中文自动文摘的方法。该方法的特色在于:产生的文摘能在尽可能全面地覆盖全文多个主题的同时,显著地缩减自身的冗余,从而能有效地平衡两者之间的矛... 自动文摘是自然语言处理领域的一项重要的研究课题。文中提出了一种基于主题区域发现的中文自动文摘的方法。该方法的特色在于:产生的文摘能在尽可能全面地覆盖全文多个主题的同时,显著地缩减自身的冗余,从而能有效地平衡两者之间的矛盾。通过采用K-medoids的聚类算法联同新的自定义目标函数的聚类分析方法,实现了段落自适应聚类下的文本潜在主题区域的发现及其在自动文摘领域的应用。此外,一种基于表达熵的新的评价因子被用来评价摘要的冗余。实验结果验证了该方法的可行性,有效性,是对中文自动文摘研究的一种有意义的探索。 展开更多
关键词 主题区域发现 中文自动文摘 聚类分析 表达熵 文本检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部