期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
利用词汇分布相似度的中文词汇语义倾向性计算 被引量:1
1
作者 赵煜 蔡皖东 +1 位作者 樊娜 李慧贤 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第6期33-37,共5页
针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowN... 针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义倾向性计算系统进行比较,结果是所提方法的准确率达到了80%,表明在提高中文词汇语义倾向性计算的准确性方面是可行、有效的. 展开更多
关键词 中文信息处理 词汇分布相似 语义倾向 依存句法分析 知网
在线阅读 下载PDF
属性分布相似度吸引子传播聚类算法研究
2
作者 王依章 王丽敏 韩旭明 《长春工业大学学报》 CAS 2014年第3期271-274,共4页
传统吸引子传播聚类算法对数据类型敏感,文中提出一种改进的吸引子传播聚类算法,将JACCARD系数引入对象间属性分布相似度,并与吸引子传播聚类算法结合。仿真实验结果表明,该算法收敛速度快,聚类精度高,明显提高高维稀疏数据的聚类性能。
关键词 吸引子传播聚类算法 JACCARD系数 属性分布相似
在线阅读 下载PDF
一种面向医学短文本的自适应聚类方法 被引量:3
3
作者 栗伟 许洪涛 +1 位作者 赵大哲 刘积仁 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第1期19-23,共5页
针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后... 针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后采用基于序列模式的中心概念提取算法实现了疾病命名的标准化,同时对聚类簇进行合并和优化,进一步提升了聚类的准确性.测试结果表明,所述方法具有较高的准确率和聚类效率,在病历文本的预处理、分类和分析中具有广泛意义. 展开更多
关键词 聚类分析 相似 频繁序列模式 电子病历 相似度分布
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部