期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
利用词汇分布相似度的中文词汇语义倾向性计算
被引量:
1
1
作者
赵煜
蔡皖东
+1 位作者
樊娜
李慧贤
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2009年第6期33-37,共5页
针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowN...
针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义倾向性计算系统进行比较,结果是所提方法的准确率达到了80%,表明在提高中文词汇语义倾向性计算的准确性方面是可行、有效的.
展开更多
关键词
中文信息处理
词汇
分布
相似
度
语义倾向
依存句法分析
知网
在线阅读
下载PDF
职称材料
属性分布相似度吸引子传播聚类算法研究
2
作者
王依章
王丽敏
韩旭明
《长春工业大学学报》
CAS
2014年第3期271-274,共4页
传统吸引子传播聚类算法对数据类型敏感,文中提出一种改进的吸引子传播聚类算法,将JACCARD系数引入对象间属性分布相似度,并与吸引子传播聚类算法结合。仿真实验结果表明,该算法收敛速度快,聚类精度高,明显提高高维稀疏数据的聚类性能。
关键词
吸引子传播聚类算法
JACCARD系数
属性
分布
相似
度
在线阅读
下载PDF
职称材料
一种面向医学短文本的自适应聚类方法
被引量:
3
3
作者
栗伟
许洪涛
+1 位作者
赵大哲
刘积仁
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第1期19-23,共5页
针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后...
针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后采用基于序列模式的中心概念提取算法实现了疾病命名的标准化,同时对聚类簇进行合并和优化,进一步提升了聚类的准确性.测试结果表明,所述方法具有较高的准确率和聚类效率,在病历文本的预处理、分类和分析中具有广泛意义.
展开更多
关键词
聚类分析
相似
性
度
量
频繁序列模式
电子病历
相似度分布
在线阅读
下载PDF
职称材料
题名
利用词汇分布相似度的中文词汇语义倾向性计算
被引量:
1
1
作者
赵煜
蔡皖东
樊娜
李慧贤
机构
西北工业大学计算机学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2009年第6期33-37,共5页
基金
国家自然科学基金资助项目(60803151).
文摘
针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义倾向性计算系统进行比较,结果是所提方法的准确率达到了80%,表明在提高中文词汇语义倾向性计算的准确性方面是可行、有效的.
关键词
中文信息处理
词汇
分布
相似
度
语义倾向
依存句法分析
知网
Keywords
Chinese information processing
distributional similarity
semantic orientation
dependency grammar analysis
HowNet
分类号
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
属性分布相似度吸引子传播聚类算法研究
2
作者
王依章
王丽敏
韩旭明
机构
吉林财经大学管理科学与信息工程学院
长春工业大学软件学院
出处
《长春工业大学学报》
CAS
2014年第3期271-274,共4页
基金
国家自然科学基金资助项目(61202306)
吉林省科技厅基金资助项目(20100507
+4 种基金
201215119
20130522177JH)
吉林省教育厅重点规划项目(2012185)
吉林省高校新世纪优秀人才支持计划项目(2014159)
吉林财经大学青年学俊支持计划项目
文摘
传统吸引子传播聚类算法对数据类型敏感,文中提出一种改进的吸引子传播聚类算法,将JACCARD系数引入对象间属性分布相似度,并与吸引子传播聚类算法结合。仿真实验结果表明,该算法收敛速度快,聚类精度高,明显提高高维稀疏数据的聚类性能。
关键词
吸引子传播聚类算法
JACCARD系数
属性
分布
相似
度
Keywords
affinity propagation; JACCARD; properties distribution similarity.
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
一种面向医学短文本的自适应聚类方法
被引量:
3
3
作者
栗伟
许洪涛
赵大哲
刘积仁
机构
东北大学医学影像计算教育部重点实验室
郑州市人力资源和社会保障数据管理中心
东软集团股份有限公司
出处
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第1期19-23,共5页
基金
国家自然科学基金资助项目(61172002)
国家科技支撑计划项目(2014BAI17B01)
国家高技术研究发展计划项目(2012AA02A607)
文摘
针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后采用基于序列模式的中心概念提取算法实现了疾病命名的标准化,同时对聚类簇进行合并和优化,进一步提升了聚类的准确性.测试结果表明,所述方法具有较高的准确率和聚类效率,在病历文本的预处理、分类和分析中具有广泛意义.
关键词
聚类分析
相似
性
度
量
频繁序列模式
电子病历
相似度分布
Keywords
clustering analysis
similarity measurement
frequent sequence pattern
electronic medical record
similarity distribution
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
利用词汇分布相似度的中文词汇语义倾向性计算
赵煜
蔡皖东
樊娜
李慧贤
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2009
1
在线阅读
下载PDF
职称材料
2
属性分布相似度吸引子传播聚类算法研究
王依章
王丽敏
韩旭明
《长春工业大学学报》
CAS
2014
0
在线阅读
下载PDF
职称材料
3
一种面向医学短文本的自适应聚类方法
栗伟
许洪涛
赵大哲
刘积仁
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部