期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向实体识别的聚类算法 被引量:8
1
作者 孙琛琛 申德荣 +2 位作者 寇月 聂铁铮 于戈 《软件学报》 EI CSCD 北大核心 2016年第9期2303-2319,共17页
实体识别是数据质量的一个重要方面,对于大数据处理不可或缺.已有的实体识别研究工作聚焦于数据对象相似度算法、分块技术和监督的实体识别技术,而非监督的实体识别中匹配决定的问题很少被涉及.提出一种面向实体识别的聚类算法来弥补这... 实体识别是数据质量的一个重要方面,对于大数据处理不可或缺.已有的实体识别研究工作聚焦于数据对象相似度算法、分块技术和监督的实体识别技术,而非监督的实体识别中匹配决定的问题很少被涉及.提出一种面向实体识别的聚类算法来弥补这个缺失.利用数据对象及其相似度构建带权重的数据对象相似图.聚类过程中,利用相似图上重启式随机游走来动态地计算类簇与结点的相似度.聚类的基本逻辑是,类簇迭代地吸收离它最近的结点.提出数据对象排序方法来优化聚类的顺序,提高聚类精确性;提出了优化的随机游走平稳概率分布计算方法,降低聚类算法开销.通过在真实数据集和生成数据集上的对比实验,验证了该算法的有效性. 展开更多
关键词 实体识别 聚类 随机游走模型 簇点相似度 数据对象排序
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部