期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于文本相似度矩阵运算的非结构化海量投诉数据分类算法 被引量:5
1
作者 李青 陈阳 +1 位作者 谢浩然 蒙圣光 《计算机工程与科学》 CSCD 北大核心 2012年第1期103-107,共5页
随着互联网和信息技术的日新月异,非结构化数据量有呈几何级数增长的趋势。尤其是Web2.0网络社区的流行与火爆,使得增长趋势得到了进一步的加速。因此,面对海量的非结构化数据,如何有效地管理和组织它们,以便于终端用户进行信息存取,成... 随着互联网和信息技术的日新月异,非结构化数据量有呈几何级数增长的趋势。尤其是Web2.0网络社区的流行与火爆,使得增长趋势得到了进一步的加速。因此,面对海量的非结构化数据,如何有效地管理和组织它们,以便于终端用户进行信息存取,成为了一个迫在眉睫的重要研究课题。本文通过对非结构化数据的文本的建模和文本相似度比较,对于大规模非结构化数据的分类算法进行了讨论和研究,并将此算法应用到了中国移动的投诉数据分类系统中。在系统实施后,非常有效地提高了投诉数据的处理效率,从而印证所提出分类算法及系统框架的有效性。 展开更多
关键词 文本相似度 非结构化数据 投诉数据分类系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部