随着近年来Web服务数量的快速增长,用户-服务QoS(Quality of Service)记录矩阵变得日益稀疏。为了解决传统协同过滤算法在稀疏数据集上预测精确性不高的问题,利用欧几里得距离对数值敏感的特点,将云模型特征向量的欧几里得距离转换成云...随着近年来Web服务数量的快速增长,用户-服务QoS(Quality of Service)记录矩阵变得日益稀疏。为了解决传统协同过滤算法在稀疏数据集上预测精确性不高的问题,利用欧几里得距离对数值敏感的特点,将云模型特征向量的欧几里得距离转换成云模型的相似度。对基于云模型的协同过滤算法改进,并将改进算法用于Web服务QoS的动态预测。考虑用户调用同一服务提供商的不同服务有相似体验,再结合云模型的相似度对QoS记录矩阵进行填充,在预测用户调用某服务的QoS时使用填充后的QoS记录矩阵进行计算,从而有利于解决稀疏矩阵下预测准确度难以提高的问题。实验表明,使用该算法的预测结果相较于传统的协同过滤算法有更低的平均绝对误差(MAE),能获得更高的推荐质量。展开更多
为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记.该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表...为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记.该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表示,通过计算文本主题从属于各分类目录的期望从而实现文本自动标记.为验证TML算法的效果,在标准文本分类数据集上使用文本分类器进行有监督文本分类实验.为对比数据集和分类器对分类效果的影响,在3个数据集(WebKB、Reuters-21578、20-News Group)上分别使用3种不同的分类器(Rocchio、KNN、SVM)进行实验.实验结果表明:TML算法有效地提高了文本分类效率及文本标记效率.展开更多
文摘随着近年来Web服务数量的快速增长,用户-服务QoS(Quality of Service)记录矩阵变得日益稀疏。为了解决传统协同过滤算法在稀疏数据集上预测精确性不高的问题,利用欧几里得距离对数值敏感的特点,将云模型特征向量的欧几里得距离转换成云模型的相似度。对基于云模型的协同过滤算法改进,并将改进算法用于Web服务QoS的动态预测。考虑用户调用同一服务提供商的不同服务有相似体验,再结合云模型的相似度对QoS记录矩阵进行填充,在预测用户调用某服务的QoS时使用填充后的QoS记录矩阵进行计算,从而有利于解决稀疏矩阵下预测准确度难以提高的问题。实验表明,使用该算法的预测结果相较于传统的协同过滤算法有更低的平均绝对误差(MAE),能获得更高的推荐质量。