-
题名一种基于质心的多标签文本分类模型研究
被引量:4
- 1
-
-
作者
李校林
王成
-
机构
重庆邮电大学通信与信息工程学院
重庆邮电大学通信新技术应用研究中心
重庆信科设计有限公司
-
出处
《计算机工程与科学》
CSCD
北大核心
2020年第6期1120-1126,共7页
-
文摘
为了解决目前所提出的多标签分类算法仍然存在分类精度低和计算复杂度高的问题,提出了一种基于质心的多标签引力模型(ML-GM)。在训练阶段,通过计算文档与类的质心之间的相似性来获得相似性区间。在测试阶段,通过比较未定义文档和类质心之间的相似性是否在相似性区间内来进行多标签分类。该模型通过引入质心分类器和引力模型(GM)解决了计算复杂度高、分类精度低的问题。在实验中使用了雅虎数据集,结果表明,ML-GM在平均精确度、AUC、1-错误率和汉明损失上都有优越性。
-
关键词
文本分类
质心分类器
多标签学习
引力模型
相似度区间
-
Keywords
text classification
centroid-based classifier
multi-label learning
gravitation model
similarity interval
-
分类号
TP321
[自动化与计算机技术—计算机系统结构]
-
-
题名改进的向量质心模型在实时信息检索中的应用研究
被引量:2
- 2
-
-
作者
刘绍翰
王箭
黄志球
-
机构
南京航空航天大学信息学院
-
出处
《计算机应用与软件》
CSCD
2011年第10期62-64,76,共4页
-
基金
国家高技术研究发展计划项目(2009AA044601)
-
文摘
将相关反馈技术应用于信息检索中可以学习和明确用户的信息需求,并对检索结果进行信息过滤,是提高信息检索效果的有效手段之一。除了准确率和召回率之外,过滤算法的适应性、速度也直接影响用户使用信息检索系统的体验。采用向量空间模型表示文档的内容预处理工作少,计算简单,适用于实时信息检索。结合偏差最小的基本原理,将改进的反馈文档向量的质心应用于信息重排。以重排的应用场景,在TREC Filtering Task数据集上进行仿真,并与基于关键词检索和类质心的检索方式进行了试验比较。
-
关键词
信息检索
信息过滤
相关反馈
质心分类器
向量空间模型
-
Keywords
Information retrieval Information filter Relevant feedback Centroid classifier Vector space model
-
分类号
TP311.135
[自动化与计算机技术—计算机软件与理论]
-