基于互信息最大化的文档相关性模型被引量：1

Document relevance model based on mutual information maximization

在线阅读下载PDF

导出

摘要针对传统的文档相关性识别方法在训练过程中文档信息提取不充分的问题,提出一种互信息最大化框架下的深度学习方法。涉及一个无监督学习过程,使用全局和局部互信息学习文档表示,最大化神经网络的输入表示和输出表示之间的互信息,提取更为丰富的文档内容和结构信息,优化模型预测结果。经过在多项任务上的评估,实验结果表明了该方法的可行性和有效性,与一些传统的方法相比,其在准确度上有相当或更好的表现。 To address the issue of inadequate information extraction from documents during the training process of traditional document relevance identification methods,a deep learning method based on maximizing mutual information was proposed.An unsupervised learning process that utilized global and local mutual information to learn document representations was involved,with the aim of maximizing the mutual information between the input and output representations of the neural network.The extraction of more comprehensive document content and structural information was enabled,resulting in improved model prediction results.Evaluation on multiple tasks demonstrates the feasibility and effectiveness of the proposed method which performs comparably or even better in accuracy than that of some traditional methods.

作者陆敏锋张启飞卢成浪吴菁 LU Min-feng;ZHANG Qi-fei;LU Cheng-lang;WU Jing(School of Modern Information Technology,Zhejiang Institute of Mechanical and Electrical Engineering,Hangzhou 310053,China;School of Software Technology,Zhejiang University,Ningbo 315048,China)

机构地区浙江机电职业技术学院现代信息技术学院浙江大学软件学院

出处《计算机工程与设计》北大核心 2024年第9期2712-2718,共7页 Computer Engineering and Design

基金教育部人文社科研究青年基金项目(21YJCZH096) 杭州市哲学社会科学规划课题基金项目(M22JC067)。

关键词互信息文档表示文档相关性最大化无监督学习残差网络全局特征 mutual information document representation document relevance maximization unsupervised learn residual network global feature

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介陆敏锋(1983-),男,浙江杭州人,硕士,讲师,研究方向为深度学习、自然语言处理等,E-mail:luminfeng@zime.edu.cn;张启飞(1984-),男,浙江宁波人,博士,副教授,研究方向为深度学习、可信计算等;卢成浪(1982-),男,浙江温州人,博士,副教授,研究方向为信息检索、自然语言处理等;吴菁(1973-),女,浙江永康人,硕士,副教授,研究方向为深度学习、文本挖掘等。

引文网络
相关文献

同被引文献4

1王卓荦.高山滑雪运动的技术特点分类及教学探讨[J].冰雪体育创新研究,2023(6):134-136. 被引量：3
2宋志鹏.基于单加速度传感器的实时动作识别系统[J].中国新技术新产品,2014(14):29-29. 被引量：1
3肖菊.基于单姿态传感组件的游泳动作识别方法[J].电子器件,2022,45(5):1264-1271. 被引量：5
4刘洋.高山滑雪运动教学及培养策略研究[J].冰雪体育创新研究,2024(16):4-6. 被引量：1

引证文献1

1张浩,乔慧,潘若芊.基于少量传感器的高山滑雪动作识别研究[J].信息技术与信息化,2025(9):35-38.

1曹雨,李刚,金义,马路遥,宋永春,刘凯.基于局部敏感哈希算法的文档内容相似性判断算法[J].电子设计工程,2024,32(18):187-190. 被引量：1
2文艳红.物业服务企业促进服务消费三路径[J].中国物业管理,2024(9):34-35.
3郭振东,林民,李成城.基于BERT嵌入与知识蒸馏的层次化课程主题分析研究[J].中文信息学报,2024,38(7):84-94.
4高珲,张鹏,张静.融合量子干涉信息的双重特征文本表示模型[J].模式识别与人工智能,2024,37(2):172-180.
5张清智.无人机倾斜摄影测量在多测合一中的应用研究[J].中国科技期刊数据库工业A,2024(9):0162-0165.
6董多娇.乡镇卫生院内部控制管理的策略分析[J].财会学习,2024(26):147-150. 被引量：1
7罗传嵩.政企合作,赋能“物业服务+生活服务”[J].中国物业管理,2024(9):21-25.
8牟长兴,张俊涛,程春田,徐杨,杨钰琪.考虑时空相关性的流域水风光多能互补系统高维不确定性场景生成方法[J].电网技术,2024,48(9):3614-3623. 被引量：10
9管金胜,王猛,叶楠,施晶垚.基于AOP技术的调度主站信息复合迭代加密系统[J].电子设计工程,2024,32(19):22-26.

计算机工程与设计

2024年第9期

浏览历史

内容加载中请稍等...

基于互信息最大化的文档相关性模型被引量：1

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于互信息最大化的文档相关性模型 被引量：1

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于互信息最大化的文档相关性模型被引量：1