期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于图像和文本哈希特征学习的跨模态枸杞害虫检索
1
作者 庾骏 李祖贺 +2 位作者 郝林娜 田二林 舒振球 《农业工程学报》 2025年第16期202-210,共9页
针对现有害虫智能识别方法仅能鉴别害虫类型而无法获取其详细生物特性的局限,该研究提出一种跨模态枸杞害虫检索模型(cross-modal wolfberry pest retrieval, CWPR),旨在实现害虫图像与其对应文本描述的精准匹配。模型通过一种两层级特... 针对现有害虫智能识别方法仅能鉴别害虫类型而无法获取其详细生物特性的局限,该研究提出一种跨模态枸杞害虫检索模型(cross-modal wolfberry pest retrieval, CWPR),旨在实现害虫图像与其对应文本描述的精准匹配。模型通过一种两层级特征融合方法,深度融合视觉Transformer特征和文本双向编码特征;同时引入标签增强技术,融入物种分布信息以学习强化的标签矩阵,有效缓解害虫数据种类不平衡问题。相较于单层融合方案,两层级特征融合使检索性能提升了1.21个百分点;标签增强技术的引入进一步使性能平均提升0.8个百分点。与现有较先进的跨模态检索方法相比,CWPR在两种跨模态枸杞害虫检索任务中平均性能高出1.89个百分点。该模型具备较高的跨模态检索精确度,可为枸杞害虫相关情报信息的有效获取提供有力技术支撑。 展开更多
关键词 枸杞害虫 跨模态信息检索 哈希学习 深度特征融合 标签增强
在线阅读 下载PDF
远程教学数字图书馆中基于MPEG-7的语音数据的组织索引 被引量:1
2
作者 卢坚 杨文清 +1 位作者 陈毅松 张福炎 《情报学报》 CSSCI 北大核心 2002年第4期407-412,共6页
本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音... 本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音检索等服务。最后本文概要地分析了特征的自动提取和描述的自动生成技术。 展开更多
关键词 远程教学 数字图书馆 MPEG-7 描述模式 层次式组织 多维索引 跨模态信息检索 教学语音数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部