-
题名基于文本-视觉和信息熵最小化的对比学习模型
- 1
-
-
作者
蔡晓东
董丽芳
黄业洋
周丽
-
机构
桂林电子科技大学信息与通信学院
南宁西岸枫谷商务数据有限公司
-
出处
《华南理工大学学报(自然科学版)》
北大核心
2025年第3期50-56,共7页
-
基金
广西创新驱动发展专项(AA20302001)。
-
文摘
当前的无监督对比学习方法主要依赖纯文本信息来构建句子嵌入,在全面理解句子所表达的深层含义时存在局限性。同时,传统的对比学习方法过于注重最大化文本正实例之间的互信息,忽视了句子嵌入中潜在的噪声干扰。为了既能保留文本中的有用信息,又能有效地剔除文本嵌入中的噪声干扰,该文提出了一种基于文本-视觉和信息熵最小化的对比学习模型。首先,将文本与对应的视觉信息在对比学习的框架下进行深度融合,共同映射到一个统一的地面空间,并确保它们的表示在该空间中保持一致,从而克服了仅依赖纯文本信息进行句子嵌入学习的限制,使得对比学习过程更加全面且精确;然后,遵循信息最小化原则,在最大化文本正实例间互信息的同时,基于信息熵最小化对文本正实例进行重构。在标准语义文本相似度(STS)任务上的实验结果表明,所提出的模型在Spearman相关系数评价指标上取得了显著提升,相较于现有先进方法具有显著的优势,同时也证明了该模型的有效性。
-
关键词
无监督对比学习
互信息
文本-视觉
信息熵最小化
语义文本相似度
-
Keywords
unsupervised contrastive learning
mutual information
text-visual
information entropy minimization
semantic text similarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于决策树的三组元精馏序列结构最优合成规则识别
被引量:3
- 2
-
-
作者
陈熙理
孙国铭
贾胜坤
罗祎青
袁希钢
-
机构
天津大学化工学院
化学工程国家重点实验室(天津大学)
-
出处
《化工学报》
EI
CAS
CSCD
北大核心
2021年第3期1430-1437,共8页
-
基金
国家自然科学基金项目(21676783,91834303)。
-
文摘
针对三组元精馏系统结构的优化合成,提出一种数据驱动的基于信息熵最小化的分类回归决策树(CART)模型。三组元精馏优化数据采用文献中严格模拟优化的结果,数据包含4种三组元混合物、34种进料组成以及7个候选精馏序列结构的最优化设计结果,生成数据集用来训练CART决策树。由决策树训练结果给出了三组元精馏结构最优设计决策规则,模型测试结果显示本文提出的决策树模型对数据集范围内三组元物系精馏结构决策的准确率为88.2%,同时表明了影响三组元最优精馏序列的主要影响因素及其重要性。
-
关键词
三组元精馏序列结构
最优合成
决策树
信息熵最小化
决策规则
-
Keywords
ternary-distillation configuration
optimal synthesis
decision tree
Shannon entropy minimization
decision rules
-
分类号
TQ062.2
[化学工程]
-