题名 融合偏置深度学习的距离分解Top-N推荐算法
被引量:3
1
作者
钱梦薇
过弋
机构
华东理工大学信息科学与工程 学院
大数据 流通与 交易 技术 国家 工程 实验室 - 商业智能 与可视 化 技术 研究 中心
上海大数据 与互联网受众工程 技术 研究 中心
出处
《计算机科学》
CSCD
北大核心
2021年第9期103-109,共7页
基金
国家重点研发计划(2018YFC0807105)
国家自然科学基金项目(61462073)
上海市科学技术委员会科研计划项目(17DZ1101003,18511106602,18DZ2252300)
文摘
针对传统矩阵分解算法大多是浅层的线性模型,难以学习到深层次的用户和物品的隐特征向量,且在数据稀疏的情况下容易产生过拟合的问题,文中提出一种融合偏置深度学习的矩阵分解算法,在解决数据稀疏问题的同时,还能学习到表征能力更强的距离特征向量。首先,通过用户与物品的显式和隐式数据构建用户与物品的交互矩阵,并将交互矩阵转化为相应的距离矩阵;其次,将距离矩阵分别按行和按列输入加入偏置层的深度神经网络,学习得到具有非线性特征的用户和物品的距离特征向量;最后,根据用户和物品的距离特征向量计算用户和物品之间的距离,用距离值对物品按升序排列,生成Top-N的推荐列表。在4个真实数据集上进行实验,采用Precision,Recall,MAP,MRR和NDCG指标进行评估,结果表明所提算法在上述指标方面相比其他主流推荐算法有明显提升。
关键词
偏置层
深度学习
距离分解
物品排序
Keywords
Biased layer
Deep learning
Distance factorization
Item ranking
分类号
TP191
[自动化与计算机技术—控制理论与控制工程]
题名 基于可信细粒度对齐的多模态方面级情感分析
被引量:3
2
作者
范东旭
过弋
机构
华东理工大学信息科学与技术 学院
大数据 流通与 交易 技术 国家 工程 实验室 - 商业智能 与可视 化 技术 研究 中心
上海大数据 与互联网受众工程 技术 研究 中心
出处
《计算机科学》
CSCD
北大核心
2023年第12期246-254,共9页
基金
上海市科学技术委员会科技计划项目(22DZ204903,22511104800)。
文摘
基于方面的多模态情感分析任务(Multimodal Aspect-Based Sentiment Analysis,MABSA),旨在根据文本和图像信息识别出文本中某特定方面词的情感极性。然而,目前主流的模型并没有充分利用不同模态之间的细粒度语义对齐,而是采用整个图像的视觉特征与文本中的每一个单词进行信息融合,忽略了图像视觉区域和方面词之间的强对应关系,这将导致图片中的噪声信息也被融合进最终的多模态表征中,因此提出了一个可信细粒度对齐模型TFGA(MABSA Based on Trusted Fine-grained Alignment)。具体来说,使用FasterRCNN捕获到图像中包含的视觉目标后,分别计算其与方面词之间的相关性,为了避免视觉区域与方面词的局部语义相似性在图像文本的全局角度不一致的情况,使用置信度对局部语义相似性进行加权约束,过滤掉不可靠的匹配对,使得模型重点关注图片中与方面词相关性最高且最可信的视觉局域信息,降低图片中多余噪声信息的影响;接着提出细粒度特征融合机制,将聚焦到的视觉信息与文本信息进行充分融合,以得到最终的情感分类结果。在Twitter数据集上进行实验,结果表明,文本与视觉的细粒度对齐对方面级情感分析是有利的。
关键词
方面级情感分析
多模态
细粒度对齐
情感分析
自然语言处理
Keywords
Aspect-based sentiment analysis
Multimodal
Fine-grained alignment
Sentiment analysis
Natural language processing
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于层级多任务BERT的海关报关商品分类算法
被引量:3
3
作者
阮启铭
过弋
郑楠
王业相
机构
华东理工大学信息科学与工程 学院
大数据 流通与 交易 技术 国家 工程 实验室 - 商业智能 与可视 化 技术 研究 中心
上海大数据 与互联网受众工程 技术 研究 中心
出处
《计算机应用》
CSCD
北大核心
2022年第1期71-77,共7页
基金
上海市科学技术委员会科研计划项目(17DZ1101003,180Z2252300)。
文摘
海关商品申报场景下,需采用分类模型将商品归类为统一的海关(HS)编码。然而现有海关商品分类模型忽略了待分类文本中词语的位置信息,同时HS编码数以万计,会导致类别向量稀疏、模型收敛速度慢等问题。针对上述问题,结合真实业务场景下人工逐层归类策略,充分利用HS编码的层次结构特点,提出了一种基于层级多任务BERT(HM-BERT)的分类模型。一方面通过BERT模型的动态词向量获取了报关商品文本中的位置信息,另一方面利用HS编码不同层级的类别信息对BERT模型进行多任务训练,以提高归类的准确性和收敛性。在国内某报关服务商2019年的报关数据集上进行的所提模型的有效性验证,相比BERT模型,HM-BERT模型的准确率提高了2个百分点,在模型训练速度上也有所提升;与同样分层级的H-fastText相比,准确率提高了7.1个百分点。实验结果表明,HM-BERT模型能有效改善海关报关商品的分类效果。
关键词
海关编码
多任务学习
文本分类
BERT
向量稀疏
Keywords
Harmonized System(HS)code
Multi-Task Learning(MTL)
text classification
Bidirectional Encoder Representation from Transformers(BERT)
vector sparsity
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于深度交互融合网络的多跳机器阅读理解
被引量:3
4
作者
朱斯琪
过弋
王业相
机构
华东理工大学信息科学与工程 学院
大数据流通与交易技术国家工程实验室-商业智能与可视化研究中心
上海大数据 与互联网受众工程 技术 研究 中心
出处
《中文信息学报》
CSCD
北大核心
2022年第5期67-75,共9页
基金
国家重点研发计划(2018YFC0807105)
国家自然科学基金(61462073)
上海市科学技术委员会科研计划项目(17DZ1101003,18511106602,18DZ2252300)。
文摘
近年来,多跳机器阅读理解已经吸引了众多学者的关注,其要从多个文档中提取与问题相关的线索并回答问题。但很少有工作注重在段落选择时和回答问题时的多个段落之间的交互与融合,然而这对于多跳推理任务来说是至关重要的。因此,该文提出了一种针对多跳推理机器阅读理解的多段落深度交互融合的方法,首先从多个段落中筛选出与问题相关的段落,然后将得到的“黄金段落”输入到一个深度交互融合的网络中以聚集不同段落之间的信息,最终得到问题的答案。该文实验基于HotpotQA数据集,所提方法与基准模型相比,精确匹配(EM)提升18.5%,F_(1)值提升18.47%。
关键词
多跳推理
机器阅读理解
多段落融合
Keywords
multi-hop reasoning
machine reading comprehension
multi-paragraph interactive fusion
分类号
TP391
[自动化与计算机技术—计算机应用技术]