-
题名基于用户数据特征深度挖掘的快速图书检索算法
- 1
-
-
作者
窦淑庆
刘思豆
-
机构
唐山学院图书馆
汉阳大学传播与文化学院
-
出处
《现代电子技术》
北大核心
2025年第14期137-142,共6页
-
基金
河北省自然科学基金项目(F2020203014)
2023河北省社会科学发展研究项目(20230203026)。
-
文摘
针对传统图书推荐系统所得到的计算结果滞后于实时需求且准确性较低的缺陷,文中基于用户画像数据,提出一种快速图书检索算法。该算法在用户画像构建部分对静态属性抽取和动态标签行为进行建模。在图书特征提取模型中,使用BERT-Word2Vec作为基础框架进行多模态特征提取,并利用双塔深度匹配模型构建了用户MLP塔和图书改进CNN塔,对特征进行充分细致的多维分析。模型通过将实时反馈机制Kafka-Redis流处理算法与会话注意力加权融合,最终实现了场景化的推荐。实验测试结果显示,NDCG@10指标较最优基准提升了约21.0%,行为反馈延迟在峰值500 QPS流量下小于等于3.5 s。表明所提算法能够为知识服务场景提供兼具准确性、时效性与场景适应性的信息推荐解决方案。
-
关键词
用户画像
双向编码器表示技术
双塔深度匹配模型
多层感知器
卷积神经网络
推荐算法
-
Keywords
user profile
bidirectional encoder representation technology
twin tower depth matching model
multi layer perceptron
convolutional neural network
recommendation algorithm
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向工业生产的中文Text-to-SQL模型
被引量:3
- 2
-
-
作者
吕剑清
王先兵
陈刚
张华
王明刚
-
机构
空天信息安全与可信计算教育部重点实验室(武汉大学)
武汉大学计算机学院
遵义铝业股份有限公司
-
出处
《计算机应用》
CSCD
北大核心
2022年第10期2996-3002,共7页
-
基金
国家自然科学基金资助项目(51977155)。
-
文摘
英文自然语言查询转SQL语句(Text-to-SQL)任务的模型迁移到中文工业Text-to-SQL任务时,由于工业数据集的可解释差且比较分散,会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模型精确匹配率变低。针对迁移过程中出现的问题,提出了对应的解决方法并构建修改后的模型。首先,在数据使用过程中融入工厂元数据信息以解决表示形式不一致以及列名隐含在语义中的问题;然后,根据中文语言表达方式的特性,使用基于相对位置的自注意力模型直接通过问句以及数据库模式信息识别出where子句的value值;最后,根据工业问句查询内容的特性,使用微调后的基于变换器的双向编码器表示技术(BERT)对问句进行分类以提高模型对SQL语句结构预测的准确率。构建了一个基于铝冶炼行业的工业数据集,并在该数据集上进行实验验证。结果表明所提模型在工业测试集上的精确匹配率为74.2%,对比英文数据集Spider上各阶段主流模型的效果后可以看出,所提模型能有效处理中文工业Text-to-SQL任务。
-
关键词
中文Text-to-SQL任务
工业数据集
元数据
自注意力模型
基于变换器的双向编码器表示技术
-
Keywords
Chinese Text-to-SQL task
industrial dataset
metadata
self-attention model
Bidirectional Encoder Representation from Transformers(BERT)
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名融合多种类型语法信息的属性级情感分析模型
被引量:3
- 3
-
-
作者
肖泽管
陈清亮
-
机构
暨南大学计算机科学系
云趣科技-暨南大学人工智能联合研发中心
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第2期395-402,共8页
-
基金
国家自然科学基金(61772232)。
-
文摘
属性级情感分析(ABSA)的目标是识别出句子中属性的情感倾向。现有的方法大多使用注意力机制隐性地建模属性与上下文中情感表达的关系,而忽略了使用语法信息。一方面,属性的情感倾向与句子中的情感表达有紧密的联系,利用句子的句法结构可以更直接地对两者建模;另一方面,由于现有的基准数据集较小,模型无法充分学习通用语法知识,这使得它们难以处理复杂的句型和情感表达。针对以上问题,提出一种利用多种类型语法信息的神经网络模型。该模型采用基于依存句法树的图卷积神经网络(GCN),并利用句法结构信息直接匹配属性与其对应情感表达,缓解冗余信息对分类的干扰。同时,使用预训练模型BERT具有多种类型的语法信息的中间层表示作为指导信息,给予模型更多的语法知识。每一层GCN的输入结合上一层GCN的输出和BERT中间层指导信息。最后将属性在最后一层GCN的表示作为特征进行情感倾向分类。通过在SemEval 2014 Task4 Restaurant、Laptop和Twitter数据集上的实验结果表明,提出模型的分类效果超越了很多基准模型。
-
关键词
属性级
情感分析
基于变换器的双向编码器表示技术(BERT)
依存句法树
图卷积神经网络(GCN)
-
Keywords
aspect
sentiment analysis
bidirectional encoder representations from transformers(BERT)
dependency tree
graph convolutional networks(GCN)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-