期刊文献+

为您找到了以下期刊:

共找到4,213篇文章
< 1 2 211 >
每页显示 20 50 100
报名通知|中国中文信息学会具身智能专委会(筹)首届具身智能学术研讨会
1
作者 中文信息学报》 北大核心 2025年第2期51-51,共1页
具身智能是基于物理身体进行感知、认知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为,实现类人的通用人工智能。随着大语言模型(简称大模型)的发展,大模型驱动的具身智能研究逐... 具身智能是基于物理身体进行感知、认知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为,实现类人的通用人工智能。随着大语言模型(简称大模型)的发展,大模型驱动的具身智能研究逐渐兴起,其任务泛化能力和领域通用性,为具身智能的感知、推理和执行等研究带来了技术突破的希望和可行性技术路线,近期的具身智能研究已经尝试了大模型的调用和整合技术,并验证了良好的效果。 展开更多
关键词 中文信息 智能行为 整合技术 智能系统 智能体 语言模型 模型驱动 泛化能力
在线阅读 下载PDF
欢迎订阅《中文信息学报》
2
作者 《中文信息学报》编辑部 中文信息学报》 北大核心 2025年第1期15-15,共1页
《中文信息学报》(Journal of Chinese Information Processing)是全国一级学会—社团法人中国中文信息学会和中国科学院软件研究所联合主办的学术性刊物,创刊于1986年10月,现为月刊。
关键词 中文信息 社团法人 学报 中国科学院软件研究所 订阅
在线阅读 下载PDF
关于中国中文信息学会机器翻译专业委员会名称变更的通知
3
作者 中文信息学报》 北大核心 2025年第3期48-48,共1页
尊敬的各位委员、相关单位及社会各界朋友:为更准确地反映本专委会的职能定位与学术研究方向,经学会批准,中国中文信息学会机器翻译专业委员会正式更名为中国中文信息学会机器翻译与多语言信息处理专业委员会。本次名称变更不影响专委... 尊敬的各位委员、相关单位及社会各界朋友:为更准确地反映本专委会的职能定位与学术研究方向,经学会批准,中国中文信息学会机器翻译专业委员会正式更名为中国中文信息学会机器翻译与多语言信息处理专业委员会。本次名称变更不影响专委会的组织架构及业务范围,所有已签署的文件、协议、证书等仍然有效,专委会的各项工作将继续按照既定规划有序推进。请各相关单位及个人知悉,并在今后的交流合作中使用新名称。 展开更多
关键词 通知 名称变更 中国中文信息学会
在线阅读 下载PDF
第二十四届中国计算语言学大会(CCL2025)征稿启事
4
作者 中文信息学报》 北大核心 2025年第3期F0003-F0003,共1页
“第二十四届中国计算语言学大会”(The Twenty-fourth China National Conference on Computational Linguistics,CCL2025)将于2025年8月11-14日在山东济南举行,会议由中国中文信息学会主办,齐鲁工业大学(山东省科学院)承办。中国计算... “第二十四届中国计算语言学大会”(The Twenty-fourth China National Conference on Computational Linguistics,CCL2025)将于2025年8月11-14日在山东济南举行,会议由中国中文信息学会主办,齐鲁工业大学(山东省科学院)承办。中国计算语言学大会创办于1991年,由中国中文信息学会计算语言学专业委员会负责组织。 展开更多
关键词 CCL2025 中国中文信息学会 中国计算语言学大会
在线阅读 下载PDF
全国知识图谱与语义计算大会(CCKS2025)
5
作者 中文信息学报》 北大核心 2025年第4期F0003-F0003,共1页
2025年9月19日—21日全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中国中文信息学会语言与知识计算专业委员会主办,大会源自中文知识图谱研讨会(Chinese Knowledge Graph Symposium... 2025年9月19日—21日全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中国中文信息学会语言与知识计算专业委员会主办,大会源自中文知识图谱研讨会(Chinese Knowledge Graph Symposium,CKGS)和中国语义网与万维网科学大会(Chinese Semantic Web and Web Science Conference,CSWS),2016年两会合并,CCKS 2016、2017、2018、2019、2020、2021、2022、2023和2024分别在北京、成都、天津、杭州、南昌、广州(线上)、秦皇岛、沈阳和重庆举办。全国知识图谱与语义计算大会已经成为国内知识图谱、语义技术等领域的核心学术会议,聚集了知识表示与推理、自然语言理解与知识获取、图数据管理与图计算、智能问答等相关技术领域的学者和研发人员。 展开更多
关键词 CCKS 语言与知识计算专业委员会 中国中文信息学会
在线阅读 下载PDF
关于开展2025年“中国中文信息学会博士学位论文激励计划”推荐工作的通知
6
作者 中文信息学报》 北大核心 2025年第7期F0003-F0003,共1页
为推动中国中文信息处理领域的科技进步,鼓励创新性研究,促进青年人才成长,现开展2025年“中国中文信息学会博士学位论文激励计划”推荐工作,具体事项通知如下:一、申报资格1.论文作者在攻读博士学位期间,在中文信息处理技术及其相关领... 为推动中国中文信息处理领域的科技进步,鼓励创新性研究,促进青年人才成长,现开展2025年“中国中文信息学会博士学位论文激励计划”推荐工作,具体事项通知如下:一、申报资格1.论文作者在攻读博士学位期间,在中文信息处理技术及其相关领域的基础理论或应用研究中取得重要成果,或在关键技术或应用技术创新等方面成果显著。2.论文作者在申报受理日期当年和前一年(2024年、2025年)获得博士学位。 展开更多
关键词 中国中文信息学会 博士学位论文
在线阅读 下载PDF
第二十四届中国计算语言学大会(CCL 2025)征稿启事
7
作者 中文信息学报》 北大核心 2025年第4期29-29,共1页
“第二十四届中国计算语言学大会”(The Twenty-fourth China National Conference on Computational Linguistics,CCL 2025)将于2025年8月11-14日在山东济南举行,会议由中国中文信息学会主办,齐鲁工业大学(山东省科学院)承办。中国计... “第二十四届中国计算语言学大会”(The Twenty-fourth China National Conference on Computational Linguistics,CCL 2025)将于2025年8月11-14日在山东济南举行,会议由中国中文信息学会主办,齐鲁工业大学(山东省科学院)承办。中国计算语言学大会创办于1991年,由中国中文信息学会计算语言学专业委员会负责组织。经过30余年的发展,中国计算语言学大会已成为国内自然语言处理领域权威性最高、规模和影响最大的学术会议。作为中国中文信息学会(国内一级学会)的旗舰会议,CCL聚焦于中国境内各类语言的智能计算和信息处理,为研讨和传播计算语言学最新学术和技术成果提供了最广泛的高层次交流平台。 展开更多
关键词 自然语言处理 中国中文信息学会
在线阅读 下载PDF
中国中文信息学会大模型与生成专委会2025大模型战略研讨会成功举办
8
作者 中文信息学报》 北大核心 2025年第7期126-126,共1页
2025年6月27日,中国中文信息学会大模型与生成专委会2025大模型战略研讨会在哈尔滨成功举办!本次大会由中国中文信息学会大模型与生成专委会主办,哈尔滨工业大学承办。大会旨在讨论OpenAI-O1、DeepSeek-R1等带来的技术革命、交流最新研... 2025年6月27日,中国中文信息学会大模型与生成专委会2025大模型战略研讨会在哈尔滨成功举办!本次大会由中国中文信息学会大模型与生成专委会主办,哈尔滨工业大学承办。大会旨在讨论OpenAI-O1、DeepSeek-R1等带来的技术革命、交流最新研究成果、探讨后大模型时代的研究方向,并发布CIPS-LMG华为云脑洞基金。会议邀请多名自然语言处理和大模型方向领域专家作特邀报告,并组织多位思辨嘉宾分组讨论交流。近50位领域资深专家与青年学者参会,深入探讨、碰撞思想、共话大模型未来。 展开更多
关键词 大模型战略研讨会 中国中文信息学会
在线阅读 下载PDF
征稿通知|全国知识图谱与语义计算大会CCKS 2025
9
作者 中文信息学报》 北大核心 2025年第3期128-128,共1页
全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中国中文信息学会语言与知识计算专业委员会主办,大会源自中文知识图谱研讨会(Chinese Knowledge Graph Symposium,CKGS)和中国语义网... 全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中国中文信息学会语言与知识计算专业委员会主办,大会源自中文知识图谱研讨会(Chinese Knowledge Graph Symposium,CKGS)和中国语义网与万维网科学大会(Chinese Semantic Web and Web Science Conference,CSWS),2016年两会合并,CCKS 2016、2017、2018、2019、2020、2021、2022、2023和2024分别在北京、成都、天津、杭州、南昌、广州(线上)、秦皇岛、沈阳和重庆举办。全国知识图谱与语义计算大会已经成为国内知识图谱、语义技术等领域的核心学术会议,聚集了知识表示与推理、自然语言理解与知识获取、图数据管理与图计算、智能问答等相关技术领域的学者和研发人员。 展开更多
关键词 语言与知识计算专业委员会 中国中文信息学会
在线阅读 下载PDF
一种基于预训练的条件文本生成方法
10
作者 邵党国 孔宪媛 +3 位作者 马磊 安青 黄琨 相艳 中文信息学报》 北大核心 2025年第7期127-137,共11页
随着电子商务的发展,人们需要从产品的评论中更加全面地了解产品信息,高质量的评论文本对于客户黏度和社会舆论发挥着重要作用。传统的中文文本生成模型表现良好,却不能有效结合先验知识并根据条件情感输入生成对应情感极性的文本。该... 随着电子商务的发展,人们需要从产品的评论中更加全面地了解产品信息,高质量的评论文本对于客户黏度和社会舆论发挥着重要作用。传统的中文文本生成模型表现良好,却不能有效结合先验知识并根据条件情感输入生成对应情感极性的文本。该文提出一种条件评论文本生成模型,将预训练语言模型与生成对抗网络结合起来,利用预训练模型较好的语言理解能力学习真实文本中概率分布。该文通过在生成器层标准化中引入条件层标准化,达到根据输入情感标签自动生成对应情感极性文本的目的。在电商评论数据集上的实验表明,该模型相较于传统的Seq2Seq模型和SeqGAN模型,不仅引入条件情感输入,并且生成效果更优、文本质量更高。 展开更多
关键词 BERT SeqGAN 条件层标准化 条件文本生成
在线阅读 下载PDF
基于模块交互和依存关系的生物医学事件检测
11
作者 张勇 左皓阳 +1 位作者 苏莹 周光有 中文信息学报》 北大核心 2025年第6期119-126,共8页
该文提出一种基于模块交互和依存关系的生物医学事件检测模型。该模型在事件检测模块中融入了命名实体识别模块与图卷积策略,充分利用数据集中的标注信息和远距离依存关系来提高文本的语义表示。该模型同时构造了一个命名实体识别模块... 该文提出一种基于模块交互和依存关系的生物医学事件检测模型。该模型在事件检测模块中融入了命名实体识别模块与图卷积策略,充分利用数据集中的标注信息和远距离依存关系来提高文本的语义表示。该模型同时构造了一个命名实体识别模块和一个事件检测模块,并将命名实体识别模块中训练的语义特征拼接到事件检测模块,以增强事件检测的语义信息。同时,该模型还在事件检测模块中集成了基于门控机制的图卷积层,以利用依存句法信息来提高单词之间远距离依存关系的建模能力。在生物医学事件检测数据集上的实验结果显示,该模型的F_(1)值达到了81.63%,整体性能优于其他模型,显示了模块交互与图卷积策略在提升生物医学事件检测方面的有效性。 展开更多
关键词 生物医学事件检测 模块交互 命名实体识别 图卷积
在线阅读 下载PDF
基于关系图卷积神经网络的跨句实体关系抽取
12
作者 陈千 关春祥 +1 位作者 郭鑫 王素格 中文信息学报》 北大核心 2025年第7期62-71,共10页
相对于句子级关系抽取,涉及关系的实体存在于多个句子中的情况在实际场景中更常见。因此篇章级关系抽取逐渐成为近年来信息抽取领域的研究热点。为了充分利用上下文信息和篇章结构信息,该文采用实体嵌入表示和实体间的显式结构关系研究... 相对于句子级关系抽取,涉及关系的实体存在于多个句子中的情况在实际场景中更常见。因此篇章级关系抽取逐渐成为近年来信息抽取领域的研究热点。为了充分利用上下文信息和篇章结构信息,该文采用实体嵌入表示和实体间的显式结构关系研究跨句实体关系抽取。首先,对篇章进行编码和构图;进而,使用关系图卷积神经网络对图节点进行更新,并利用融合篇章全局信息的节点嵌入表示更新边嵌入表示;最后,该模型使用一种迭代算法完成边信息的推理,实现跨句实体关系抽取。实验结果表明,相比基线模型,在CDR和GDA数据集上的跨句实体关系抽取性能得到了显著提高。 展开更多
关键词 关系图卷积神经网络 跨句实体关系抽取 实体嵌入
在线阅读 下载PDF
基于潜层主题结构表示增强的跨领域文本生成
13
作者 刘小明 赵梦婷 +1 位作者 杨关 刘杰 中文信息学报》 北大核心 2025年第5期150-163,176,共15页
现有的低资源生成模型大多使用预训练的词嵌入来解决目标领域数据稀疏问题,但这种方法难以捕捉不同领域间的潜层结构信息,经常忽略潜在主题对捕捉关键信息的重要作用。为了解决这些问题,该文联合神经主题模型提取潜在主题,从而为生成的... 现有的低资源生成模型大多使用预训练的词嵌入来解决目标领域数据稀疏问题,但这种方法难以捕捉不同领域间的潜层结构信息,经常忽略潜在主题对捕捉关键信息的重要作用。为了解决这些问题,该文联合神经主题模型提取潜在主题,从而为生成的语句选择提供全局特征,并结合词嵌入和主题嵌入,增强模型对潜在主题信息的利用,然后通过对不同领域的主题对齐,捕捉相似潜层主题结构表示。在文本生成不同任务的数据集上进行的大量实验表明,该模型在摘要生成任务的六个低资源领域数据集、CNN/DailyMail数据集和SAMsum数据集上的ROUGE-1均值相较于基准模型分别提高了0.92%、3.71%和1.0%;在对话生成任务中,该模型在ESConv数据集上的各项指标也表现出良好的结果。 展开更多
关键词 低资源 结构特征 主题模型
在线阅读 下载PDF
RESCAL-DLP:融合动态学习二元组的图谱嵌入模型
14
作者 冯勇 闫寒 +2 位作者 徐红艳 徐涵琪 贾永鑫 中文信息学报》 北大核心 2025年第7期17-26,共10页
知识图谱现有数据集大多因不够完整导致嵌入表示不准确,目前主要是通过添加信息来保证嵌入准确性,但存在过多依赖添加三元组以外的附加信息、忽略挖掘三元组自身的有效信息等问题。二元组是由三元组中的关系与头实体或尾实体组成的实体... 知识图谱现有数据集大多因不够完整导致嵌入表示不准确,目前主要是通过添加信息来保证嵌入准确性,但存在过多依赖添加三元组以外的附加信息、忽略挖掘三元组自身的有效信息等问题。二元组是由三元组中的关系与头实体或尾实体组成的实体关系对,当前研究较少考虑利用二元组潜在的语义信息来提升嵌入的效果。为此,该文提出了一种融合动态学习二元组的图谱嵌入模型(RESCAL-DLP)。首先,使用正负实例构建策略进行数据扩充,使数据集包含更丰富的二元组的特征信息;其次,通过对比学习二元组的语义相似度来加强模型的学习能力,提升嵌入效果;最后,动态调整二元组学习权重进行模型训练。在两个公开标准数据集WN18RR、FB15K-237上进行链接预测实验以评估所提模型的效果。实验结果表明,所提模型相较于当前主流模型在各项指标上均有一定的提升,并在最小化计算资源和模型训练时间的前提下,取得了令人满意的结果。 展开更多
关键词 知识图谱 嵌入表示 数据扩充 二元组 对比学习
在线阅读 下载PDF
一种注意力引导知识增强的事件因果关系识别方法
15
作者 徐博 孙晋辰 +1 位作者 林鸿飞 宗林林 中文信息学报》 北大核心 2025年第1期89-100,共12页
事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT... 事件因果关系识别是自然语言处理领域的重要任务,由于因果关系表达方式多样且以隐式表达为主,现有方法难以准确识别。该文将外部结构化知识融入事件因果关系识别任务,提出一种注意力引导知识增强的事件因果关系识别方法。首先,通过BERT模型对事件对及其上下文进行编码;然后,提出零跳混合匹配方案挖掘事件相关的描述型知识和关系型知识,通过注意力机制对事件的描述型知识序列进行编码,通过稠密图神经网络对事件对的关系型知识进行编码。最后,融合前三个编码模块识别事件因果关系。基于EventStoryLine和Causal-TimeBank数据集的实验结果表明,该文所构建模型的识别效果优于现有模型,在零跳概念匹配、描述性和关系型知识编码等层面均获得了识别性能的提升。 展开更多
关键词 事件抽取 因果识别 知识图谱 注意力机制 自然语言处理
在线阅读 下载PDF
基于词性对齐与依存关系的中文排比句生成方法
16
作者 钟茂生 刘蕾 +2 位作者 吴如萍 甘家其 周新宇 中文信息学报》 北大核心 2025年第2期131-142,共12页
排比句是一种常用的修辞手法,其使用具有增强气势、强调突出、层次清晰的效果。排比句生成对于文本生成具有重要意义,能够丰富文本生成的风格和形式,提升教育、广告和文学创作的质量,但目前暂无生成模型和公开的排比句语料库。为此,该... 排比句是一种常用的修辞手法,其使用具有增强气势、强调突出、层次清晰的效果。排比句生成对于文本生成具有重要意义,能够丰富文本生成的风格和形式,提升教育、广告和文学创作的质量,但目前暂无生成模型和公开的排比句语料库。为此,该文在收集和构建排比句数据集的基础上,结合排比句具有的语言学特征,提出了一种基于词性对齐与依存关系的中文排比句生成模型,称为CPG-PosDep。模型从语言学出发,首先用设定的分词、句内词序和句间位置三种特殊符号及随机采样策略对排比句进行全局标识,并结合改进的Transformer注意力机制学习排比句的词性对齐特征,然后使用BERT和注意模块将给定分句的依存关系信息融入模型中,融合生成排比句。在排比句数据集上的实验表明,模型能够生成与给定分句在对应位置词性一致、依存关系相同的通顺分句,相比使用现有对联或诗歌生成模型生成的排比句,该文所提模型生成的排比句质量更具优势。 展开更多
关键词 中文排比句生成 词性对齐 随机采样策略 依存关系
在线阅读 下载PDF
基于链接策略和不同粒度特征融合的极限多标签文本分类模型
17
作者 胡婕 郑启扬 +1 位作者 曹芝兰 刘梦赤 中文信息学报》 北大核心 2025年第3期84-95,共12页
现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语... 现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语义。然后,通过注意力机制将标签语义和文档内容相结合生成感知文本,有效地探索文本信息和标签语义的交互关系。此外,该文通过融合机制将粗粒度层次特征和细粒度特征相结合,帮助模型更好地学习不同层次粒度的文档语义信息。在三个公开的数据集Eurlex-4K、Wiki10-30K和Kan-Shan Cup上进行了模型验证,实验结果表明,该文所提模型P@k值优于对比模型,综合性能得到有效提升。 展开更多
关键词 极限多标签文本分类 链接策略 感知文本 细粒度特征
在线阅读 下载PDF
基于异构用户知识融合的隐式情感分析研究
18
作者 廖健 张楷 +2 位作者 王素格 雷佳 张益阳 中文信息学报》 北大核心 2025年第3期117-128,共12页
隐式情感分析因其缺乏显式情感线索的特性是情感分析领域的重要研究难点之一。传统的隐式情感分析方法通常针对隐式情感文本本身的信息进行建模,没有考虑隐式情感的主观差异性特征。该文提出了一种基于异构用户知识融合的隐式情感分析模... 隐式情感分析因其缺乏显式情感线索的特性是情感分析领域的重要研究难点之一。传统的隐式情感分析方法通常针对隐式情感文本本身的信息进行建模,没有考虑隐式情感的主观差异性特征。该文提出了一种基于异构用户知识融合的隐式情感分析模型HELENE,从用户数据中挖掘用户异构的内容知识、社会化属性知识以及社会化关系知识,基于图神经网络模型结合动态预训练模型分别从内、外部两个维度对用户进行建模;在此基础上与隐式情感文本语义信息进行融合学习,实现对隐式情感进行主观差异化建模。此外,该文构建了一个用户个性化通用情感分析语料库,涵盖了较为完整的文本内容信息、用户社会化属性信息和关系信息,可同时满足面向用户个性化建模的隐式或显式情感分析相关研究任务的需要。在所构建数据集上的实验结果显示,该文方法相比基线模型在用户个性化隐式情感分析任务上具有显著的提升效果。 展开更多
关键词 隐式情感分析 用户知识建模 异构知识融合
在线阅读 下载PDF
基于隔行对照标注策略的少数民族古文献开发研究——以藏文古文献隔行标注为例
19
作者 龙从军 安波 赵维纳 中文信息学报》 北大核心 2025年第3期49-58,共10页
少数民族古籍是我国古籍文献的重要组成部分,是中华文明不可或缺的文明成果。但受制于语言文字识读的限制,参与民族古籍整理、挖掘和开发利用的研究团队规模小,技术力量不足,民族古籍文献的利用和普及传播力度不够。基于此,该文提出民... 少数民族古籍是我国古籍文献的重要组成部分,是中华文明不可或缺的文明成果。但受制于语言文字识读的限制,参与民族古籍整理、挖掘和开发利用的研究团队规模小,技术力量不足,民族古籍文献的利用和普及传播力度不够。基于此,该文提出民族古籍隔行对照标注策略,旨在一定程度上解决文字识读困难,鼓励更多跨学科研究者参与民族古籍文献的研究,提高民族古籍开发效率。该文以藏文古文献为例,探索隔行标注策略,在人工标注一定规模语料的前提下,提出了基于多任务学习的隔行对照标注策略。该方法有效提升了隔行数据标注速度,减少了人工标注的工作量,有利于构建大规模的隔行对照数据库。实验结果表明,经过10000条标注语料训练后,该模型在分词行和标注行上分别取得70.9%和63.2%的F 1值,在翻译行上取得18.7%的BLEU值。基于隔行对照标注策略的方法显著地提升了民族古文献的研究范围和深度,避免了民族语本身带来的限制,为挖掘和弘扬中华民族传统文化贡献力量。 展开更多
关键词 藏文古文献 隔行标注 多任务学习 机器学习 民族古文献
在线阅读 下载PDF
KAACNN:融合知识图谱和预训练模型的短文本多标签分类方法
20
作者 陶冶 徐锴 +2 位作者 刘天宇 鲁超峰 王浩杰 中文信息学报》 北大核心 2025年第3期96-106,共11页
短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训... 短文本分类是自然语言处理的重要任务之一。与段落或文档不同,短文本不完全遵循语法规则,长度短并且没有足够的上下文信息,这给短文本分类带来了很大的挑战。该文提出一种结合知识图谱和预训练语言模型的短文本分类方法,一方面使用预训练语言模型提高短文本的文本表示能力;另一方面从外部知识库中检索短文本概念知识,并利用注意力机制将其与短文本结合用于分类任务。此外,针对数据集类别分布不均衡的问题,该文提出基于领域类别知识图谱的数据增强方法。在三个公共数据集和一个汽车领域客户原话数据集上进行了实验,结果表明,引入知识图谱和预训练语言模型的分类方法优于目前先进的短文本分类方法,证明了外部知识库和预训练语言模型的先验知识在短文本分类中的有效性。 展开更多
关键词 知识图谱 注意力机制 预训练语言模型 数据增强 短文本分类
在线阅读 下载PDF
上一页 1 2 211 下一页 到第
使用帮助 返回顶部