期刊文献+
共找到155篇文章
< 1 2 8 >
每页显示 20 50 100
基于word embedding和CNN的情感分类模型 被引量:20
1
作者 蔡慧苹 王丽丹 段书凯 《计算机应用研究》 CSCD 北大核心 2016年第10期2902-2905,2909,共5页
尝试将word embedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用skip-gram模型训练出数据集中每个词的word embedding,然后将每条样本中出现的word embedding组合为二维特征矩阵作为卷积神经网络的输入,此外每次迭代训... 尝试将word embedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用skip-gram模型训练出数据集中每个词的word embedding,然后将每条样本中出现的word embedding组合为二维特征矩阵作为卷积神经网络的输入,此外每次迭代训练过程中,输入特征也作为参数进行更新;其次,设计了一种具有三种不同大小卷积核的神经网络结构,从而完成多种局部抽象特征的自动提取过程。与传统机器学习方法相比,所提出的基于word embedding和CNN的情感分类模型成功地将分类正确率提升了5.04%。 展开更多
关键词 卷积神经网络 自然语言处理 深度学习 词嵌入 情感分类
在线阅读 下载PDF
融合Word2Vec词嵌入的多核卷积神经网络音乐歌词多情感分类方法 被引量:3
2
作者 张昱 冯亚寒 丁千惠 《科学技术与工程》 北大核心 2024年第20期8598-8605,共8页
目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神... 目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神经网络作为分类器的音乐歌词多情感分类方法。该方法首先结合音乐歌词文本,进行数据预处理和可视化分析;其次利用Word2Vec词嵌入提取歌词局部特征,构建特征情感向量,挖掘歌词中情感信息,将歌词转化为更利于分类器模型输入的词向量;最后在分类器中,选用卷积神经网络模型,并在此基础上采用不同高度卷积核的方式构建新模型以此得到多情感分类。结果表明:音乐歌词多情感分类的结果达到94.26%,与传统CNN相比,分类精确率提高了6.86%,取得了良好性能。 展开更多
关键词 自然语言处理 情感分类 卷积神经网络 词嵌入 文本分类 音乐歌词
在线阅读 下载PDF
大模型时代下的汉语自然语言处理研究与探索 被引量:6
3
作者 黄施洋 奚雪峰 崔志明 《计算机工程与应用》 北大核心 2025年第1期80-97,共18页
自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然... 自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然而,相较于英语大模型,汉语大模型在逻辑推理和文本理解能力方面仍存在不足。介绍了图神经网络在特定CNLP任务中的优势,进行了量子机器学习在CNLP发展潜力的调查。总结了大模型的基本原理和技术架构,详细整理了大模型评测任务的典型数据集和模型评价指标,评估比较了当前主流的大模型在CNLP任务中的效果。分析了当前CNLP存在的挑战,并对CNLP任务的未来研究方向进行了展望,希望能帮助解决当前CNLP存在的挑战,同时为新方法的提出提供了一定的参考。 展开更多
关键词 汉语自然语言处理 图神经网络 量子机器学习 汉语大模型
在线阅读 下载PDF
面向关键词预测的动态对比表示增强方法
4
作者 耿雪莲 宋明阳 +2 位作者 冯毅 景丽萍 于剑 《郑州大学学报(工学版)》 北大核心 2025年第3期128-135,共8页
关键词预测通常难以充分利用文本结构中的复杂层次和语义信息,针对该问题,提出了一种新型语义表示增强的关键词预测方法(ACL-KP),即利用动态对比学习增强关键词预测。该方法首先通过引入自适应权重机制,动态调整样本权重,解决在对比学... 关键词预测通常难以充分利用文本结构中的复杂层次和语义信息,针对该问题,提出了一种新型语义表示增强的关键词预测方法(ACL-KP),即利用动态对比学习增强关键词预测。该方法首先通过引入自适应权重机制,动态调整样本权重,解决在对比学习过程中难以区分真实样本与噪声样本的问题,减少误识别噪声样本的影响,优化空间表示。此外,为了提高训练数据的多样性,引入高斯白噪声,自动生成一些具有挑战性的虚拟样本,从而增强文档和关键词的语义表示。在关键词预测领域的多个公开数据集上进行的实验结果表明:模型在F 1@5和F 1@M指标上相较于当前先进模型提升了2%~17%,与序列到序列模型和统一模型相比,展现出了更显著的性能优势。 展开更多
关键词 自然语言处理 关键词预测 多目标优化 对比学习 嵌入表示
在线阅读 下载PDF
基于深度学习的自然语言需求到时序逻辑的生成方法
5
作者 王喜龙 杨志斌 周勇 《小型微型计算机系统》 北大核心 2025年第9期2049-2057,共9页
在嵌入式实时系统当中,时序逻辑是形式化规约的重要组成部分.现有自然语言需求到时序逻辑的生成方法往往局限于特定领域,缺乏泛化性.本文提出的基于深度学习的方法DeepTL能够完成不同领域自然语言需求到多种时序逻辑的生成任务.DeepTL... 在嵌入式实时系统当中,时序逻辑是形式化规约的重要组成部分.现有自然语言需求到时序逻辑的生成方法往往局限于特定领域,缺乏泛化性.本文提出的基于深度学习的方法DeepTL能够完成不同领域自然语言需求到多种时序逻辑的生成任务.DeepTL包含原子命题识别、时序逻辑结构翻译、原子命题翻译3个模块.通过拆分为多个模块,DeepTL不仅显著减少了所需的模型训练数据量,还使得时序逻辑结构翻译不再受限于特定领域.本文在3个领域进行了实验,结果表明,DeepTL在具备较高翻译准确率的同时,减少了对于大规模训练数据和计算资源的依赖. 展开更多
关键词 嵌入式实时系统 自然语言需求 时序逻辑 深度学习
在线阅读 下载PDF
基于社会化聆听的服装品牌个性维度构建与量化
6
作者 章冰珏 宋琨 顾新荣 《丝绸》 北大核心 2025年第5期22-33,共12页
品牌个性是品牌资产的重要组成部分。本文旨在结合社会化聆听数据与自然语言处理技术,构建服装品牌个性维度框架,并提出量化方法。本文通过采集社交媒体上消费者关于服装品牌的推文,运用文本分词和情感分析提取品牌核心词汇,并借助词嵌... 品牌个性是品牌资产的重要组成部分。本文旨在结合社会化聆听数据与自然语言处理技术,构建服装品牌个性维度框架,并提出量化方法。本文通过采集社交媒体上消费者关于服装品牌的推文,运用文本分词和情感分析提取品牌核心词汇,并借助词嵌入与聚类方法筛选出品牌个性词汇并构建维度框架。最后,利用TF-IDF方法对不同品牌在个性维度上的表现进行量化分析。本文基于特质论构建涵盖5主维度、28子维度和176核心词汇的服装品牌个性维度,系统捕捉社交媒体语境下的品牌个性特征,同时验证了TF-IDF方法在品牌个性测量中的应用,可为品牌追踪与管理提供新的理论基础和方法论支持。 展开更多
关键词 品牌个性 社会化聆听 自然语言处理 情感分析 词嵌入 GPT模型 零样本学习 层次聚类
在线阅读 下载PDF
大语言模型在材料科学领域的研究进展
7
作者 闫姿霓 饶梓元 曾小勤 《中国材料进展》 北大核心 2025年第5期409-423,450,共16页
数据驱动方法已成为材料研究的重要趋势,大语言模型的出现不仅为材料科学领域非结构化数据的处理提供了潜在的解决方案,还能够通过其强大的语言理解和生成能力,助力科研中的知识发现、自动化分析、可解释性提升以及多模块协同操作,从而... 数据驱动方法已成为材料研究的重要趋势,大语言模型的出现不仅为材料科学领域非结构化数据的处理提供了潜在的解决方案,还能够通过其强大的语言理解和生成能力,助力科研中的知识发现、自动化分析、可解释性提升以及多模块协同操作,从而可推动材料科学研究的效率提升与创新突破。从大语言模型的理论基础出发,探讨其重要功能、优化方法及其在材料科学中的应用。特别是,大语言模型能够有效处理和提取非结构化文本中的关键信息,帮助加速材料的发现与设计。最后还展望了大语言模型在人工智能与材料科学融合领域的未来发展前景,指出其在推动材料科学研究自动化和智能化方面的巨大潜力。 展开更多
关键词 大语言模型 自然语言处理 机器学习 人工智能 可解释性 材料科学
在线阅读 下载PDF
基于练习题目 文本语义嵌入的知识追踪
8
作者 程植 李金龙 《计算机应用研究》 北大核心 2025年第10期2972-2979,共8页
针对开放域习题数据场景下知识追踪模型对新增习题表现不佳的问题,开展了基于练习题目文本语义嵌入的知识追踪模型研究。该模型包含两个阶段:第一阶段利用微调的预训练语言模型获取练习题目的语义嵌入信息;第二阶段利用习题的嵌入完成... 针对开放域习题数据场景下知识追踪模型对新增习题表现不佳的问题,开展了基于练习题目文本语义嵌入的知识追踪模型研究。该模型包含两个阶段:第一阶段利用微调的预训练语言模型获取练习题目的语义嵌入信息;第二阶段利用习题的嵌入完成知识追踪任务,并设计了答案编码器捕获学生的作答答案信息。为验证模型性能,在英语阅读理解数据集上,将该模型与当前表现最优的知识追踪模型进行对比实验。实验结果显示,该模型在AUC和ACC等关键指标上显著优于对比模型,有效提升了开放域数据中新增习题的知识追踪效果。该方法通过文本语义嵌入技术实现了对新增习题的有效建模,为智能教育系统在开放域题库场景下的应用提供了创新解决方案。 展开更多
关键词 深度学习 机器学习 教育领域的人工智能 自然语言处理 预训练语言模型 知识追踪
在线阅读 下载PDF
面向多源文本的越南语文本检错方法
9
作者 庄紫薇 朱俊国 《计算机工程》 北大核心 2025年第5期93-102,共10页
文本检错是自然语言处理的研究方向之一,目标是自动检测输入文本中错误单词的位置和类型,该任务不仅在文本处理的各种下游环节中应用广泛,而且关系到日常生活中方方面面。目前,针对英文、中文的文本检错模型已经能够达到较高的准确率,然... 文本检错是自然语言处理的研究方向之一,目标是自动检测输入文本中错误单词的位置和类型,该任务不仅在文本处理的各种下游环节中应用广泛,而且关系到日常生活中方方面面。目前,针对英文、中文的文本检错模型已经能够达到较高的准确率,然而,因越南语语料资源稀缺、人工标注数据不足,面向越南语的文本检错任务深受训练样本匮乏和低质量的困扰。此外,还存在不同场景来源的文本包含错误类型不同,以及错误类型数量不均衡的情况,导致通用文本检错模型无法学习到特定错误类型的检测方法,检错能力较弱。基于上述问题,首先,提出一种面向多源文本的越南语文本检错语料库构建方法,利用越南语光学字符识别(OCR)、越南语语音识别和越南语-英语翻译数据集构建初始语料库,并根据多源越南语检错语料生成方法得到错误语料,通过检错语料自动标注算法获得带标签的训练数据。其次,提出融入多源信息特征的越南语文本检错序列标注模型,在多语言来自变换器的双向编码器表征量(BERT)编码端融入场景特征,使模型能够根据当前输入文本场景适应错误类型。实验结果表明,该方法相比基线模型,F0.5值和F1值提升了1.91和1.80百分点,并进一步验证了模型各组件的必要性以及数据集构建方法的有效性。 展开更多
关键词 自然语言处理 机器学习 深度学习 文本检错 越南语
在线阅读 下载PDF
基于模型和算法的量化投资方法股票预测研究综述
10
作者 李子煜 张金珠 高青山 《计算机工程与应用》 北大核心 2025年第19期1-11,共11页
股票价格预测一直是金融研究热点领域。近年来,量化投资方法凭借其客观性、系统性与高效性,逐渐成为股票市场研究的主流方向。随着大数据时代的到来,海量、多源、异构的数据为市场建模与决策提供了丰富的信息基础,有效融合多模态数据已... 股票价格预测一直是金融研究热点领域。近年来,量化投资方法凭借其客观性、系统性与高效性,逐渐成为股票市场研究的主流方向。随着大数据时代的到来,海量、多源、异构的数据为市场建模与决策提供了丰富的信息基础,有效融合多模态数据已成为提升预测准确性的关键路径。系统梳理了量化投资方法的理论演进,回顾了机器学习在股票预测中的应用发展。围绕数据、模型与算法三个维度,对近年来基于量化方法的研究成果进行了综述,深入分析并比较了不同研究在方法创新与技术实现上的差异与优势。此外,还探讨了当前研究中面临的挑战与局限,归纳总结了现有实践经验,并对多模态异构数据融合、弱信号挖掘、迁移学习及组合权重优化等研究方向进行了深入分析与展望。 展开更多
关键词 量化投资 股票预测 机器学习 自然语言处理
在线阅读 下载PDF
基于全域跨语义融合的多级酶功能预测
11
作者 周汉文 邓赵红 张炜 《计算机科学与探索》 北大核心 2025年第6期1588-1597,共10页
蛋白质在生物活动中发挥着关键作用,酶作为一种重要的蛋白质,因其催化功能在多个领域得到广泛应用。然而,通过生化实验验证酶的功能既费时又昂贵。传统的酶功能注释方法主要依赖于序列相似性,但在目标酶序列与已知酶差异较大时,这些方... 蛋白质在生物活动中发挥着关键作用,酶作为一种重要的蛋白质,因其催化功能在多个领域得到广泛应用。然而,通过生化实验验证酶的功能既费时又昂贵。传统的酶功能注释方法主要依赖于序列相似性,但在目标酶序列与已知酶差异较大时,这些方法效果不佳。近年来,科研人员初步探索了一些基于深度学习的方法,但现有的深度学习方法受限于传统酶序列编码方式,并且仅利用单一视图或单层次的信息,这使得模型在处理结构复杂或功能多样的酶时表现出一定的局限性。对此,提出一种新的全域跨语义融合的多级酶功能预测方法(GCMEFP)。所提方法使用了两种最新的蛋白质大语言模型进行序列词嵌入学习。构建了多语义深度特征学习模块,该模块通过卷积神经网络构建语义金字塔,实现了不同层级语义信息的提取。还提出了全域跨视图语义融合模块,用于探索不同视图之间隐藏的相互作用信息,并去除冗余信息来增强模型的泛化性。实验结果表明:提出的GCMEFP在基准数据集上的精度达到89.6%,较现有最优方法高出0.048;在独立测试集New-379上的精度达到55.6%,较现有最优方法高出0.14。 展开更多
关键词 多级酶功能预测 多语义深度特征学习 大模型词嵌入 多视图特征融合
在线阅读 下载PDF
自然语言处理领域中的词嵌入方法综述 被引量:21
12
作者 曾骏 王子威 +2 位作者 于扬 文俊浩 高旻 《计算机科学与探索》 CSCD 北大核心 2024年第1期24-43,共20页
词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的... 词嵌入作为自然语言处理任务的第一步,其目的是将输入的自然语言文本转换为模型可以处理的数值向量,即词向量,也称词的分布式表示。词向量作为自然语言处理任务的根基,是完成一切自然语言处理任务的前提。然而,国内外针对词嵌入方法的综述文献大多只关注于不同词嵌入方法本身的技术路线,而未能将词嵌入的前置分词方法以及词嵌入方法完整的演变趋势进行分析与概述。以word2vec模型和Transformer模型作为划分点,从生成的词向量是否能够动态地改变其内隐的语义信息来适配输入句子的整体语义这一角度,将词嵌入方法划分为静态词嵌入方法和动态词嵌入方法,并对此展开讨论。同时,针对词嵌入中的分词方法,包括整词切分和子词切分,进行了对比和分析;针对训练词向量所使用的语言模型,从概率语言模型到神经概率语言模型再到如今的深度上下文语言模型的演化,进行了详细列举和阐述;针对预训练语言模型时使用的训练策略进行了总结和探讨。最后,总结词向量质量的评估方法,分析词嵌入方法的当前现状并对其未来发展方向进行展望。 展开更多
关键词 词向量 词嵌入方法 自然语言处理 语言模型 分词 词向量评估
在线阅读 下载PDF
基于多任务联合学习的多片段机器阅读理解方法研究
13
作者 张虎 范越 李茹 《中文信息学报》 CSCD 北大核心 2024年第11期79-90,共12页
片段抽取式阅读理解是机器阅读理解任务中的一项重要研究内容,现有的相关研究主要关注单片段抽取,然而,实际应用中很多阅读理解问题的答案由文本的多处不连续片段组成,这使得多片段抽取式阅读理解研究受到越来越多的关注。已有的多片段... 片段抽取式阅读理解是机器阅读理解任务中的一项重要研究内容,现有的相关研究主要关注单片段抽取,然而,实际应用中很多阅读理解问题的答案由文本的多处不连续片段组成,这使得多片段抽取式阅读理解研究受到越来越多的关注。已有的多片段抽取式阅读理解研究大都采用序列标注的方法,该方法不能有效识别多片段问题类型,常常对不同类型的问题给出多个答案片段。为此,该文提出一种结合动态预测片段数量和序列标注的多任务联合学习方法。其中,动态预测片段数量能较为准确地识别出多片段问题类型;序列标注能够实现多个答案片段的有效定位。同时,为了进一步增强现有模型的泛化能力,该文在模型训练中构造了对抗训练和两阶段训练方式。在2021中国法律智能技术评测(Challenge of AI in Law 2021,CAIL2021)数据集和QUOREF数据集上的实验结果表明,该文提出的方法相比基线模型取得了更好的效果。 展开更多
关键词 机器阅读理解 多片段抽取 自然语言理解 多任务联合学习
在线阅读 下载PDF
基于机器学习的涉海企业类型识别及其空间组织特征的城市比较研究
14
作者 刘天宝 马广鹏 +1 位作者 张海瑜 张贵祥 《热带地理》 CSCD 北大核心 2024年第8期1460-1474,共15页
在推进海洋强国建设的进程中,海洋产业是海洋经济增长的最直接对象,而其空间布局与产业组织特征的研究是最具基础性的工作之一。选取4个代表性城市为研究区,基于海洋企业的工商登记信息,爬取空间坐标构建POI产业信息数据库。使用人工神... 在推进海洋强国建设的进程中,海洋产业是海洋经济增长的最直接对象,而其空间布局与产业组织特征的研究是最具基础性的工作之一。选取4个代表性城市为研究区,基于海洋企业的工商登记信息,爬取空间坐标构建POI产业信息数据库。使用人工神经网络等机器学习算法识别各企业所属的行业,综合运用GIS空间分析方法,分析海洋产业集群的空间分异性规律。结果表明:1)从空间格局特征看,总体呈“大分散、小集聚”的均衡格局,多类别对比显示企业选址存在行业集聚性,同时具有空间极化特征,陆海关系上体现为海岸带高密度单峰或“海岸带-市中心”双峰分布格局。2)从空间组织模式看,产业集群存在与人口规模、行政等级相对应的多层次等级位序特征;除单核心结构外,多核心结构中一般表现为“主-次双核心”或者“一主多次放射状”,核心区间产生空间联系形成多节点的轴线或网络结构。3)从空间匹配关系看,椭圆面积与城市面积呈正相关,椭圆长轴方向与海岸线延伸方向相近,产业分布与城市行政中心、港口等交通枢纽、海湾地形、海岸线等空间要素存在明确的匹配关系。 展开更多
关键词 机器学习 自然语言处理 核密度分析 海洋企业 产业集聚 空间布局特征 产业空间组织 沿海城市
在线阅读 下载PDF
基于样本对纠正对比学习的问句相似性判别
15
作者 王浩畅 冯臻旸 郑冠彧 《计算机工程与设计》 北大核心 2024年第12期3726-3731,共6页
为解决对比学习在难例问句的相似性判别上准确性不高的问题,提出一种基于样本对纠正对比学习的问句对相似性判别方法。利用预训练模型与双向LSTM结合进行捕获语义特征;采用自注意力机制关注关键信息并利用平均池化策略压缩特征构建句向... 为解决对比学习在难例问句的相似性判别上准确性不高的问题,提出一种基于样本对纠正对比学习的问句对相似性判别方法。利用预训练模型与双向LSTM结合进行捕获语义特征;采用自注意力机制关注关键信息并利用平均池化策略压缩特征构建句向量;引入样本对对比学习并结合标签误差设计带有惩罚项的对比损失函数,纠正难例相似度得分,增强语义空间的可分离性。实验结果表明,该方法与基线模型相比在问句相似性判别上获得了更好的F1值以及准确率。 展开更多
关键词 相似性判别 对比学习 句向量 语义表征 预训练模型 自注意力机制 自然语言处理
在线阅读 下载PDF
中文命名实体识别研究综述 被引量:30
16
作者 赵继贵 钱育蓉 +2 位作者 王魁 侯树祥 陈嘉颖 《计算机工程与应用》 CSCD 北大核心 2024年第1期15-27,共13页
命名实体识别(named entity recognition,NER)是自然语言处理中最基本的任务之一,其主要内容是识别自然语言文本中具有特定意义的实体类型和边界。然而,中文命名实体识别(Chinese named entity recognition,CNER)的数据样本存在词边界... 命名实体识别(named entity recognition,NER)是自然语言处理中最基本的任务之一,其主要内容是识别自然语言文本中具有特定意义的实体类型和边界。然而,中文命名实体识别(Chinese named entity recognition,CNER)的数据样本存在词边界模糊、语义多样化、形态特征模糊以及中文语料库内容较少等问题,导致中文命名实体识别性能难以大幅提升。介绍了CNER的数据集、标注方案和评价指标。按照CNER的研究进程,将CNER方法分为基于规则的方法、基于统计的方法和基于深度学习的方法三类,并对近五年来基于深度学习的CNER主要模型进行总结。探讨CNER的研究趋势,为新方法的提出和未来研究方向提供一定参考。 展开更多
关键词 自然语言处理 中文命名实体识别 深度学习 预训练模型 机器学习
在线阅读 下载PDF
人工智能技术在失效分析领域的应用 被引量:2
17
作者 李桌汉 有移亮 +4 位作者 赵子华 骆红云 吴素君 张峥 钟群鹏 《航空材料学报》 CAS CSCD 北大核心 2024年第5期1-16,共16页
本文探讨了人工智能技术,尤其是机器学习和自然语言处理技术在失效分析领域的应用与发展趋势。失效分析是确保设备可靠性和安全性的重要手段,广泛应用于航空航天、汽车制造、电子设备等领域。传统的失效分析方法通常依赖专家经验,而人... 本文探讨了人工智能技术,尤其是机器学习和自然语言处理技术在失效分析领域的应用与发展趋势。失效分析是确保设备可靠性和安全性的重要手段,广泛应用于航空航天、汽车制造、电子设备等领域。传统的失效分析方法通常依赖专家经验,而人工智能技术凭借其强大的数据处理能力,与传统方法相结合,极大地提升了分析的精度和效率。在失效模式诊断方面,人工智能技术能够快速准确地识别各种故障模式,并提供精确的诊断结果;在失效原因诊断中,人工智能通过整合多种数据来源,揭示复杂的失效因素和潜在的因果关系,提升了诊断的可靠性;在失效预测方面,机器学习技术能够精确预测材料的寿命和强度,减少实验时间和成本;在失效预防方面,人工智能技术提供了新的思路,能够有效降低失效发生的风险,减少产品维护成本。本文还展望了人工智能技术在失效分析领域的发展前景,提出了在数据质量提升、模型优化、跨学科合作以及伦理与安全等方面的挑战与建议。 展开更多
关键词 人工智能 机器学习 自然语言处理 失效分析 失效诊断 寿命预测 失效预防
在线阅读 下载PDF
基于深度学习的中文文本分类综述 被引量:8
18
作者 高珊 李世杰 蔡志平 《计算机工程与科学》 CSCD 北大核心 2024年第4期684-692,共9页
大数据时代,随着社交媒体的不断普及,在网络以及生活中,各类文本数据日益增长,采用文本分类技术对文本数据进行分析和管理具有重要的意义。文本分类是自然语言处理领域中的一个基础研究内容,在给定标准下,根据内容对文本进行分类,文本... 大数据时代,随着社交媒体的不断普及,在网络以及生活中,各类文本数据日益增长,采用文本分类技术对文本数据进行分析和管理具有重要的意义。文本分类是自然语言处理领域中的一个基础研究内容,在给定标准下,根据内容对文本进行分类,文本分类的场景应用十分广泛,如情感分析、话题分类和关系分类等。深度学习是机器学习中一种基于对数据进行表征学习的方法,在文本数据处理中表现出了较好的分类效果。中文文本与英文文本在形、音、象上都有着区别,着眼于中文文本分类的特别之处,对用于中文文本分类的深度学习方法进行分析与阐述,最终梳理出常用于中文文本分类的数据集。 展开更多
关键词 中文文本分类 自然语言 深度学习 机器学习
在线阅读 下载PDF
基于隐含狄利克雷分布模型老年数字护理专利布局与发展趋势分析 被引量:2
19
作者 苑秋辰 魏晓蕾 +2 位作者 高瑞 李淑萍 梁涛 《军事护理》 CSCD 北大核心 2024年第4期80-84,共5页
目的分析数字健康背景下老年护理专利的布局与发展趋势。方法计算机检索Derwent世界专利索引老年数字护理专利,使用Python进行数据预处理、统计分析和构建隐含狄利克雷分布(latent dirichlet allocation,LDA)主题模型。结果共纳入相关专... 目的分析数字健康背景下老年护理专利的布局与发展趋势。方法计算机检索Derwent世界专利索引老年数字护理专利,使用Python进行数据预处理、统计分析和构建隐含狄利克雷分布(latent dirichlet allocation,LDA)主题模型。结果共纳入相关专利1350项,发明专利占51.63%,实用新型专利占48.37%。专利受理数量整体呈上升趋势,我国占主导地位。国际专利分类集中在护理床、响应无活动能力者的报警器、用于诊断目的的测量等。专利热点主题有技术设备与组件、护理与监测服务、交互界面与用户体验、网络与数据通信和生活辅助与日常管理。发展脉络包括初步发展阶段(1997-2012年)、稳定增长阶段(2013-2019年)、高速创新阶段(2020-2022年)和下降调整阶段(2023-2024年)。结论老年数字护理专利领域正处于市场验证与深入发展阶段,未来老年护理领域将继续融合数字技术纵深发展,以提供高质量的老年护理服务。 展开更多
关键词 老年护理 数字健康 专利分析 机器学习 自然语言处理
在线阅读 下载PDF
针对大语言模型的偏见性研究综述 被引量:15
20
作者 徐磊 胡亚豪 潘志松 《计算机应用研究》 CSCD 北大核心 2024年第10期2881-2892,共12页
偏见现象普遍存在于人类社会,并通常以自然语言为载体呈现。传统的偏见研究主要针对静态词嵌入模型展开,但随着自然语言处理技术的不断演进,研究对象逐渐转向上下文处理能力更强的预训练模型。而作为预训练模型的进一步发展,尽管大型语... 偏见现象普遍存在于人类社会,并通常以自然语言为载体呈现。传统的偏见研究主要针对静态词嵌入模型展开,但随着自然语言处理技术的不断演进,研究对象逐渐转向上下文处理能力更强的预训练模型。而作为预训练模型的进一步发展,尽管大型语言模型凭借惊人的性能和广阔的发展前景在多个应用场景中得到了广泛部署,但其仍可能会从未经处理的训练数据中捕捉到社会偏见,并将偏见传播到下游任务中。含有偏见的大型语言模型系统会产生不良的社会影响和潜在危害,因此针对大型语言模型的偏见研究亟待深入探讨。探讨了自然语言处理中偏见的由来,并对从词嵌入模型到现在大型语言模型的偏见评估和偏见缓解方法进行了分析与总结,旨在为未来相关研究提供有益参考。 展开更多
关键词 自然语言处理 词嵌入 预训练模型 大型语言模型 偏见
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部