期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
基于大语言模型的中文多义词义项融合技术研究
1
作者 尹宝生 宗辰 《计算机科学》 北大核心 2025年第S1期53-59,共7页
针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范... 针对中文的一词多义特点,基于现有各类汉语词典资源构建一个义项全面、描述规范的中文多义词知识库,对于汉语语义分析、智能问答、机器翻译以及大语言模型消歧能力调优和评估等具有重要意义。文中针对《现代汉语词典》和《现代汉语规范词典》等资源整合过程中“词条义项含义相同但描述不同”等问题进行了深入分析,并创新性地提出了基于大语言模型和提示学习的多义词义项融合技术,即充分利用大语言模型对常识知识的分析理解和辅助决策能力,通过有效的问题分解策略和提示模版设计,以及义项关系交叉验证等手段完成了多义词义项的自动化融合工作。实验结果表明,在通过正态分布抽取50个多义词共754个义项对的评测数据上,基于上述算法的义项融合的正确率达96.26%,Dice系数为0.973 3。该项研究验证了利用大语言模型开展中文知识资源自动化加工的可行性和有效性,与传统依赖语言专家加工模式相比,在保证较高质量的前提下,显著提升了知识加工效率。 展开更多
关键词 多义词 义项融合 大语言模型 提示学习 中文信息处理
在线阅读 下载PDF
基于注意力机制和提示学习联合训练的上下位关系识别研究
2
作者 白宇 王新哲 《计算机科学》 CSCD 北大核心 2024年第S01期199-203,共5页
专利术语间的上下位关系是一种重要的语义关系,专利文本中术语间的上下位关系识别在专利检索、查询扩展、知识图谱构建等多个领域发挥着重要作用。然而,专利文本领域的多样性、语言表述的复杂性使得术语间的上下位关系识别仍然面临许多... 专利术语间的上下位关系是一种重要的语义关系,专利文本中术语间的上下位关系识别在专利检索、查询扩展、知识图谱构建等多个领域发挥着重要作用。然而,专利文本领域的多样性、语言表述的复杂性使得术语间的上下位关系识别仍然面临许多挑战。文中提出一种融合提示学习和注意力机制的术语上下位关系识别方法,该方法基于远程监督框架,将术语之间的最短依存路径作为辅助特征融入提示模板,使用图神经网络将术语间的共现信息融入提示学习和注意力机制联合训练过程。在专利文本测试数据集上的实验结果表明,所提方法的AUC值、F1值达到94.94%和89.33%,相较于PARE模型分别提升了3.82%和3.17%。该方法有效地去除了使用远程监督方法标注的数据集的噪声,避免了掩码语言模型的训练目标和下游任务的不匹配问题,充分利用了预训练语言模型中存在的语言知识信息。 展开更多
关键词 术语关系识别 远程监督 提示学习 注意力机制 上下位关系
在线阅读 下载PDF
基于树形解码器的航空术语DEF自动生成
3
作者 吕嘉 王裴岩 +2 位作者 蔡东风 张桂平 李林娜 《中文信息学报》 CSCD 北大核心 2024年第6期24-33,共10页
该文研究了基于HowNet的KDML语法体系的术语DEF自动生成问题,提出一种基于树形解码器的生成方法。在编码器端输入专业术语以及其他外部信息(术语的定义、术语子词的义原等);在解码器端交替使用义原解码器和关系解码器,同时使用注意力机... 该文研究了基于HowNet的KDML语法体系的术语DEF自动生成问题,提出一种基于树形解码器的生成方法。在编码器端输入专业术语以及其他外部信息(术语的定义、术语子词的义原等);在解码器端交替使用义原解码器和关系解码器,同时使用注意力机制关注编码器端的各种表征信息,最终得到“义原-关系-义原”形式的输出,并组合成术语对应的义原树,进而得到术语的DEF表示以辅助专业领域HowNet的构建,最终取得了首义原F_(1)值74.13%、总义原F_(1)值53.92%、总关系F_(1)值53.33%、总三元组F_(1)值30.48%的结果。 展开更多
关键词 知网 DEF生成 树形结构解码
在线阅读 下载PDF
中文工艺规范文本分词语料的构建与研究 被引量:3
4
作者 王裴岩 张莹欣 +3 位作者 付小强 陈佳欣 徐楠 蔡东风 《计算机科学》 CSCD 北大核心 2023年第S02期63-68,共6页
中文分词是处理工艺规范文本的一项基本任务,并且在工艺知识图谱与智能问答等下游任务中发挥着重要作用。工艺规范文本分词面临的一个挑战是缺乏高质量标注的语料,特别是面向术语、名词短语、工艺参数、数量词等特殊语言现象的分词规范... 中文分词是处理工艺规范文本的一项基本任务,并且在工艺知识图谱与智能问答等下游任务中发挥着重要作用。工艺规范文本分词面临的一个挑战是缺乏高质量标注的语料,特别是面向术语、名词短语、工艺参数、数量词等特殊语言现象的分词规范。文中面向工艺规范文本制定了专用分词规范,收集并标注了一个中文工艺规范文本分词语料(WS-MPST),含11900个句子与255160个词,4名标注者分词标注一致性达95.25%。在WS-MPST语料上对著名的BiLSTM-CRF与BERT-CRF模型进行了对比实验,F1值分别达到92.61%与93.69%。实验结果表明,构建专用的工艺规范分词语料是必要的。对实验结果的深入分析揭示了未登录词与中文非中文字符混合构成的词是工艺规范文本分词的难点,也为今后工艺规范文本及相关领域的分词研究提供了一定的指导。 展开更多
关键词 中文分词 工艺规范文本 分词规范 分词语料 分词模型
在线阅读 下载PDF
普适性核度量标准比较研究 被引量:2
5
作者 王裴岩 蔡东风 《软件学报》 EI CSCD 北大核心 2015年第11期2856-2868,共13页
核方法是一类应用较为广泛的机器学习算法,已被应用于分类、聚类、回归和特征选择等方面.核函数的选择与参数优化一直是影响核方法效果的核心问题,从而推动了核度量标准,特别是普适性核度量标准的研究.对应用最为广泛的5种普适性核度量... 核方法是一类应用较为广泛的机器学习算法,已被应用于分类、聚类、回归和特征选择等方面.核函数的选择与参数优化一直是影响核方法效果的核心问题,从而推动了核度量标准,特别是普适性核度量标准的研究.对应用最为广泛的5种普适性核度量标准进行了分析与比较研究,包括KTA,EKTA,CKTA,FSM和KCSM.发现上述5种普适性度量标准的度量内容为特征空间中线性假设的平均间隔,与支持向量机最大化最小间隔的优化标准存在偏差.然后,使用模拟数据分析了上述标准的类别分布敏感性、线性平移敏感性、异方差数据敏感性,发现上述标准仅是核度量的充分非必要条件,好的核函数可能获得较低的度量值.最后,在9个UCI数据集和20Newsgroups数据集上比较了上述标准的度量效果,发现CKTA是度量效果最好的普适性核度量标准. 展开更多
关键词 核方法 核选择 核参数优化 普适性核度量标准
在线阅读 下载PDF
面向工艺文本的命名实体识别方法研究 被引量:8
6
作者 贾猛 王裴岩 +1 位作者 张桂平 蔡东风 《中文信息学报》 CSCD 北大核心 2022年第3期54-63,共10页
面向工艺文本中的命名实体,该文提出一种融入领域知识的神经网络命名实体识别方法,旨在对零件、工程图纸、参考标准、属性等12类命名实体进行识别。该方法针对工艺实体的特点,利用领域词典及规则预识别出部分实体,形成预识别实体特征,... 面向工艺文本中的命名实体,该文提出一种融入领域知识的神经网络命名实体识别方法,旨在对零件、工程图纸、参考标准、属性等12类命名实体进行识别。该方法针对工艺实体的特点,利用领域词典及规则预识别出部分实体,形成预识别实体特征,将预识别实体特征加入CNN-BiLSTM-CRF神经网络模型,指导训练与预测。实验结果表明,该方法在工艺文本中能较好地完成命名实体识别任务,在提高词典及规则覆盖的实体识别效果的同时,还能够提高其他类实体的识别效果,通过加入预识别实体特征,使得F_(1)值从90.99%提升到93.03%,验证了该文方法的有效性。 展开更多
关键词 工艺文本 命名实体识别 领域词典及规则 CNN-BiLSTM-CRF
在线阅读 下载PDF
基于字簇的多模型中文分词方法研究 被引量:2
7
作者 李对红 王裴岩 +1 位作者 张桂平 张少阳 《计算机应用研究》 CSCD 北大核心 2020年第2期355-359,374,共6页
字标注分词方法是当前中文分词领域中一种较为有效的分词方法,但由于中文汉字本身带有语义信息,不同字在不同语境中其含义与作用不同,导致每个字的构词规律存在差异。针对这一问题,提出了一种基于字簇的多模型中文分词方法,首先对每个... 字标注分词方法是当前中文分词领域中一种较为有效的分词方法,但由于中文汉字本身带有语义信息,不同字在不同语境中其含义与作用不同,导致每个字的构词规律存在差异。针对这一问题,提出了一种基于字簇的多模型中文分词方法,首先对每个字进行建模,然后对学习出的模型参数进行聚类分析形成字簇,最后基于字簇重新训练模型参数。实验结果表明,该方法能够有效地发现具有相同或相近构词规律的字簇,很好地区别了同类特征对不同字的作用程度。 展开更多
关键词 中文分词 构词规律 模型参数 聚类
在线阅读 下载PDF
航空术语语义知识库辅助构建方法 被引量:5
8
作者 王思博 王裴岩 张桂平 《中文信息学报》 CSCD 北大核心 2018年第12期57-66,共10页
语义知识库是自然语言处理任务的基础性资源,广泛应用于语义计算和语义推理等任务。现有的大规模语义知识库基本都是通用型知识库,缺乏特定领域的语义知识。为了弥补这种不足,该文基于HowNet的语义理论体系,提出了一种辅助构建航空术语... 语义知识库是自然语言处理任务的基础性资源,广泛应用于语义计算和语义推理等任务。现有的大规模语义知识库基本都是通用型知识库,缺乏特定领域的语义知识。为了弥补这种不足,该文基于HowNet的语义理论体系,提出了一种辅助构建航空术语语义知识库的方法。该方法根据航空术语的特点将辅助构建分成四个关键过程,构建了2 000条术语概念描述(DEF)。最后通过对人工标注的术语间相似度与根据术语DEF计算的术语间相似度结果的对比,验证了该构建方法的有效性。 展开更多
关键词 航空术语 语义知识库 知网 概念描述
在线阅读 下载PDF
基于中心化相似度矩阵的词向量方法 被引量:2
9
作者 徐帆 王裴岩 蔡东风 《计算机应用研究》 CSCD 北大核心 2019年第2期411-414,434,共5页
对基于矩阵分解的词向量方法进行了研究,发现降维前相似度矩阵质量与词向量质量存在线性相关性,提出了一种基于中心化相似度矩阵的方法。该方法使得相似(不相似或弱相似)词间的相似程度相对增强(减弱)。在WS-353和RW数据集的词语相似性... 对基于矩阵分解的词向量方法进行了研究,发现降维前相似度矩阵质量与词向量质量存在线性相关性,提出了一种基于中心化相似度矩阵的方法。该方法使得相似(不相似或弱相似)词间的相似程度相对增强(减弱)。在WS-353和RW数据集的词语相似性实验中验证了所提出方法的有效性,两个数据集下词向量质量最高提升0. 289 6和0. 180 1。中心化能够提升降维前相似度矩阵质量,进而提升词向量质量。 展开更多
关键词 词向量 中心化 相似度矩阵
在线阅读 下载PDF
基于深度学习的制造工艺过程自动生成方法研究 被引量:1
10
作者 徐文文 王裴岩 +1 位作者 张桂平 蔡东风 《计算机应用与软件》 北大核心 2022年第12期96-101,共6页
面向制造工艺过程的自动生成,提出一种基于深度学习的方法,具体为一种CNN-LSTM网络。CNN-LSTM网络通过多路CNN和LSTM两种编码器分别对工艺属性和前序工序序列编码,生成特征向量,将特征向量组合后作为解码器的输入,生成后续工序。能够解... 面向制造工艺过程的自动生成,提出一种基于深度学习的方法,具体为一种CNN-LSTM网络。CNN-LSTM网络通过多路CNN和LSTM两种编码器分别对工艺属性和前序工序序列编码,生成特征向量,将特征向量组合后作为解码器的输入,生成后续工序。能够解决多方面输入信息的特征分析问题,以及在工序序列生成中前序工序序列信息与输入信息融合的问题。在2 360份制造大纲文件数据上的实验表明,该方法生成的工艺过程与参考工艺过程的相似性达到0.451 5,BLEU-4达到0.237 6,好于对比方法。 展开更多
关键词 工艺过程自动生成 多路CNN LSTM
在线阅读 下载PDF
面向航空领域HowNet构建的术语内部动态角色标注 被引量:1
11
作者 赵超丽 王裴岩 蔡东风 《计算机应用与软件》 北大核心 2021年第3期163-168,209,共7页
术语内部动态角色标注是航空领域HowNet构建的关键环节,其直接影响航空领域HowNet的规模与质量。针对动态角色种类多造成标注困难的问题,提出一种基于KNN的术语内部动态角色标注方法。通过对术语内部词语DEF项的分析进行样本预选择,并... 术语内部动态角色标注是航空领域HowNet构建的关键环节,其直接影响航空领域HowNet的规模与质量。针对动态角色种类多造成标注困难的问题,提出一种基于KNN的术语内部动态角色标注方法。通过对术语内部词语DEF项的分析进行样本预选择,并在最近邻样本选择阶段融合基于DEF的语义相似性及基于词向量的语境分布相似性。实验结果表明,1-Best、3-Best和7-Best的准确率分别为67.57%、86.00%和94.17%,平均倒数排名MRR为0.7764,优于现有的研究结果。 展开更多
关键词 航空术语 动态角色 HOWNET KNN分类算法
在线阅读 下载PDF
融合权重信息的三维CAD模型聚类研究
12
作者 汪大涵 王裴岩 +1 位作者 张桂平 马伟芳 《小型微型计算机系统》 CSCD 北大核心 2020年第6期1296-1301,共6页
局部区域特征的获取与表达对于研究三维CAD模型聚类至关重要.面向局部区域特征表达问题提出了在现有的六元组方法基础之上将其扩展为七元组,加入了模型中面与面相交形成的边属性信息,从而更好的获得了由局部区域特征构建的词汇本;在聚... 局部区域特征的获取与表达对于研究三维CAD模型聚类至关重要.面向局部区域特征表达问题提出了在现有的六元组方法基础之上将其扩展为七元组,加入了模型中面与面相交形成的边属性信息,从而更好的获得了由局部区域特征构建的词汇本;在聚类阶段,提出了一种模型局部区域加权方法,该方法降低常见局部区域在聚类相似度计算时的最重要程度,从而相对提高了更有区分度的局部区域.实验结果表明,采用本文提出的表达方法能有效支持CAD模型聚类任务,对比基线方法在四种典型聚类算法上得到的NMI值、V-measure值、Purity值均有提升. 展开更多
关键词 三维CAD模型 特征扩展 局部区域加权 聚类
在线阅读 下载PDF
基于Electra预训练模型并融合依存关系的中文事件检测模型 被引量:3
13
作者 尹宝生 孔维一 《计算机科学》 CSCD 北大核心 2024年第S01期223-228,共6页
事件检测是信息提取领域的一个重要研究方向。现存的事件检测模型受到语言模型训练目标的限制,只能被动地获取词与词之间的依赖关系,使得模型在训练的过程中过多地关注与训练目标不相关的成分,从而导致检测结果错误。以往的研究表明,充... 事件检测是信息提取领域的一个重要研究方向。现存的事件检测模型受到语言模型训练目标的限制,只能被动地获取词与词之间的依赖关系,使得模型在训练的过程中过多地关注与训练目标不相关的成分,从而导致检测结果错误。以往的研究表明,充分理解上下文信息对于基于深度学习的事件检测技术至关重要。因此,在Electra预训练模型的基础上,引入KVMN网络来捕捉单词之间的依赖关系,以增强单词的语义特征,并采用了一种门控机制来加权这些特征。然后,为了解决中文事件检测中模型识别错误决策的问题,在输入中加入负样本,对不同样本加入不同程度的噪声,使模型学习更好的嵌入表示,有效提高了模型对未知样本的泛化能力。最后,在公共数据集LEVEN上的实验结果表明,该方法优于现有方法,取得了93.43%的F1值。 展开更多
关键词 事件检测 依存关系 键值记忆网络 门控机制 负采样
在线阅读 下载PDF
融合标签知识的中文医学命名实体识别 被引量:2
14
作者 尹宝生 周澎 《计算机科学》 CSCD 北大核心 2024年第S01期128-134,共7页
医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学... 医学领域命名实体识别是信息抽取任务重要的研究内容之一,其训练数据主要来源于临床实验数据、健康档案、电子病历等非结构化文本,然而标注这些数据需要专业人员耗费大量人力、物力和时间资源。在缺乏大规模医学训练数据的情况下,医学领域命名实体识别模型很容易出现识别错误的情况。为解决这一难题,文中提出了一种融合标签知识的中文医学命名实体识别方法,即通过专业领域词典获得文本标签的释义后,分别将文本、标签及标签释义编码,基于自适应融合机制进行融合,有效平衡特征提取模块和语义增强模块的信息流,从而提高模型性能。其核心思想在于医学实体标签是通过总结归纳大量医学数据得到的,而标签释义是对标签进行科学解释和说明的结果,模型融入这些蕴含了丰富的医学领域内的先验知识,可以使其更准确地理解实体在医学领域中的语义并提升其识别效果。实验结果表明,该方法在中文医学实体抽取数据集(CMeEE-V2)3个基线模型上分别取得了0.71%,0.53%和1.17%的提升,并且为小样本场景下的实体识别提供了一个有效的解决方案。 展开更多
关键词 中文医学命名实体识别 标签知识 先验知识 自适应融合机制 小样本
在线阅读 下载PDF
图注意力网络与句法融合的医疗实体识别
15
作者 白宇 何佳蔚 张桂平 《中文信息学报》 CSCD 北大核心 2024年第9期108-116,共9页
电子病历数据中包含大量的医疗实体词,对这些实体词的自动识别有益于提升计算机对电子病历数据的理解。待识别的医疗实体词通常由医疗专业术语和非规范医疗词汇构成,大量生僻词汇、长难词汇和病历行文中的省略现象给医疗实体识别任务带... 电子病历数据中包含大量的医疗实体词,对这些实体词的自动识别有益于提升计算机对电子病历数据的理解。待识别的医疗实体词通常由医疗专业术语和非规范医疗词汇构成,大量生僻词汇、长难词汇和病历行文中的省略现象给医疗实体识别任务带来了挑战。针对以上问题,该文提出一种图注意力网络与句法融合的医疗实体识别方法,该方法结合字词共现关系和句法依存关系,基于电子病历数据构建了交互式字词关系图和依存关系图,并利用图注意力网络完成多种图信息的融合。实验结果表明,在电子病历的命名实体识别中,该文方法得到88.91%的F_(1)值,较基线模型提高1.04%,验证了该方法的有效性。 展开更多
关键词 电子病历 命名实体识别 图注意力网络
在线阅读 下载PDF
面向低资源场景的神经机器翻译方法 被引量:1
16
作者 胡朝东 叶娜 +1 位作者 张桂平 蔡东风 《中文信息学报》 CSCD 北大核心 2024年第6期58-66,共9页
神经机器翻译需要大规模的双语平行语料利用深度学习的方法构建翻译模型,但低资源场景下平行句对缺乏,导致训练的神经机器翻译模型效果较差。无监督神经机器翻译技术仅使用两种语言的单语数据,解决了神经机器翻译对大规模双语平行数据... 神经机器翻译需要大规模的双语平行语料利用深度学习的方法构建翻译模型,但低资源场景下平行句对缺乏,导致训练的神经机器翻译模型效果较差。无监督神经机器翻译技术仅使用两种语言的单语数据,解决了神经机器翻译对大规模双语平行数据的依赖问题。但是无监督神经机器翻译技术存在两个问题,一是对于句法建模能力欠缺;二是在低资源场景下存在的少量双语语料不能用于模型训练,造成双语语料资源浪费。为了解决上述问题,该文提出在无监督神经机器翻译中融合句法知识的方法,使模型可以充分学习句子的句法信息;同时引入少量双语平行语料辅助无监督神经机器翻译训练,使模型直接学习源语言与目标语言单词之间的转换。与基线模型相比较,在英-法和德-英单语新闻数据集上BLEU值分别提升了1.65和1.79。 展开更多
关键词 无监督神经机器翻译 句法知识 去噪自动编码器
在线阅读 下载PDF
基于网络嵌入和预训练模型的义原预测 被引量:1
17
作者 白宇 王之光 +1 位作者 刘懿萱 蔡东风 《计算机应用与软件》 北大核心 2024年第7期42-48,共7页
义原是构成《知网》概念描述的核心部件,义原预测是HowNet自动或半自动扩展中涉及的关键问题之一。提出一种基于网络嵌入和预训练模型的义原预测方法,通过对《知网》中的字-词-义项-义原及其关系的表示学习,融合预训练语言模型动态构建... 义原是构成《知网》概念描述的核心部件,义原预测是HowNet自动或半自动扩展中涉及的关键问题之一。提出一种基于网络嵌入和预训练模型的义原预测方法,通过对《知网》中的字-词-义项-义原及其关系的表示学习,融合预训练语言模型动态构建局部“义项-义原”关系网络,实现新概念与候选义原的动态匹配。实验结果中的义原预测F1值达到0.6237,表明该方法能够更有效地解决《知网》中未登录词的义原预测问题。 展开更多
关键词 义原 预训练语言模型 网络嵌入
在线阅读 下载PDF
面向新词义原推荐的相似性判别方法
18
作者 白宇 田雨 +1 位作者 王之光 张桂平 《中文信息学报》 CSCD 北大核心 2024年第1期36-44,共9页
义原(Sememe)是构成《知网》(HowNet)概念描述的核心部件,新词概念描述义原的推荐是HowNet自动或半自动扩展中涉及的关键问题。面向新词义原推荐,该文提出一种融合义原注意力的预训练语言模型优化方法——SaBERT。在判别新词与HowNet词... 义原(Sememe)是构成《知网》(HowNet)概念描述的核心部件,新词概念描述义原的推荐是HowNet自动或半自动扩展中涉及的关键问题。面向新词义原推荐,该文提出一种融合义原注意力的预训练语言模型优化方法——SaBERT。在判别新词与HowNet词表词之间的语义相似性的过程中,该方法利用词表词已知概念描述义原序列的注意力分布,以相似性同构为目标,对基于BERT+CNN的相似性判别模型进行优化,从而为义原推荐任务提供相似概念集合。实验结果表明,采用SaBERT可以有效解决未登录词与词表词的相似性判别问题,准确率、召回率、F1值分别达到0.8314、0.8007和0.8158。在基于协同过滤框架的义原推荐任务上进行的实验表明,相似性同构程度与义原推荐效果正相关,说明该文方法能够有效解决候选义原选择问题。 展开更多
关键词 义原推荐 相似性同构 知网
在线阅读 下载PDF
基于多核学习的装配工艺过程重用 被引量:6
19
作者 王裴岩 张桂平 +1 位作者 翟顺龙 蔡东风 《计算机集成制造系统》 EI CSCD 北大核心 2018年第7期1850-1857,共8页
为了最大程度复用历史工艺过程,提高工艺设计效率,对装配工艺过程重用问题进行了研究,提出了一种基于多核学习的方法。该方法利用了工艺规程名称、规程编号、设计人与装配零件表等直接获取特征,不需要人工确定特征的表达符号集与标注数... 为了最大程度复用历史工艺过程,提高工艺设计效率,对装配工艺过程重用问题进行了研究,提出了一种基于多核学习的方法。该方法利用了工艺规程名称、规程编号、设计人与装配零件表等直接获取特征,不需要人工确定特征的表达符号集与标注数据;通过定义多个核函数,从不同视角衡量工艺过程的可重用性,并利用工艺大纲文件间的重用度作为指导信息,优化多核组合参数。在47 828份飞机装配工艺规程数据上,多核学习方法能够有效地对工艺规程文件进行筛选与排序,能够保证排序靠前的结果具有较高的重用度,Top 1重用度可达0.3811。实验结果证明了规程文件命名规律、企业工艺文件管理规则、装配零件表等信息在工艺过程复用中的有效性。 展开更多
关键词 装配工艺过程重用 核函数 多核学习 飞机装配
在线阅读 下载PDF
一种融合用户主题兴趣与用户行为的文档推荐方法 被引量:8
20
作者 张桂平 翟顺龙 王裴岩 《中文信息学报》 CSCD 北大核心 2017年第3期147-155,共9页
针对单一角度描述用户兴趣存在片面性的问题,该文提出一种融合用户主题兴趣和用户行为的文档推荐方法。一方面从主题兴趣的角度,构建反映用户主题兴趣的主题向量用户模型;另一方面从用户行为的角度,构建反映用户行为兴趣的打分矩阵用户... 针对单一角度描述用户兴趣存在片面性的问题,该文提出一种融合用户主题兴趣和用户行为的文档推荐方法。一方面从主题兴趣的角度,构建反映用户主题兴趣的主题向量用户模型;另一方面从用户行为的角度,构建反映用户行为兴趣的打分矩阵用户模型。然后,基于上述用户模型提出了两种文档推荐方法,并采用线性加权的方式融合这两种方法,从而实现对用户主题兴趣与用户行为的融合。实验结果表明,该方法的推荐结果好于协同过滤推荐方法和基于内容的推荐方法。 展开更多
关键词 用户模型 主题兴趣 用户行为 文档推荐
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部