期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
新形势下国家重点实验室重组的差异分析与经验总结——以学科、企业、省部共建三类全国重点实验室为例 被引量:3
1
作者 姜涵 俞逸洋 +2 位作者 余强 赵海兴 邹国斌 《实验技术与管理》 CAS 北大核心 2024年第11期226-234,共9页
为了应对新形势下科技发展需求,国家正在重组优化实验室体系。该文首先从科技发展的五项关键要求(强化基础研究、促进产学研融合、培育创新人才、增强国际竞争力和服务国家战略)剖析了国家实验室体系的重要性,同时指出目前实验室体系存... 为了应对新形势下科技发展需求,国家正在重组优化实验室体系。该文首先从科技发展的五项关键要求(强化基础研究、促进产学研融合、培育创新人才、增强国际竞争力和服务国家战略)剖析了国家实验室体系的重要性,同时指出目前实验室体系存在学科滞后、创新不足、定位模糊、人才培养挑战及国际影响力待提升等问题。然后借鉴成功案例,强调了实验室明确定位、加强人才培养与平台建设、促进产学研合作的重要性。最后,通过分析学科、企业、省部共建三类实验室重组案例,旨在为正在重组的国家重点实验室提供借鉴,推动整体体系升级与发展。 展开更多
关键词 国家重点实验室重组 科技发展要求 战略科技力量 产学研合作
在线阅读 下载PDF
融合词典的BERT-BiGRU的藏语句子情感分类方法
2
作者 公确多杰 索南才让 才藏太 《计算机工程与设计》 北大核心 2025年第3期918-926,共9页
针对藏文情感分析研究中,由于藏文缺乏公开的情感词典和能结合上下文的深度学习模型等导致的分类效果欠佳问题,构建一个规模可观的藏文情感词典,结合基于改进的BERT-BiGRU的藏语句子情感分类方法,在哈工大开源的CINO多语言的通用预训练... 针对藏文情感分析研究中,由于藏文缺乏公开的情感词典和能结合上下文的深度学习模型等导致的分类效果欠佳问题,构建一个规模可观的藏文情感词典,结合基于改进的BERT-BiGRU的藏语句子情感分类方法,在哈工大开源的CINO多语言的通用预训练语言模型上进行微调。实验结果表明,本文方法能够有效提高情感分类的准确率,验证了方法的有效性。模型在分类准确率和泛化能力上的表现优于相关工作,为进一步研究藏文文本情感分类问题提供一种思路和实验证据。 展开更多
关键词 情感分类 情感词典 情感词汇本体库 BERT-BiGRU CINO 藏语句子 深度学习
在线阅读 下载PDF
基于藏文音节结合BiLSTM-CRF的藏语语义组块分类标注 被引量:1
3
作者 旦正吉 华却才让 +1 位作者 完么措 白颖 《高原科学研究》 CSCD 2024年第2期118-125,共8页
针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLST... 针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLSTM-CRF方法训练了藏语语义组块识别和分类模型。综合测试实验结果表明,该模型精确率为75.03%,召回率为76.52%,F1值为75.77%。各类语义组块识别中,指示类(INS)识别的测评结果远高于其他几类语义组块,精确率为90.87%;组织类(ORG)的测评结果偏低于其他类型,精确率为66.67%。文章研究证实了TS-BiLSTM-CRF模型在藏语语义组块识别分析任务中具有较好的性能。 展开更多
关键词 藏语 语义组块识别 TS-BiLSTM-CRF模型 标注规范
在线阅读 下载PDF
FGITA:一种基于细粒度对齐的多模态命名实体识别框架
4
作者 吕学强 王涛 +3 位作者 游新冬 赵海兴 才藏太 陈玉忠 《小型微型计算机系统》 北大核心 2025年第4期769-775,共7页
命名实体识别任务旨在识别出非结构化文本中所包含的实体并将其分配给预定义的实体类别中.随着互联网和社交媒体的发展,文本信息往往伴随着图像等视觉模态信息出现,传统的命名实体识别方法在多模态信息中表现不佳.近年来,多模态命名实... 命名实体识别任务旨在识别出非结构化文本中所包含的实体并将其分配给预定义的实体类别中.随着互联网和社交媒体的发展,文本信息往往伴随着图像等视觉模态信息出现,传统的命名实体识别方法在多模态信息中表现不佳.近年来,多模态命名实体识别任务广受重视.然而,现有的多模态命名实体识别方法中,存在跨模态知识间的细粒度对齐不足问题,文本表征会融合语义不相关的图像信息,进而引入噪声.为了解决这些问题,提出了一种基于细粒度图文对齐的多模态命名实体识别方法(FGITA:A Multi-Modal NER Frame based on Fine-Grained Image-Text Alignment).首先,该方法通过目标检测、语义相似性判断等,确定更为细粒度的文本实体和图像子对象之间的语义相关性;其次,通过双线性注意力机制,计算出图像子对象与实体的相关性权重,并依据权重将子对象信息融入到实体表征中;最后,提出了一种跨模态对比学习方法,依据图像和实体之间的匹配程度,优化实体和图像在嵌入空间中的距离,借此帮助实体表征学习相关的图像信息.在两个公开数据集上的实验表明,FGITA优于5个主流多模态命名实体识别方法,验证了方法的有效性,同时验证了细粒度跨模态对齐在多模态命名实体识别任务中的重要性和优越性. 展开更多
关键词 多模态 命名实体识别 信息抽取 知识图谱 对比学习
在线阅读 下载PDF
基于区域特征的Transformer混合结构图像藏文描述模型
5
作者 周子琦 黄鹤鸣 +2 位作者 才让当知 夏吾吉 达飞鹏 《中文信息学报》 北大核心 2025年第1期37-46,55,共11页
端到端的Transformer模型在中、英文图像描述数据集上取得了良好的效果,但其巨大的训练数据需求使其在规模较小的藏文数据集上效果并不理想。针对此问题,该文基于编码器—解码器架构的基线模型,引入目标检测网络和自注意力机制以替换CNN... 端到端的Transformer模型在中、英文图像描述数据集上取得了良好的效果,但其巨大的训练数据需求使其在规模较小的藏文数据集上效果并不理想。针对此问题,该文基于编码器—解码器架构的基线模型,引入目标检测网络和自注意力机制以替换CNN和LSTM,提出基于区域特征的Transformer混合结构模型ReT。首先,该模型将Faster-RCNN提取的图像区域特征作为Transformer编码器的输入,将经过向量化后的文本序列特征作为Transformer解码器的输入;其次,Transformer编码器和解码器各自利用自注意力机制对输入向量进行加权;最后,Transformer解码器中的交叉自注意力机制根据文本特征对图像特征进行加权,并以此生成描述。实验表明,在Flickr8k-Ti数据集上以藏文音节为基本单元进行模型的训练和验证时,相比基线模型和端到端的Transformer模型,模型ReT在CIDEr指标上分别提升10.4%和5.3%,取得了更好的效果。 展开更多
关键词 图像藏文描述 藏文音节 Faster-RCNN TRANSFORMER
在线阅读 下载PDF
一种近似图神经网络框架的无监督链路预测算法 被引量:1
6
作者 李格格 冶忠林 +2 位作者 曹淑娟 周琳 王雪力 《郑州大学学报(工学版)》 CAS 北大核心 2024年第6期75-82,共8页
对于无标签网络,由于基于图神经网络的链路预测方法使用其高效建模机制进行链路预测任务时性能较差,因此,提出了一种近似图神经网络框架的无监督链路预测算法(ALIP),旨在模拟图神经网络算法的高效建模机制和学习过程,解决网络节点标签... 对于无标签网络,由于基于图神经网络的链路预测方法使用其高效建模机制进行链路预测任务时性能较差,因此,提出了一种近似图神经网络框架的无监督链路预测算法(ALIP),旨在模拟图神经网络算法的高效建模机制和学习过程,解决网络节点标签缺失导致的建模不充分问题。首先,参照GCN的输入层,融合网络的结构信息和节点属性;其次,使用矩阵分解替代GCN的隐藏层,模拟正向传播;再次,借鉴恒等映射和高阶近邻的思想实现向量转化和模型优化,从而得出网络节点表示向量,该过程模拟GCN的反向传播;最后,计算相似度矩阵,进行链路预测任务性能评测。在Citeseer数据集、DBLP数据集和Cora数据集上的实验结果表明:所提ALIP算法AUC值最高为98.01%,其性能优于其他23种链路预测算法,证明了该算法的有效性和可行性,同时也为无标签的复杂网络链路预测任务提供了一种新的解决方案。 展开更多
关键词 矩阵分解 向量优化 图卷积神经网络 相似度矩阵 链路预测 高阶近邻
在线阅读 下载PDF
基于深度学习的梵藏文本识别
7
作者 才让叁智 仁增多杰 +1 位作者 多拉 索南尖措 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期1059-1066,共8页
[目的]梵藏文本识别是自动排序、词法分析和自动校对等研究的重要前期工作环节.当前基于规则的梵藏文本识别方法中存在无法有效识别短梵文词语等诸多问题.[方法]在自建的梵藏文本识别数据集上,采用基于双向长短时记忆网络和自注意力的... [目的]梵藏文本识别是自动排序、词法分析和自动校对等研究的重要前期工作环节.当前基于规则的梵藏文本识别方法中存在无法有效识别短梵文词语等诸多问题.[方法]在自建的梵藏文本识别数据集上,采用基于双向长短时记忆网络和自注意力的梵藏文本识别方法、基于预训练语言模型CINO的梵藏文本识别方法和基于规则的梵藏文本识别方法之间进行实验对比,并分析它们的识别结果,进而选出最优的梵藏文本识别方法.[结果]基于双向长短时记忆网络和自注意力机制的梵藏文本识别模型的宏准确率、召回率和F1值分别达到了98.09%、99.22%和98.65%,其效果优于多语言预训练模型CINO和其他3种基于规则的方法.[结论]基于skip-gram、CBOW和GloVe的藏文字符表示模型使用相同的小规模、无重样的训练数据集时,CBOW的字符表示效果优于其他两者;训练数据相同的情况下,基于双向长短时记忆网络和自注意力机制的梵藏文本识别模型优于多语言预训练模型CINO,同时,也优于基于规则的梵藏文本识别模型. 展开更多
关键词 藏文信息处理 梵藏文本识别 字符表示 STTRM_BS模型
在线阅读 下载PDF
基于藏文音节的图像标题自动生成方法研究 被引量:1
8
作者 华却才让 白颖 +2 位作者 周子琦 才让当知 完么措 《高原科学研究》 CSCD 2024年第3期102-109,共8页
图像标题生成在人机交互、多媒体搜索以及图像自动标注等领域具有广泛的应用前景。文章提出基于藏文音节的图像标题生成方法。首先,Encoder将输入的图像数据通过多层残差卷积层提取图像特征;其次,通过Attention机制来准确获取Encoder中... 图像标题生成在人机交互、多媒体搜索以及图像自动标注等领域具有广泛的应用前景。文章提出基于藏文音节的图像标题生成方法。首先,Encoder将输入的图像数据通过多层残差卷积层提取图像特征;其次,通过Attention机制来准确获取Encoder中的特征向量,进行加权求和,增强特征提取;最后,采用LSTM的解码器对藏文音节特征向量进行解码,生成图像标题。该方法在Flickr8K测试集上和Flickr30K测试集上BLEU_4值分别达到了20.6和24.4,比紧缩格的切分方法分别提高了2.3和4.2。生成的标题语言表达流畅,符合语法规则,能较好地描述图像的核心意义。 展开更多
关键词 图像 标题 藏文音节 注意力机制
在线阅读 下载PDF
藏文自动排序研究综述
9
作者 才让叁智 仁青东主 +2 位作者 多拉 洛桑嘎登 仁增多杰 《高原科学研究》 CSCD 2024年第2期106-117,共12页
藏文自动排序是藏语自然语言处理领域一项重要的基础研究工作,在词典编纂、信息检索和日常办公等方面具有重要的应用价值。藏文特殊的二维非线性组合方式、词法规则和词典排序规则使得藏文自动排序比其他语种的排序更加复杂。文章对已... 藏文自动排序是藏语自然语言处理领域一项重要的基础研究工作,在词典编纂、信息检索和日常办公等方面具有重要的应用价值。藏文特殊的二维非线性组合方式、词法规则和词典排序规则使得藏文自动排序比其他语种的排序更加复杂。文章对已有研究提出的藏文自动排序方法、规则、算法和模型等进行了较为全面的分析与总结,为研究人员了解藏文自动排序中的构件识别、排序规则和方法以及优化藏文自动排序相关工作提供参考。 展开更多
关键词 藏文自动排序 字符优先级 结构优先级 构件比较顺序
在线阅读 下载PDF
基于K-shell的超网络关键节点识别方法 被引量:14
10
作者 周丽娜 李发旭 +1 位作者 巩云超 胡枫 《复杂系统与复杂性科学》 CAS CSCD 北大核心 2021年第3期15-22,共8页
将K-shell指标扩展到超网络中,避免了超网络中超度较大、但位于超网络边缘位置的节点对挖掘关键节点带来的影响。由于K-shell方法的局限性,导致节点排序结果过于粗糙。针对这一问题,结合超度和K-shell(ks)值利用欧式距离公式提出识别超... 将K-shell指标扩展到超网络中,避免了超网络中超度较大、但位于超网络边缘位置的节点对挖掘关键节点带来的影响。由于K-shell方法的局限性,导致节点排序结果过于粗糙。针对这一问题,结合超度和K-shell(ks)值利用欧式距离公式提出识别超网络关键节点的k^(d)_(s)指标,并利用蛋白复合物超网络进行验证。实验证明,k^(d)_(s)指标能够准确有效地识别超网络中的关键节点。 展开更多
关键词 超图 超网络 关键节点 K-shell分解 k^(d)_(s)
在线阅读 下载PDF
基于平移约束的异质超网络表示学习 被引量:2
11
作者 刘贞国 朱宇 +2 位作者 赵海兴 王晓英 黄建强 《中文信息学报》 CSCD 北大核心 2022年第12期74-84,共11页
与仅具有节点成对关系的普通网络不同,超网络的节点之间还存在复杂的元组关系,即,超边。而现有的大多数网络表示学习方法不能有效地捕获复杂的元组关系。针对上述问题,该文提出一种基于平移约束的异质超网络表示学习方法(HRTC)。首先,... 与仅具有节点成对关系的普通网络不同,超网络的节点之间还存在复杂的元组关系,即,超边。而现有的大多数网络表示学习方法不能有效地捕获复杂的元组关系。针对上述问题,该文提出一种基于平移约束的异质超网络表示学习方法(HRTC)。首先,该方法结合团扩展和星型扩展将抽象为超图的异质超网络转换为抽象为2-截图+关联图的异质网络。然后,提出一种感知节点语义相关性的元路径游走方法来捕获节点之间的语义关系。最后,在训练节点成对关系的同时,通过引入知识表示学习中的平移机制来捕获节点之间的元组关系。实验结果表明,对于链接预测任务,该方法的性能接近于其他最优基线方法;对于超网络重建任务,当超边重建比率大于0.6时,该方法在drug数据集上的性能优于其他最优基线方法,同时该方法在GPS数据集上的平均性能超过其他最优基线方法16.24%。 展开更多
关键词 网络表示学习 超网络结构 平移约束 链接预测 超网络重建
在线阅读 下载PDF
基于并行卷积循环网络的单通道语音增强系统 被引量:5
12
作者 李鑫元 黄鹤鸣 《计算机工程与设计》 北大核心 2023年第4期1181-1188,共8页
为提升语音增强系统的收敛速度和泛化性,降低对训练数据的要求,提出一种基于并行卷积循环网络的语音增强系统。在卷积循环网络的基础上,使用归一化门控线性单元提升性能和收敛速度;使用并行循环层结构同时处理原始语音特征和经过编码器... 为提升语音增强系统的收敛速度和泛化性,降低对训练数据的要求,提出一种基于并行卷积循环网络的语音增强系统。在卷积循环网络的基础上,使用归一化门控线性单元提升性能和收敛速度;使用并行循环层结构同时处理原始语音特征和经过编码器处理后的语音特征,通过后处理模块处理并行结构的输出。在THCHS30和LibriSpeech语音库及NOISEX92和PNL100 NS噪声库上的实验结果表明,与多个目前最先进的语音增强系统相比,该方法获得了最高36.92%的性能提升和62.36%的收敛速度提升。 展开更多
关键词 语音增强 单通道语音增强 深度学习 卷积循环网络 并行网络 门控线性单元 低资源训练
在线阅读 下载PDF
基于音节切分的藏文印刷体识别 被引量:5
13
作者 才让当知 华却才让 黄鹤鸣 《计算机工程与设计》 北大核心 2022年第9期2594-2600,共7页
为解决藏文印刷体标注数据库资源稀少和藏文图像文本分割难度大等问题,提出一种基于音节切分的藏文体印刷体识别方法。以字符面积最小为依据,找到音节分隔符;合并音节分隔符之间的字丁,构成音节;按音节位置进行分割,经实验分割准确率提... 为解决藏文印刷体标注数据库资源稀少和藏文图像文本分割难度大等问题,提出一种基于音节切分的藏文体印刷体识别方法。以字符面积最小为依据,找到音节分隔符;合并音节分隔符之间的字丁,构成音节;按音节位置进行分割,经实验分割准确率提升3.92个百分点。为验证选择音节的有效性,在同一结构的LetNet-5网络模型上进行测试,实验结果表明,以音节为单元时识别性能更优,其平均识别正确率达96.11%。 展开更多
关键词 藏文印刷体识别 音节切分 字丁切分 文本分割 卷积神经网络
在线阅读 下载PDF
基于熵的多属性决策超网络重要节点识别方法 被引量:3
14
作者 吴英晗 李明达 胡枫 《复杂系统与复杂性科学》 CAS CSCD 北大核心 2023年第4期40-46,共7页
为克服单一属性评价节点重要性不全面以及各指标权重选取过于主观的不足,基于超网络的K-shell方法,综合考虑节点自身属性的同时,引入邻居节点对自身节点的影响力,结合介数中心性,使用熵权法确定各指标的贡献权重,从局部和全局两个角度... 为克服单一属性评价节点重要性不全面以及各指标权重选取过于主观的不足,基于超网络的K-shell方法,综合考虑节点自身属性的同时,引入邻居节点对自身节点的影响力,结合介数中心性,使用熵权法确定各指标的贡献权重,从局部和全局两个角度提出了识别超网络中重要节点的方法。通过网络自然连通度和最大连通子图的相对大小比较不同识别方法的优劣,并利用西宁市公交超网络实证数据进一步验证了所提方法的有效性。 展开更多
关键词 超图 超网络 节点重要性 多属性决策 熵权法
在线阅读 下载PDF
基于词典注入的藏汉机器翻译模型预训练方法 被引量:2
15
作者 桑杰端珠 才让加 《中文信息学报》 CSCD 北大核心 2023年第8期43-51,共9页
近年来,预训练方法在自然语言处理领域引起了广泛关注,但是在比如藏汉机器翻译等低资源的任务设定下,由于双语监督信息无法直接参与预训练,限制了预训练模型在此类任务上的性能改进。考虑到双语词典是丰富且廉价的先验翻译知识来源,同... 近年来,预训练方法在自然语言处理领域引起了广泛关注,但是在比如藏汉机器翻译等低资源的任务设定下,由于双语监督信息无法直接参与预训练,限制了预训练模型在此类任务上的性能改进。考虑到双语词典是丰富且廉价的先验翻译知识来源,同时受到跨语言交流中人们往往会使用混合语言增加沟通效率这一现象启发,该文提出一种基于词典注入的藏汉机器翻译模型的预训练方法,为预训练提供学习双语知识关联的广泛可能。经验证,该方法在藏汉和汉藏翻译方向测试集上的BLEU值比BART强基准分别高出2.3和2.1,证实了该文所提出的方法在藏汉机器翻译任务上的有效性。 展开更多
关键词 藏汉 机器翻译 预训练 词典注入
在线阅读 下载PDF
TASSM_BS:基于Bi-LSTM和Self-Attention的藏文自动分句方法 被引量:2
16
作者 才让叁智 多拉 +2 位作者 格桑多吉 洛桑嘎登 仁增多杰 《中文信息学报》 CSCD 北大核心 2023年第5期44-52,共9页
自动分句在自然语言处理中具有重要的应用价值,是机器翻译、句法分析和语义分析等任务的重要前期工作环节。当前藏文自动分句中采用的基于词典的分句方法,以及基于词典和统计模型相结合的分句方法因受句尾词兼类现象和数据稀疏等问题的... 自动分句在自然语言处理中具有重要的应用价值,是机器翻译、句法分析和语义分析等任务的重要前期工作环节。当前藏文自动分句中采用的基于词典的分句方法,以及基于词典和统计模型相结合的分句方法因受句尾词兼类现象和数据稀疏等问题的影响,分句效率较低。对此,该文提出了一种基于Bi-LSTM和Self-Attention的藏文自动分句方法。通过实验对比,该方法的宏准确率、宏召回率和宏F1值分别到达了97.7%、98.06%和97.88%,其结果优于所有对比方法。另外,在实验过程中还发现,当模型使用序列前端截补方式定长的数据时,其性能优于使用后端截补方式定长的数据;当模型使用基于Skip-gram的音节字表示时,其性能优于基于CBOW和随机生成的音节字表示。 展开更多
关键词 藏文句子 分句 TSRM_BS模型
在线阅读 下载PDF
贫语言资源条件下藏文分句数据集构建研究 被引量:1
17
作者 才让叁智 多拉 《高原科学研究》 CSCD 2022年第4期85-94,共10页
基于深度学习的藏文自动分句研究中构建分句数据集,事关藏文分句模型性能和质量。鉴于现有的藏文自动分句数据稀缺问题,文章通过梳理藏文句法结构,提出了位于句末的谓语动词和谓语形容词,以及终结虚词和离合虚词可充当句尾标识符号的观... 基于深度学习的藏文自动分句研究中构建分句数据集,事关藏文分句模型性能和质量。鉴于现有的藏文自动分句数据稀缺问题,文章通过梳理藏文句法结构,提出了位于句末的谓语动词和谓语形容词,以及终结虚词和离合虚词可充当句尾标识符号的观点,并通过相关语料库构建了谓语形容词词典、谓语动词词典和句尾虚词词典,最终使用句尾词匹对方法成功从语料中切分出了40万条句子,解决了藏文分句数据集建构问题,为基于深度学习的藏文分句研究提供了可靠和较大规模的数据基础。 展开更多
关键词 藏文 句子 藏文垂符 分句数据集
在线阅读 下载PDF
藏文字典编纂中同音字“■”与“■”的义项分解
18
作者 冷本扎西 尕藏扎西 多拉 《西藏大学学报(社会科学版)》 CSSCI 北大核心 2022年第1期73-82,共10页
藏语同音字“■”与“■”的正字问题和字典义项分解一直是学界争议的焦点。文章通过语料库、文献、正字书及词典四个领域对两个同音字的历时使用及分布进行了计量研究和语义转移的认知解析,归纳了“■”的九个义项及“■”的四个义项,... 藏语同音字“■”与“■”的正字问题和字典义项分解一直是学界争议的焦点。文章通过语料库、文献、正字书及词典四个领域对两个同音字的历时使用及分布进行了计量研究和语义转移的认知解析,归纳了“■”的九个义项及“■”的四个义项,并得出二者不能混用的结论。同时,认为字典中同音字及多义词的义项概括和分解应依照“义点展示,义系排列,义项分解”的程序,结合微观义点显示和宏观义系把握来进行分解。 展开更多
关键词 字典编纂 藏文字典 同音字 疑难字
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部