期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
藏文句向量预训练模型在嵌入式系统中的应用研究
1
作者 吕皓 吕慧 +4 位作者 雍宾宾 多拉 李妍 周庆国 周睿 《小型微型计算机系统》 北大核心 2025年第1期8-15,共8页
本文研究了将藏文句向量预训练模型部署到嵌入式系统上进行推理和测试的问题.在机器学习中,对文本进行编码和表征存在困难,因此句向量技术成为自然语言处理领域的重要研究方向.然而,在藏文自然语言处理领域,句向量研究相对较少.为此,本... 本文研究了将藏文句向量预训练模型部署到嵌入式系统上进行推理和测试的问题.在机器学习中,对文本进行编码和表征存在困难,因此句向量技术成为自然语言处理领域的重要研究方向.然而,在藏文自然语言处理领域,句向量研究相对较少.为此,本文分析了藏文领域已有的预训练模型和句向量表示方法,并设计了一种改进的无监督SimCSE方法(Improved Simple Contrastive Learning of Unsupervised Sentence Embeddings,I-SimCSE).实验结果显示,使用I-SimCSE方法得到的藏文句向量模型性能优于其他方法.同时,本文探讨了边缘计算与预训练模型相结合的应用,并讨论了预训练语言模型在嵌入式系统上的潜在应用场景.最后,本文将I-SimCSE句向量模型部署在嵌入式设备Jetson TX1上,并测试了其平均单次推理时间,结果表明在嵌入式系统上部署预训练语言模型进行推理是可行的.综上所述,本文的研究对于藏文句向量预训练模型在嵌入式系统上的应用研究提供了有益的参考,并为未来藏文大模型在嵌入式系统的发展提供了指导和启示. 展开更多
关键词 藏文 句向量表示 嵌入式系统 预训练模型
在线阅读 下载PDF
泛函映射及其在非刚性三维形状对应领域应用综述
2
作者 王宁 张丹 +3 位作者 徐辰昊 宋美华 张建鹏 彭泉鸿 《计算机工程与应用》 CSCD 北大核心 2024年第24期20-43,共24页
随着三维形状研究的不断发展,非刚性三维形状对应的问题变得愈加重要,这一问题的应用涵盖了计算机图形学、计算机视觉和模式识别等多个领域。泛函映射框架在非刚性三维形状对应中取得了先进的效果,其能够捕捉形状之间的复杂关系,对非刚... 随着三维形状研究的不断发展,非刚性三维形状对应的问题变得愈加重要,这一问题的应用涵盖了计算机图形学、计算机视觉和模式识别等多个领域。泛函映射框架在非刚性三维形状对应中取得了先进的效果,其能够捕捉形状之间的复杂关系,对非刚性形状的拓扑噪声具有鲁棒性。说明了三维形状对应的基本概念以及其研究方向;阐述了泛函映射的基本框架;在此基础上系统地梳理了相关领域内的经典工作,包括传统泛函映射方法和深度泛函映射方法,突出说明了不同方法在处理非刚性形状对应上的优势和局限性;介绍了非刚性三维形状对应领域常用的数据集,对不同方法进行了实验对比与分析;对非刚性三维形状对应的发展趋势进行了展望。 展开更多
关键词 非刚性三维形状 形状对应 泛函映射 拉普拉斯-贝尔特拉米算子
在线阅读 下载PDF
基于规则的藏文音节纠正算法
3
作者 普尺 吕慧 +2 位作者 李妍 多拉 周庆国 《中文信息学报》 北大核心 2025年第1期28-36,共9页
藏文语料库的质量是影响藏文信息处理的重要因素。通过分析藏文音节拼写规则,该文构建了针对藏文规则音节和非规则音节拼写检查的音节规则库和非规则音节字典(包括未登录词音译、本体藏文和梵音转写),并基于此提出基于规则的藏文音节纠... 藏文语料库的质量是影响藏文信息处理的重要因素。通过分析藏文音节拼写规则,该文构建了针对藏文规则音节和非规则音节拼写检查的音节规则库和非规则音节字典(包括未登录词音译、本体藏文和梵音转写),并基于此提出基于规则的藏文音节纠正算法。该算法利用音节规则库和非规则音节字典对识别后的藏文音节进行拼写检查,通过规则音节构件组合规则来实现藏文音节纠正。实验结果表明,该文提出的藏文规则音节和非规则音节拼写检查算法的F_(1)值达到100%,而规则音节纠正算法的宏平均准确率达到80.43%。 展开更多
关键词 语料库 藏文音节 拼写检查 音节纠正
在线阅读 下载PDF
WSN中基于聚类树的负载平衡算法
4
作者 许瀚 童英华 《计算机工程与设计》 北大核心 2025年第6期1640-1647,共8页
针对无线传感网络在实际应用中网络能耗不均匀、传感器节点容易失效以及网络生命周期短的问题,提出一种基于聚类树的负载平衡算法(load balancing algorithm based on cluster tree, LBACT)。基于聚类树将网络中的节点划分为多层结构,... 针对无线传感网络在实际应用中网络能耗不均匀、传感器节点容易失效以及网络生命周期短的问题,提出一种基于聚类树的负载平衡算法(load balancing algorithm based on cluster tree, LBACT)。基于聚类树将网络中的节点划分为多层结构,通过立即转发机制降低聚类树的高度;使用平衡算法对构造的聚类树进行多轮次负载平衡,在汇聚节点的控制下,通过每个节点多次运行负载平衡算法,使网络中的节点负载平衡。仿真结果表明,相比LEACH(low-energy adaptive clustering hierarchy)和CBSHA(component based self-healing approach),提出的算法能够有效均衡节点能耗,延长网络的稳定期、生命周期,提高网络的吞吐量。 展开更多
关键词 无线传感网络 容错 聚类树 能耗均衡 负载平衡 网络结构 生命周期
在线阅读 下载PDF
基于数据驱动的WSN故障检测框架
5
作者 许瀚 童英华 《计算机应用研究》 北大核心 2025年第6期1815-1821,共7页
WSN节点通常部署在复杂的工作环境中,传感器节点故障不可避免,为了实时检测WSN中的故障,提出了一种数据驱动的故障检测框架。通过对无线传感网络运行初期采集的数据进行过滤和收集,使用过滤后的数据构造用于故障检测模型训练的数据集,... WSN节点通常部署在复杂的工作环境中,传感器节点故障不可避免,为了实时检测WSN中的故障,提出了一种数据驱动的故障检测框架。通过对无线传感网络运行初期采集的数据进行过滤和收集,使用过滤后的数据构造用于故障检测模型训练的数据集,提高模型的检测精度。通过划分时间窗口,使故障诊断模型检测最新时间窗口内的传感器故障,并且恢复其中的异常数据,使用处理后的数据集重新训练模型以检测下一个窗口的故障。通过循环训练和检测,实现检测模型的实时更新以提高模型的检测性能。实验结果表明,相比经典检测模型和最新的机器学习检测模型,在不同类型的故障数据集上,检测精确度、准确度等指标均有提升,且时间复杂度更低。因此,框架具有较好的检测性能,能够更好地适应动态变化的WSN环境。 展开更多
关键词 无线传感网络 容错 故障检测 机器学习 数据驱动 数据插值
在线阅读 下载PDF
空天地一体化网络的无人机轨迹和计算卸载联合优化
6
作者 陈奕天 童英华 《计算机科学》 北大核心 2025年第4期74-84,共11页
空天地一体化网络作为一种新兴的网络架构,近年来引起了广大研究者的关注,它能够很好地提高网络整体的服务质量。针对偏远地区的网络覆盖不全面,缺乏基本的网络基础设施的问题,提出了一种无人机和卫星共同收集任务的偏远地区空天地一体... 空天地一体化网络作为一种新兴的网络架构,近年来引起了广大研究者的关注,它能够很好地提高网络整体的服务质量。针对偏远地区的网络覆盖不全面,缺乏基本的网络基础设施的问题,提出了一种无人机和卫星共同收集任务的偏远地区空天地一体化网络框架,其中无人机与卫星为地面传感器提供边缘计算服务,云服务器为地面传感器提供云服务。由于无人机覆盖率、任务完成率和任务延迟都是影响系统性能的关键因素,因此对无人机轨迹和计算卸载进行联合优化,最大化无人机覆盖率和任务完成率,并且降低延迟。由于所提出的联合优化问题是一个混合非线性规划问题,因此设计了基于白鲸优化算法和沙猫群优化算法的双层优化算法,两层分别对无人机轨迹和计算卸载进行优化。实验结果表明,所提算法显著提高了多个无人机的覆盖率,且在计算卸载中有效提高了任务完成率,降低了任务的平均延迟。 展开更多
关键词 空天地一体化网络 无人机 边缘计算 无人机轨迹 计算卸载
在线阅读 下载PDF
融合依存句法的深度学习藏语句子分割研究
7
作者 头旦才让 仁青东主 +2 位作者 尼玛扎西 完么扎西 才藏太 《中文信息学报》 CSCD 北大核心 2022年第10期73-80,共8页
藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列... 藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征,提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F_(1)值为99.4%。 展开更多
关键词 藏语 依存句法 双向LSTM+CRF 句子分割
在线阅读 下载PDF
面向高维流数据的离群值检测算法
8
作者 梁昌好 童英华 冯忠岭 《计算机工程与设计》 北大核心 2024年第5期1406-1412,共7页
累计局部离群因子(cumulative local outlier factor,C_LOF)算法能有效解决数据流中的概念漂移问题和克服离群点检测中的伪装问题,但在处理高维数据时,时间复杂度较高。为有效解决时间复杂度高的问题,提出一种基于投影索引近邻的累计局... 累计局部离群因子(cumulative local outlier factor,C_LOF)算法能有效解决数据流中的概念漂移问题和克服离群点检测中的伪装问题,但在处理高维数据时,时间复杂度较高。为有效解决时间复杂度高的问题,提出一种基于投影索引近邻的累计局部离群因子(cumulative local outlier factor based projection indexed nearest neighbor,PINN_C_LOF)算法。使用滑动窗口维护活跃数据点,在新数据到达和旧数据过期时,引入投影索引近邻(projection indexed nearest neighbor,PINN)方法,增量更新窗口中受影响数据点的近邻。实验结果表明,PINN_C_LOF算法在检测高维流数据离群值时,在保持检测精确度的前提下,其时间复杂度较C_LOF算法明显降低。 展开更多
关键词 高维流数据 离群值检测 累计局部离群因子 时间复杂度 投影索引近邻 局部离群因子 物联网
在线阅读 下载PDF
基于格序列的藏语句法成分标注数据集构建方法研究
9
作者 尕藏扎西 冷本扎西 多拉 《高原科学研究》 2023年第4期95-105,共11页
在藏语自然语言处理研究中,藏语数据资源严重稀缺,基于大数据驱动的句法研究范式尚不可行,且目前还未构建公开可用的句法成分标注库,藏语句法成分标注数据集成为攻克深层句法分析及自然语言理解的关键制约。文章通过计算语言学、藏语格... 在藏语自然语言处理研究中,藏语数据资源严重稀缺,基于大数据驱动的句法研究范式尚不可行,且目前还未构建公开可用的句法成分标注库,藏语句法成分标注数据集成为攻克深层句法分析及自然语言理解的关键制约。文章通过计算语言学、藏语格语法等多学科方法,研究格序列标记对藏语句法结构的制约和标识功能;再进行形式化描述,最终制定一套以格标记语义功能为主要依据,以谓词等其他形式标记为辅助依据的藏语句法成分标注数据集构建方法。在藏语单、双谓语句及多谓语句、通格结构类复杂句型中开放测试显示,avg_total方案的精确率、召回率、F1值分别达到87.08%、75.36%、80.69%。 展开更多
关键词 藏语 格助词 句法标注 句法成分
在线阅读 下载PDF
基于MARS和概率规划的离群值检测算法
10
作者 王瑞豪 童英华 冯忠岭 《计算机工程与设计》 北大核心 2023年第9期2694-2699,共6页
为提高物联网数据质量,提出一种基于MARS模型和概率规划的多变量离群值检测方法。该方法能够将多个变量结合起来,通过一个模型检测离群值。创建一个多元自适应回归样条模型产生研究化的残差,将残差作为输入,采用概率规划方法,建立基于... 为提高物联网数据质量,提出一种基于MARS模型和概率规划的多变量离群值检测方法。该方法能够将多个变量结合起来,通过一个模型检测离群值。创建一个多元自适应回归样条模型产生研究化的残差,将残差作为输入,采用概率规划方法,建立基于全贝叶斯推理的一般单变量离群点检测模型。实验结果表明,概率规划模型能检测出更准确的离群点,该模型提供了具有可信区间的概率分布。 展开更多
关键词 物联网 数据质量 多元自适应回归模型 离群值 概率规划 多元离群点检测 贝叶斯
在线阅读 下载PDF
基于Rcnn+Char_SegNet的藏文乌梅长文本识别
11
作者 才让当知 黄鹤鸣 +1 位作者 李鑫元 张会云 《中文信息学报》 北大核心 2023年第12期62-69,75,共9页
藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文... 藏文文字识别在藏文古籍文献、藏文办公自动化以及藏汉双语教育等领域具有非常重要的应用价值。作为两种常见的藏文字体之一,乌梅字体中笔画粘连和交错现象严重,导致识别难度较大。为此,该文提出了基于Rcnn+Char_SegNet的藏文乌梅长文本识别。首先,在CNN的每个卷积层中添加循环连接,增强CNN提取乌梅字粘连片段的特征和集成上下文信息的能力;其次,对提取的图像文本特征序列采用BiLSTM进行建模;最后,采用字丁切分模块增强CTC对图像序列和标签对齐的监督能力。在自行构建的Cursive Script-C517测试数据集上,该模型的最高准确率和平均准确率分别达到了99.80%和91.43%,分别比基线提高了1.45和48.47个百分点。此外,通过字符级词典库训练,使模型的训练时间减少了13.63%。实验表明,该方法有效解决了乌梅字体中笔画粘连和交错现象严重导致的识别错误问题,显著提升了印刷体藏文乌梅识别精度,减少了训练时间,且具有较好的鲁棒性。 展开更多
关键词 循环卷积神经网络 印刷体藏文识别 图像序列识别 印刷体藏文乌梅识别 藏文字丁切分
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部