期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于数据增强和损失平衡的机电领域命名实体识别 被引量:2
1
作者 林娜 岳希 唐聃 《计算机工程与应用》 北大核心 2025年第7期222-232,共11页
机电领域命名实体识别是机电创新设计信息检索最基础的过程。目前命名实体识别任务的数据在机电领域较少,且大部分存在不平衡问题。通过构建机电领域命名实体识别数据集,根据数据集文本结构特点设计多维数据增强方法,并提出基于改进los... 机电领域命名实体识别是机电创新设计信息检索最基础的过程。目前命名实体识别任务的数据在机电领域较少,且大部分存在不平衡问题。通过构建机电领域命名实体识别数据集,根据数据集文本结构特点设计多维数据增强方法,并提出基于改进loss的命名实体识别模型BERT-BiGRU-CRF(BL)。对互联网机电领域文本语料进行爬取并进行标注构成机电领域命名实体识别数据集;根据不同方式对数据集的影响从同类实体替换、同义词替换、语料裁减和语料拼接四个方面进行多维数据增强后按一定比例进行数据扩充增加数据丰富度;针对数据集数据不平衡问题设计使用Weigh loss平衡focal loss与CRF loss权重的模型,该模型采用BERT进行词向量编码,利用BiGRU完成文本向量的特征提取,使用CRF进行标签约束与解码。经实验证明,多维数据增强方法对模型效果有显著提升,并且经过改进的模型在原始和增强后数据集上表现均为最优,F1值分别为78.23%和83.3%。 展开更多
关键词 机电领域 命名实体识别 数据增强 focal loss Weigh loss
在线阅读 下载PDF
存储系统中低修复成本的局部修复阵列码
2
作者 唐金华 黄鹃 +4 位作者 杨洋 唐聃 蔡红亮 余洪州 熊攀 《计算机应用研究》 北大核心 2025年第9期2765-2771,共7页
在大规模分布式存储系统的广泛应用背景下,传统容错编码方案在单盘和双盘故障修复过程中面临读取资源消耗高、修复效率不足等技术难题,提出一种具有局部修复特性的混合校验编码方案——VC-code(vertical central symmetric code)。VC-c... 在大规模分布式存储系统的广泛应用背景下,传统容错编码方案在单盘和双盘故障修复过程中面临读取资源消耗高、修复效率不足等技术难题,提出一种具有局部修复特性的混合校验编码方案——VC-code(vertical central symmetric code)。VC-code通过融合横纵式阵列码的快速修复与负载均衡特性,设计了一种局部水平校验与对角校验交叉融合的结构,并采用纵向中心对称校验布局优化数据依赖关系。该设计将单盘和双盘故障修复的数据读取量显著降低,同时通过缩短修复链提升整体效率。理论分析表明,在单双盘故障恢复时大幅降低了数据读取开销。实验结果进一步验证了其性能优势,与RDP码、LRRDP码以及DRDP码相比,VC-code在单盘故障修复时间上减少了10.45%~29.57%,在双盘故障修复时间上减少了6.35%~33.24%。 展开更多
关键词 分布式存储系统 阵列码 局部修复 负载均衡 读取开销
在线阅读 下载PDF
改进TransCenter的组合距离多目标跟踪方法
3
作者 赵海涛 岳希 +1 位作者 唐聃 蔡博 《计算机工程与应用》 北大核心 2025年第9期177-185,共9页
在智能驾驶和视频监控领域中,多目标跟踪被广泛应用,但在目标发生遮挡和非线性运动时,此时产生的噪声会造成检测和跟踪精度的降低,同时众多关联匹配算法也没有考虑到IoU和外观失衡的情况。针对以上问题,提出一种基于TransCenter改进的... 在智能驾驶和视频监控领域中,多目标跟踪被广泛应用,但在目标发生遮挡和非线性运动时,此时产生的噪声会造成检测和跟踪精度的降低,同时众多关联匹配算法也没有考虑到IoU和外观失衡的情况。针对以上问题,提出一种基于TransCenter改进的多目标跟踪网络。引用小波变换处理检测特征,设计了上下文协同选择器,通过动态选择跟踪特征和检测特征来缓解噪声产生的负面影响;融合卡尔曼滤波预测值和跟踪位移,以提高非线性运动中的预测位移准确度;根据IoU距离和外观距离的差值优化组合距离的权重,解决了高速运动和外观剧烈变化时组合距离失效的情况。在BDD100k、DanceTrack数据集上进行了实验,结果表明,与ByteTrack算法相比,改进网络的mMOTA和HOTA值分别提升了4.3和5.9个百分点,与TransCenter相比,HOTA提升了7.4个百分点,且有着更好的灵活性和跟踪精度。 展开更多
关键词 多目标跟踪 卡尔曼滤波 上下文协同 组合距离
在线阅读 下载PDF
基于双条带编码结构的低修复成本分组修复码
4
作者 余洪州 杨洋 +3 位作者 唐金华 黄鹃 唐聃 蔡红亮 《计算机应用研究》 北大核心 2025年第9期2772-2778,共7页
针对分布式存储系统中纠删码容错技术因修复成本过高制约其实际应用的问题,提出一种具有分组修复性质的双条带分组修复码模型(DSGRC)。该模型创新性地设计了基于双条带编码结构的分组修复架构,通过双条带混合编码策略构建全局与局部校... 针对分布式存储系统中纠删码容错技术因修复成本过高制约其实际应用的问题,提出一种具有分组修复性质的双条带分组修复码模型(DSGRC)。该模型创新性地设计了基于双条带编码结构的分组修复架构,通过双条带混合编码策略构建全局与局部校验块的多级冗余结构,在确保数据可靠性的前提下优化故障修复过程。实验结果表明,相较于传统RS码、RGRC、TLRC、SLRC以及CSLRC等编码方案,DSGRC仅需增加少量的存储开销,即可实现将单节点故障修复时间降低10.4%~67.7%、多节点故障修复时间缩减5.4%~51.1%。 展开更多
关键词 分布式存储系统 低修复成本 分组修复码 数据修复
在线阅读 下载PDF
低修复成本的局部混合修复阵列码模型
5
作者 王宇恒 熊攀 +1 位作者 唐聃 蔡红亮 《计算机应用研究》 北大核心 2025年第1期222-230,共9页
具有局部修复性质的水平阵列码将编码矩阵进行分区管理,降低磁盘发生故障时需要读取的数据总量并提升修复效率,但仍存在修复时读写负载集中于单个磁盘的问题。针对局部水平阵列码磁盘读写不均和单双盘修复效率有待提升的问题,结合水平... 具有局部修复性质的水平阵列码将编码矩阵进行分区管理,降低磁盘发生故障时需要读取的数据总量并提升修复效率,但仍存在修复时读写负载集中于单个磁盘的问题。针对局部水平阵列码磁盘读写不均和单双盘修复效率有待提升的问题,结合水平阵列码和垂直阵列码的特点,对其进行局部冗余改造,提出一种具有局部修复性质的混合式阵列码修复模型——LHRC。LHRC根据垂直阵列码的思想将局部水平阵列码的对角校验列迁移至矩阵的中间行,加深数据块与校验块之间的联系,分散读写负载至其他磁盘并减少参与修复的数据总量。通过理论分析,LHRC具有良好的编译码复杂度,改善了磁盘修复时读写不均匀的问题并减少单双盘故障时需要读取的数据总量,提升了三盘故障的修复成功率。实验结果表明LHRC与RDP、LRRDP、DRDP相比,LHRC可将单盘故障修复时间节省3.92%~29.91%、双盘故障修复时间节省7.79%~30.64%。 展开更多
关键词 阵列码 存储系统 局部修复 读取开销
在线阅读 下载PDF
新的图像加密方法 被引量:4
6
作者 唐聃 王晓京 陈峥 《电子科技大学学报》 EI CAS CSCD 北大核心 2010年第1期128-132,共5页
针对数字图像信息数据量大、冗余度高和像素间相关性强等特点,提出了一种基于二元多项式的图像加密新方法。在对图像的加密过程中,该方法使用另一幅图像作为密钥,使得密钥形象直观且伪装性强,而密钥图像的尺寸可以远远小于加密图像,便... 针对数字图像信息数据量大、冗余度高和像素间相关性强等特点,提出了一种基于二元多项式的图像加密新方法。在对图像的加密过程中,该方法使用另一幅图像作为密钥,使得密钥形象直观且伪装性强,而密钥图像的尺寸可以远远小于加密图像,便于保存。因加密的大部分步骤中只用到了有限域的加法运算,因此该算法的加密效率较高。该加密方法不仅有安全性高和便于图像的局部加密等优点,还可以方便地推广到视频的图像加密领域,具有很好的应用前景。 展开更多
关键词 二元多项式 编码 有限域 图像叠加 图像处理
在线阅读 下载PDF
基于多斜率码链的阵列纠删码 被引量:3
7
作者 唐聃 杨昊澎 王福超 《计算机应用》 CSCD 北大核心 2017年第4期936-940,共5页
针对当前大多阵列纠删码容错能力偏低以及构造时需要满足的约束条件较强的问题,提出一类基于码链构造的阵列纠删码。该阵列纠删码使用不同斜率码链组织数据元素和校验元素间的关系,从而能达到理论上不受限制的容错能力;而在构造时避开... 针对当前大多阵列纠删码容错能力偏低以及构造时需要满足的约束条件较强的问题,提出一类基于码链构造的阵列纠删码。该阵列纠删码使用不同斜率码链组织数据元素和校验元素间的关系,从而能达到理论上不受限制的容错能力;而在构造时避开了类似素数约束的强约束条件,易于实用和扩展。仿真实验结果表明,相对于RS(Reed-Solomon)码,基于多斜率码链阵列纠删码在运算效率上的提升超过了2个数量级;在固定的容错能力下,存储效率能随着条块尺寸的增加而提高。此外,该类阵列码的修复代价和更新代价为一个固定常量,不会随着系统规模的扩大或容错能力的提高而增加。 展开更多
关键词 阵列纠删码 容错 码链 条块尺寸
在线阅读 下载PDF
基于二元多项式的秘密分享技术研究 被引量:2
8
作者 唐聃 舒红平 《计算机应用与软件》 CSCD 北大核心 2012年第7期112-114,共3页
当前大多数秘密分享方案的设计沿用了经典Shamir方案的实现思路,即基于一元多项式的(k,n)门限方案。此类方案继承了Shamir方案的诸多优点,如思路简洁便于实现、兼有完备性(Perfect)和理想性(Ideal)等。然而,这一类方案也有着准入结构不... 当前大多数秘密分享方案的设计沿用了经典Shamir方案的实现思路,即基于一元多项式的(k,n)门限方案。此类方案继承了Shamir方案的诸多优点,如思路简洁便于实现、兼有完备性(Perfect)和理想性(Ideal)等。然而,这一类方案也有着准入结构不够丰富的缺陷,极大地限制了秘密分享技术在实际应用中的推广。针对这一情况,提出一种基于二元多项式的秘密分享方案,该方案兼有Shamir方案的诸多优点,而准入结构又得到了极大的丰富。此外,新方案很容易推广到图像秘密分享、音频秘密分享等领域。 展开更多
关键词 信息安全 秘密分享 二元多项式 准入结构 范德蒙行列式
在线阅读 下载PDF
基于编码理论的图像秘密分享技术研究 被引量:2
9
作者 唐聃 王晓京 《计算机应用与软件》 CSCD 北大核心 2013年第9期141-146,共6页
图像的秘密分享是信息安全技术领域具有独特吸引力的研究问题。经过近20年的发展,图像秘密分享已经发展成为一个相对独立的技术领域,但却远没有达到完善的程度。当前大多数图像秘密分享方案均采用了Shamir方案的拉格朗日插值法作为分享... 图像的秘密分享是信息安全技术领域具有独特吸引力的研究问题。经过近20年的发展,图像秘密分享已经发展成为一个相对独立的技术领域,但却远没有达到完善的程度。当前大多数图像秘密分享方案均采用了Shamir方案的拉格朗日插值法作为分享方案的核心思想,但是这对于数据量巨大的图像而言无疑会大大降低计算的效率和系统的实用性。基于编码和秘密分享的内在联系,提出一种基于编码技术的图像秘密分享方案。除了具备大多数基于拉格朗日插值法图像秘密分享方案的优点外,新方案算法复杂度显著降低且具有思路简单、容易实现和便于扩展到视频音频领域等特点,有着更加明显的实用价值;此外,基于编码的图像秘密分享系统的实现也从一个侧面证实了编码与秘密分享在本质上的联系。 展开更多
关键词 图像秘密分享 编码 拉格朗日插值多项式 有限域
在线阅读 下载PDF
流水车间调度问题的启发式算法研究 被引量:1
10
作者 唐聃 黄健 《电子科技大学学报》 EI CAS CSCD 北大核心 2013年第6期921-925,共5页
针对以完工时间最小为目标的流水车间调度问题,对问题的定义进行了全新的推导和分析,从数学的角度进一步挖掘出问题的本质特征。在控制第一台机器和最后一个工件加工时间的基础上,尽量压缩每个工件在加工前的等待时间,以提高算法的实际... 针对以完工时间最小为目标的流水车间调度问题,对问题的定义进行了全新的推导和分析,从数学的角度进一步挖掘出问题的本质特征。在控制第一台机器和最后一个工件加工时间的基础上,尽量压缩每个工件在加工前的等待时间,以提高算法的实际效果。模拟实验的结果表明,新的启发式算法具有很好的性能,使用新算法计算得到的调度序列平均质量以及算法本身的稳定性方面均明显优于与之具有相当算法复杂度的其他启发式算法。 展开更多
关键词 流水车间 启发式算法 完工时间 生产调度
在线阅读 下载PDF
误码校正码在信息隐藏中的应用 被引量:1
11
作者 唐聃 王玲 《计算机应用与软件》 CSCD 北大核心 2008年第2期275-277,共3页
在信息隐藏技术不断发展的过程中,隐藏分析技术也在不断地进步,信息隐藏的分析和攻击者们发现:在对某个载体对象嵌入秘密信息后,载体对象的某些特征会发生改变,当这种改变达到某种程度时就可以确定某个载体对象中含有秘密信息。因此,在... 在信息隐藏技术不断发展的过程中,隐藏分析技术也在不断地进步,信息隐藏的分析和攻击者们发现:在对某个载体对象嵌入秘密信息后,载体对象的某些特征会发生改变,当这种改变达到某种程度时就可以确定某个载体对象中含有秘密信息。因此,在设计一个信息隐藏算法时应尽量考虑减少由于秘密信息的嵌入而带来的载体对象某种特征的改变程度。简要介绍了误码校正码及信息隐藏的概念,并提出了一种在信息隐藏的过程中引入误码校正码来减小载体对象在隐藏信息前后差异的方法。 展开更多
关键词 信息隐藏 误码校正码 特征分析
在线阅读 下载PDF
RS类纠删码的译码方法 被引量:2
12
作者 唐聃 蔡红亮 耿微 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期582-596,共15页
RS(Reed-Solomon)码可以根据应用环境构造出任意容错能力的码字,有很好的灵活性,且使用RS纠删码作为容错方法的存储系统能达到理论最优的存储效率.但是,与异或(exclusive-OR,XOR)类纠删码相比,RS类纠删码译码计算的时间开销过大,这又很... RS(Reed-Solomon)码可以根据应用环境构造出任意容错能力的码字,有很好的灵活性,且使用RS纠删码作为容错方法的存储系统能达到理论最优的存储效率.但是,与异或(exclusive-OR,XOR)类纠删码相比,RS类纠删码译码计算的时间开销过大,这又很大程度上阻碍了它在分布式存储系统中的使用.针对这一问题,提出了一类RS纠删码的译码方法,该方法完全抛弃了当前大多RS类纠删码译码方法中普遍使用的矩阵求逆运算,仅使用计算复杂度更小的加法和乘法,通过构造译码变换矩阵并在此矩阵上执行相应的简单的矩阵变换,能够直接得出失效码元由有效码元组成的线性组合关系,从而降低译码计算复杂度.最后,通过理论证明了该方法的正确性,并且针对每种不同大小的文件,进行3种不同大小文件块的划分,将划分得到的数据块进行实验,实验结果表明:在不同的文件分块大小情况下,该新译码方法较其他方法的译码时间开销更低. 展开更多
关键词 RS码 纠删码 译码 数据重构 修复成本
在线阅读 下载PDF
影子不可窜改的图像秘密分享技术研究
13
作者 唐聃 杨洋 刘怡 《计算机应用研究》 CSCD 北大核心 2017年第6期1805-1808,共4页
为了使得影子具有更好的伪装性,普遍的方法是选择一定数量的掩盖图像,然后在大体不影响掩盖图像视觉效果的前提下将份额缩小嵌入其中并作为最终的影子图像。这样的做法为攻击者从影子图像中提取原始的份额数据留下了隐患。针对这一问题... 为了使得影子具有更好的伪装性,普遍的方法是选择一定数量的掩盖图像,然后在大体不影响掩盖图像视觉效果的前提下将份额缩小嵌入其中并作为最终的影子图像。这样的做法为攻击者从影子图像中提取原始的份额数据留下了隐患。针对这一问题,提出了一种新的图像秘密分享方案,其最大的特点是掩盖图像不再只简单作为份额数据的嵌入载体,而是参与影子图像生成及秘密图像重构等过程所涉及的所有运算。任意像素点被修改过的影子图像都无法参与秘密图像的有效重构,能在计算安全层面上有效提高图像秘密分享系统的安全性。 展开更多
关键词 图像秘密分享 掩盖图像 计算安全性
在线阅读 下载PDF
基于编码的秘密重构方法研究
14
作者 唐聃 舒红平 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第1期91-95,共5页
当前大多基于编码实现的(k,n)门限秘密分享方案在秘密重构时均假定只存在k个份额,忽略了秘密重构时可用份额数量多于门限值k的情况。而实验证明,多余的份额如果合理利用可以极大地降低秘密重构的运算量。在基于秘密分享的实用系统运行... 当前大多基于编码实现的(k,n)门限秘密分享方案在秘密重构时均假定只存在k个份额,忽略了秘密重构时可用份额数量多于门限值k的情况。而实验证明,多余的份额如果合理利用可以极大地降低秘密重构的运算量。在基于秘密分享的实用系统运行过程中,特别是网络数据传输或分布式存储系统中,可用份额数量大于门限值k的情况又是经常出现的。针对这一问题,该文提出了一种新的秘密重构方法,该方法可以有效利用秘密重构时所有的可用份额,且计算效率与当前主流方法相比有较大的提升。 展开更多
关键词 编码 秘密重构 秘密分享 门限
在线阅读 下载PDF
基于数据稀疏性的协同过滤推荐算法改进研究 被引量:34
15
作者 岳希 唐聃 +1 位作者 舒红平 安义文 《工程科学与技术》 EI CAS CSCD 北大核心 2020年第1期198-202,共5页
针对根据用户的活动行为向其推荐感兴趣项目的协同过滤推荐算法,随着用户数量和项目数量增多,用户在单一项目上的活动行为减少,导致推荐质量不佳的问题,本文提出了在数据稀疏的情况下提高推荐质量的优化算法。将基于项目和基于用户的推... 针对根据用户的活动行为向其推荐感兴趣项目的协同过滤推荐算法,随着用户数量和项目数量增多,用户在单一项目上的活动行为减少,导致推荐质量不佳的问题,本文提出了在数据稀疏的情况下提高推荐质量的优化算法。将基于项目和基于用户的推荐方法相结合,根据用户之间的相似度初步预测用户对项目的评分,再基于项目之间的相似度产生推荐;在填补未评分的空缺值时,将平均值与预测值相结合;在计算相似度时,考虑用户之间共同评分的项目数权重和项目之间被用户共同评分的用户数权重。实验首先对比了几种基本推荐算法的推荐效果以选取较佳的基本算法进行研究,接着将本文提出的优化算法与其他算法进行了对比,最后不同程度地增加数据稀疏性进一步进行对比。结果表明:在优化算法的实验中,本文提出的优化算法一直具有较好的推荐效果;在数据稀疏性改变的实验中,随着数据稀疏度的增大,本文提出的优化算法推荐效果更具有明显优势。 展开更多
关键词 稀疏性 推荐算法 相似度 优化
在线阅读 下载PDF
级联式低消耗大规模网页分类在线获取方法 被引量:3
16
作者 王亚强 汤铭 +2 位作者 曾沁 唐聃 舒红平 《计算机应用》 CSCD 北大核心 2017年第4期924-927,935,共5页
针对海量网页在线自动高效获取网页分类系统设计中如何更有效地平衡准确度与资源开销之间的矛盾问题,提出一种基于级联式分类器的网页分类方法。该方法利用级联策略,将在线与离线网页分类方法结合,各取所长。级联分类系统的一级分类采... 针对海量网页在线自动高效获取网页分类系统设计中如何更有效地平衡准确度与资源开销之间的矛盾问题,提出一种基于级联式分类器的网页分类方法。该方法利用级联策略,将在线与离线网页分类方法结合,各取所长。级联分类系统的一级分类采用在线分类方法,仅利用锚文本中网页标题包含的特征预测其分类,同时计算分类结果的置信度,分类结果的置信度由分类后验概率分布的信息熵度量。若置信度高于阈值(该阈值采用多目标粒子群优化算法预先计算取得),则触发二级分类器。二级分类器从下载的网页正文中提取特征,利用预先基于网页正文特征训练的分类器进行离线分类。结果表明,相对于单独的在线法和离线法,级联分类系统的F1值分别提升了10.85%和4.57%,并且级联分类系统的效率比在线法未降低很多(30%左右),而比离线法的效率提升了约70%。级联式分类系统不仅具有更高的分类能力,而且显著地减少了分类的计算开销与带宽消耗。 展开更多
关键词 大规模网页数据获取 网页分类 级联分类器 置信度函数 多目标粒子群优化
在线阅读 下载PDF
基于视觉密码的无线网络远程身份认证 被引量:3
17
作者 曹晟 陈峥 +1 位作者 崔喆 唐聃 《计算机应用》 CSCD 北大核心 2008年第B06期39-42,共4页
在分析现有无线网络安全性的基础上,提出利用视觉密码技术提高无线网络远程身份认证安全性的方法。以一张图像作为母图,并将母图信息分散的隐藏在多个子图中。利用伪随机数发生器与原始公钥产生新的公钥,从而使得母图具有一次一密的特点... 在分析现有无线网络安全性的基础上,提出利用视觉密码技术提高无线网络远程身份认证安全性的方法。以一张图像作为母图,并将母图信息分散的隐藏在多个子图中。利用伪随机数发生器与原始公钥产生新的公钥,从而使得母图具有一次一密的特点,同时采用密钥组关联保证通信的同步性。 展开更多
关键词 视觉密码 无线网络 身份认证
在线阅读 下载PDF
基于有限域的音频秘密分享方案研究
18
作者 朱艳丽 唐聃 《河南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第5期165-167,共3页
提出一种基于有限域的音频秘密分享方案,抛弃传统秘密分享中使用拉格朗日插值多项式的方法,极大提高音频数据的分享效率.测试结果表明该方案能完全实现(k,n)门限的设置,各个份额数据具有清晰的听觉意义和完备性,并能对秘密音频数据进行... 提出一种基于有限域的音频秘密分享方案,抛弃传统秘密分享中使用拉格朗日插值多项式的方法,极大提高音频数据的分享效率.测试结果表明该方案能完全实现(k,n)门限的设置,各个份额数据具有清晰的听觉意义和完备性,并能对秘密音频数据进行完全精确的恢复. 展开更多
关键词 音频 秘密分享 编码 有限域运算 门限
在线阅读 下载PDF
基于粗糙集理论的不完备数据分析方法的混合信息系统填补算法 被引量:12
19
作者 彭莉 张海清 +3 位作者 李代伟 唐聃 于曦 何磊 《计算机应用》 CSCD 北大核心 2021年第3期677-685,共9页
为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数表达)、缺失型属性的混合信息系统(HIS)数据的填补能力,提出了一种基于粗糙集理论的混合信息系统缺失值填... 为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数表达)、缺失型属性的混合信息系统(HIS)数据的填补能力,提出了一种基于粗糙集理论的混合信息系统缺失值填补方法(RSHISMIA)。首先,根据决策属性等价类划分思想并按照决策属性对混合信息系统HIS进行划分,解决了填补后可能出现的决策规则冲突问题;其次,定义混合距离矩阵来合理量化对象间的相似性,从而筛选出具有填补能力的样本并克服ROUSTIDA无法处理连续性属性的缺点;然后,结合近邻思想解决了ROUSTIDA在无差别对象属性值发生冲突情况下无法对相同属性缺失数据进行填补的问题。最后,使用10个UCI标准数据集进行实验,将所提出的方法与ROUSTIDA、K近邻填补(KNNI)算法、随机森林填补(RFI)算法和矩阵分解(MF)等几种经典算法进行了比较。实验结果表明,与ROUSTIDA相比,所提方法在查全率上平均高出81%,在查准率上提升了5%~53%,且其归一化均方根误差(NRMSE)最多减小了0.12。此外,所提方法的分类准确率与ROUSTIDA相比平均提升了7%,且优于KNNI、RFI及MF等填补算法。 展开更多
关键词 基于粗糙集理论的不完备数据分析方法 混合信息系统 缺失值填补 混合距离 最近邻
在线阅读 下载PDF
基于神经网络的医疗文本分类研究 被引量:14
20
作者 许浪 李代伟 +3 位作者 张海清 唐聃 何磊 于曦 《计算机工程与科学》 CSCD 北大核心 2023年第6期1116-1122,共7页
传统的医学文本数据分类方法忽略了文本的上下文关系,每个词之间相互独立,无法表示语义信息,文本描述和分类效果差;并且特征工程需要人工干预,因此泛化能力不强。针对医疗文本数据分类效率低和精度低的问题,提出了一种基于Transformer... 传统的医学文本数据分类方法忽略了文本的上下文关系,每个词之间相互独立,无法表示语义信息,文本描述和分类效果差;并且特征工程需要人工干预,因此泛化能力不强。针对医疗文本数据分类效率低和精度低的问题,提出了一种基于Transformer双向编码器表示BERT、卷积神经网络CNN和双向长短期记忆BiLSTM神经网络的医学文本分类模型CMNN。该模型使用BERT训练词向量,结合CNN和BiLSTM,捕捉局部潜在特征和上下文信息。最后,将CMNN模型与传统的深度学习模型TextCNN和TextRNN在准确率、精确率、召回率和F1值方面进行了比较。实验结果表明,CMNN模型在所有评价指标上整体优于其他模型,准确率提高了1.69%~5.91%。 展开更多
关键词 自然语言处理 医疗文本分类 BERT CNN BiLSTM
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部