期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
面向长尾异构数据的个性化联邦学习框架
1
作者 吴家皋 易婧 +1 位作者 周泽辉 刘林峰 《计算机科学》 北大核心 2025年第9期232-240,共9页
针对数据长尾分布和异构性引起的联邦学习模型性能下降的问题,提出了一种新的个性化联邦学习框架——平衡的个性化联邦学习(Balanced Personalized Federated Learning,BPFed),将整个联邦学习过程分为基于个性化联邦学习的表示学习和基... 针对数据长尾分布和异构性引起的联邦学习模型性能下降的问题,提出了一种新的个性化联邦学习框架——平衡的个性化联邦学习(Balanced Personalized Federated Learning,BPFed),将整个联邦学习过程分为基于个性化联邦学习的表示学习和基于全局特征增强的个性化分类器再训练两个阶段。在第一阶段,首先采用Mixup策略进行数据增强,然后提出基于参数解耦的个性化联邦学习特征提取器训练方法,在优化特征提取器性能的同时减少通信开销;在第二阶段,首先提出新的基于全局协方差矩阵的类级特征增强方法,然后提出基于样本权重的标签平滑损失函数对客户端分类器进行平衡的个性化再训练,以纠正头类置信过度并提高尾类的泛化能力。大量的实验结果表明,在不同的数据长尾分布和异构性设置下,BPFed模型的准确度相比其他代表性相关算法均有明显提升。此外,消融和超参数影响实验也进一步验证了所提方法和优化策略的有效性。 展开更多
关键词 个性化联邦学习 长尾分布 数据异构性 参数解耦 特征增强 优化策略
在线阅读 下载PDF
一种基于节点映射关系的云数据安全代理访问机制 被引量:6
2
作者 李华康 刘盼 +1 位作者 杨一涛 孙国梓 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第4期304-310,共7页
随着移动终端多媒体技术的发展,用户逐渐将本地数据通过各种网络备份到云存储服务器上.云平台在提供廉价便捷的数据存储服务的同时也存在数据安全防护问题,尤其是密文数据访问控制完全依赖于云服务商.为了防止数据被非授权用户和半可信... 随着移动终端多媒体技术的发展,用户逐渐将本地数据通过各种网络备份到云存储服务器上.云平台在提供廉价便捷的数据存储服务的同时也存在数据安全防护问题,尤其是密文数据访问控制完全依赖于云服务商.为了防止数据被非授权用户和半可信云存储提供商的非法访问,提出一种基于节点映射关系的CP-ABE属性加密算法,即通过属性管理降低权限管理的复杂度.在密文访问控制机制中引入密钥授权中心和安全代理实现存储服务与安全服务异地存储,保证在开放环境下云存储系统中数据的安全性.实验结果表明,这种属性管理机制在少量的系统开销下实现了数据存储与密钥存储的分离,具有较高的应用价值. 展开更多
关键词 云存储 安全代理 属性加密 CP-ABE 节点映射
在线阅读 下载PDF
一种自适应的网格化联邦学习客户端调度算法 被引量:1
3
作者 吴家皋 蒋宇栋 刘林峰 《南京邮电大学学报(自然科学版)》 北大核心 2025年第1期79-89,共11页
针对联邦学习(Federated Learning,FL)系统异构性而导致的训练性能下降问题,提出了一种自适应的网格化联邦学习客户端调度算法。首先,全面考虑FL的异构性特点,将3种异构性分别定义为3个独立的维度,包括训练速度、数据量和数据分布维度,... 针对联邦学习(Federated Learning,FL)系统异构性而导致的训练性能下降问题,提出了一种自适应的网格化联邦学习客户端调度算法。首先,全面考虑FL的异构性特点,将3种异构性分别定义为3个独立的维度,包括训练速度、数据量和数据分布维度,提出了一种新的FL客户端三维网格模型,并将所有客户端分配到该模型中相应的单元格内,以对其进行分类管理。在此基础上,为了克服传统启发式算法的不足,提出了一种基于多臂老虎机的网格化客户端调度算法,该算法能自适应地选择模型精度较低的单元格中的客户端子集参与每轮的FL训练,以改善客户端选择的公平性。仿真实验表明,与几种相关的最新FL算法相比,所提出的算法能显著提高模型精度,同时减少训练时间,从而验证了其有效性。 展开更多
关键词 联邦学习 异构性 三维网格 客户端选择 多臂老虎机
在线阅读 下载PDF
基于自适应噪声与混合注意力的联邦学习异常检测
4
作者 许建 任义 +2 位作者 周浩 戴华 杨庚 《南京邮电大学学报(自然科学版)》 北大核心 2025年第5期74-84,共11页
现有基于联邦学习架构的分布式异常检测难以兼顾异常检测性能与数据隐私保护。为此,提出了一种基于自适应噪声与混合注意力机制的联邦学习异常检测模型。该模型以卷积神经网络为基础,通过融合空间与多头的混合注意力机制对复杂特征进行... 现有基于联邦学习架构的分布式异常检测难以兼顾异常检测性能与数据隐私保护。为此,提出了一种基于自适应噪声与混合注意力机制的联邦学习异常检测模型。该模型以卷积神经网络为基础,通过融合空间与多头的混合注意力机制对复杂特征进行多维度、深层次提取,实现高精度的异常检测。其次,基于本地和中心化差分隐私,通过自适应噪声添加与隐私预算分配,进一步提高了模型的隐私性和鲁棒性。基于公开数据集NSL‑KDD及UNSW‑NB15对模型进行了实验验证。实验结果表明,与现有主流方案相比,该模型能够在保证用户数据隐私性的同时,实现更高质量的异常检测。 展开更多
关键词 联邦学习 异常检测 隐私保护 自适应噪声 混合注意力机制
在线阅读 下载PDF
面向异构移动可充电设备的最大返岗时间最小化无线充电调度
5
作者 徐佳 刘婧怡 +1 位作者 徐力杰 刘林峰 《计算机科学》 北大核心 2025年第10期336-347,共12页
随着无线可充电设备的广泛应用,无线功率传输技术成为提高设备续航能力的关键技术。然而,目前大部分研究工作聚焦于优化充电效率、充电成本等充电本身的性能,任务驱动的充电调度的研究尚不充分;另外,大部分充电系统假设充电器或可充电... 随着无线可充电设备的广泛应用,无线功率传输技术成为提高设备续航能力的关键技术。然而,目前大部分研究工作聚焦于优化充电效率、充电成本等充电本身的性能,任务驱动的充电调度的研究尚不充分;另外,大部分充电系统假设充电器或可充电设备是同构的;进一步地,现有工作对移动可充电设备的充电调度问题关注较少。针对实际情况中可充电设备的异构性,提出了异构无线充电模型,形式化了异构无线可充电传感网中的移动可充电设备最大返岗时间最小化问题。首先,在忽略设备移动时间和移动能耗的前提下,研究了简化的最大返岗时间最小化问题,并提出了一个近似算法。为解决具有更大难度的最大返岗时间最小化问题,基于该近似算法的思想,提出了一个启发式算法。大量模拟实验和实物实验的结果表明,所提出的算法相对于其他算法有显著优势,可以减少最多38.78%的设备最大返岗时间。 展开更多
关键词 无线可充电传感网 移动可充电设备 充电调度 异构无线充电 启发式算法
在线阅读 下载PDF
电动出租车充电桩租借模型及其成本优化
6
作者 徐佳 张毅铭 +1 位作者 陈文斌 俞欣仕 《计算机科学》 北大核心 2025年第3期366-376,共11页
近年来,家用电动汽车激增,电动出租车需要与家用电动汽车竞争使用公共充电桩,降低了其充电效率。为此,提出了一种面向电动出租车的充电桩租借模式,通过租借分布广泛的公共充电桩作为临时专用充电桩来满足出租车的充电需求。该模式能降... 近年来,家用电动汽车激增,电动出租车需要与家用电动汽车竞争使用公共充电桩,降低了其充电效率。为此,提出了一种面向电动出租车的充电桩租借模式,通过租借分布广泛的公共充电桩作为临时专用充电桩来满足出租车的充电需求。该模式能降低充电桩建设成本,为电动出租车提供优先充电服务,缓解电动出租车与家用电动汽车的充电竞争。提出了两种电动出租车充电桩租借成本模型。首先,形式化了以最小化总充电成本为目标的基于任务数的充电分配问题,提出了基于任务数的充电分配算法,并从理论上证明了算法的近似度。进一步地,形式化了基于充电完成时间的充电分配问题,并提出了基于充电完成时间的充电分配算法。基于真实数据集的仿真结果表明,与基准算法相比,基于任务数的充电分配算法最多可以减少16.15%的充电成本,基于充电完成时间的充电分配算法最多可以减少17.49%的充电成本。 展开更多
关键词 电动出租车 充电桩租借 租借价格 充电成本 设施选址问题
在线阅读 下载PDF
以服务满意度为目标的车载边缘计算调度优化 被引量:1
7
作者 徐佳 范露露 +1 位作者 刘婧怡 申佳胤 《小型微型计算机系统》 北大核心 2025年第5期1216-1223,共8页
随着5G网络的快速发展和物联网技术的普及,计算密集型和延迟敏感型应用蓬勃发展.传统移动边缘计算通常依赖固定基础设施进行计算卸载.然而,在实际应用中,由于用户的移动性、资源需求动态性和地域差异性,边缘服务器的负载表现出高动态性... 随着5G网络的快速发展和物联网技术的普及,计算密集型和延迟敏感型应用蓬勃发展.传统移动边缘计算通常依赖固定基础设施进行计算卸载.然而,在实际应用中,由于用户的移动性、资源需求动态性和地域差异性,边缘服务器的负载表现出高动态性和不平衡性.本文提出由运营商统一调度车载边缘服务器为区域提供计算卸载服务,形式化了区域满意度最大化问题,在行驶时间的限制下,最大化所有区域的满意度.将问题转变为一个拟阵约束下的子模函数最大化问题,利用近似算法对该问题进行求解,并从理论上证明了该算法的近似度.仿真实验结果表明,本文提出的算法具有较优的性能,相比对比算法,平均满意度提高了52.98%. 展开更多
关键词 移动边缘计算 车载边缘计算 计算卸载 近似算法
在线阅读 下载PDF
基于道格拉斯-普克算法的路网轨迹学习索引结构
8
作者 缪祝青 韩京宇 +3 位作者 李彩云 王彦之 毛毅 张怡婷 《计算机科学》 北大核心 2025年第8期136-145,共10页
近年来,基于位置服务的技术迅猛发展,产生了海量的路网轨迹数据。而路径范围查询作为一种路网轨迹查询类型,是支持其他查询类型的基础。为了实现对海量路网轨迹数据的高效索引,同时提供精确的路径范围查询服务,提出了一种基于道格拉斯-... 近年来,基于位置服务的技术迅猛发展,产生了海量的路网轨迹数据。而路径范围查询作为一种路网轨迹查询类型,是支持其他查询类型的基础。为了实现对海量路网轨迹数据的高效索引,同时提供精确的路径范围查询服务,提出了一种基于道格拉斯-普克算法的学习型索引结构(Douglas-Peuker Based Learned Index Structure,DPLI)。首先将轨迹数据分为多个轨迹段,然后取轨迹段中的点作为轨迹数据的表征,利用映射函数将其映射为一维映射值序列,而后根据键值数量将其划分为多个数据分片。在分片内将首尾数据组成一条线段,然后计算其余数据点距离线段的拟合误差,将超过误差阈值的数据点作为新的线段端点,递归分割原有的直线段,直到所有数据点的拟合误差小于阈值,从而拟合分段线性函数。采用多个路网数据和轨迹数据进行了充分的实验,实验结果表明:与传统索引方法相比,DPLI具有更快的构建效率和磁盘访问效率;与学习索引方法相比,DPLI保持了构建效率的优势,并且达到了100%查询召回率。 展开更多
关键词 位置服务 路网轨迹 学习型索引 范围查询 道格拉斯-普克算法
在线阅读 下载PDF
基于无锁数据结构的FIFO队列算法 被引量:8
9
作者 王俊昌 王振 付雄 《计算机工程》 CAS CSCD 北大核心 2018年第8期315-320,共6页
现代商用多核处理器缺少硬件支持的处理核间通信机制,多个处理核间必须通过加锁保护的共享内存传递数据。为此,设计一种基于软件的无锁队列作为核间通信机制,通过无锁数据结构提高软件队列的性能。当数据到达速率较低时,队列自适应地减... 现代商用多核处理器缺少硬件支持的处理核间通信机制,多个处理核间必须通过加锁保护的共享内存传递数据。为此,设计一种基于软件的无锁队列作为核间通信机制,通过无锁数据结构提高软件队列的性能。当数据到达速率较低时,队列自适应地减小队列长度,从而占用较小的内存空间,进而更好地利用处理器高速缓存;当数据到达速率较高时,队列自适应地增加队列长度,以避免数据丢失。实验结果表明,在数据到达速率变化较大的实际应用场景中,该队列较FastForward、MCRingBuffer和B-Queue队列具有更高的数据处理性能。 展开更多
关键词 无锁数据结构 多核处理 流水线并行 自适应调整 CPU核间通信
在线阅读 下载PDF
双粒度空间存储位置调整的历史轨迹索引
10
作者 李彩云 韩京宇 +3 位作者 缪祝青 王彦之 毛毅 张怡婷 《小型微型计算机系统》 北大核心 2025年第8期1838-1846,共9页
为了支持历史轨迹数据的查询,通过学习型索引取代传统索引以减小索引存储代价和提升查询效率受到广泛关注.时空轨迹数据的分布不均匀,单粒度的模型不能兼容疏密不一致的轨迹数据;如果为每个周期数据分别构建一个模型,模型总存储大小线... 为了支持历史轨迹数据的查询,通过学习型索引取代传统索引以减小索引存储代价和提升查询效率受到广泛关注.时空轨迹数据的分布不均匀,单粒度的模型不能兼容疏密不一致的轨迹数据;如果为每个周期数据分别构建一个模型,模型总存储大小线性增长;如果只维护一个模型,模型性能通常会随着历史轨迹的增多而恶化.因此,提出一种双粒度空间存储位置调整的历史轨迹索引,包括嵌入空间识别、初始周期模型构建和后期存储位置调整3个阶段:首先,利用密度峰值聚类算法将所有轨迹数据根据其稀疏性划分到粗细粒度层,在每个粒度层上,利用希尔伯特曲线获取轨迹点的一维排序,保证时空邻近的轨迹点排序值也接近;接着,在初始周期数据上构建分段线性模型;最后,后期数据利用初始周期构建的分段线性模型预测存储位置,采用Kuhn-Munkres算法解决模型预测存储位置产生位置冲突的问题.模拟和真实数据集上的实验表明,与其它的学习型索引相比,不仅提升了查询性能,而且显著降低了索引大小和模型维护成本,有效地支持以读为主的历史轨迹数据查询. 展开更多
关键词 学习型索引 密度峰值聚类 希尔伯特 Kuhn-Munkres算法
在线阅读 下载PDF
BiGCN-TL:软件错误部分定位场景下二分图图卷积神经网络Transformer定位模型
11
作者 施恩译 常舒予 +2 位作者 陈可佳 张扬 黄海平 《计算机科学》 北大核心 2025年第S1期862-872,共11页
在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更... 在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更集或软件错误语义特征的提取,往往只分别独立地依赖各自的上下文。现代软件项目规模庞大,代码依赖错综复杂、这样分别独立的语义提取方式,降低了单个文本语义特征的质量与鲁棒性,导致最终的定位性能下滑。为实现对软件错误相关代码的全面追溯,提出了BiGCN-TL模型。BiGCN-TL重点聚焦训练模型促进不同文本之间信息交互的能力,旨在降低对单个文本语义特征质量的依赖,使得在现代软件项目规模庞大、代码依赖错综复杂、单个文本语义特征提取困难的场景下,仍能通过高效的信息交互,提取到高质量语义特征,提高定位准确率。首先根据已知的部分定位关系,微调基于Transformer的预训练模型。然后,创新性地将软件错误和代码变更集建模成二分图的数据结构,借此充分利用已知的“多对多”关系,并使用微调后的编码器得到节点特征的初始表示。之后,基于二分图设计链接预测任务,训练GCN与二分类鉴别器。借助图卷积操作和注意力机制动态更新节点特征,重点训练模型促进文本信息的交互,动态更新节点特征的能力,从而得到高质量全局分类特征,最终输出匹配预测得分。在多个数据集上开展了对比实验,结果验证了BiGCN-TL相比传统方案的优越性,并通过消融实验确认了各模块的有效性。此外,通过探索多种预训练模型与GCN的组合,并结合具体案例和可视化分析,进一步验证了BiGCN-TL的通用性与鲁棒性。 展开更多
关键词 错误定位 预训练模型 链接预测 二分图 图神经网络
在线阅读 下载PDF
基于异常特征模式的心电数据标签清洗方法 被引量:3
12
作者 韩京宇 陈伟 +2 位作者 赵静 郎杭 毛毅 《计算机研究与发展》 EI CSCD 北大核心 2023年第11期2594-2610,共17页
心电图(electrocardiogram,ECG)异常的自动检测是一个典型的多标签分类问题,训练分类器需要大量有高质量标签的样本.但心电数据集异常标签经常缺失或错误,如何清洗弱标签得到干净的心电数据集是一个亟待解决的问题.在一个标签完整且准... 心电图(electrocardiogram,ECG)异常的自动检测是一个典型的多标签分类问题,训练分类器需要大量有高质量标签的样本.但心电数据集异常标签经常缺失或错误,如何清洗弱标签得到干净的心电数据集是一个亟待解决的问题.在一个标签完整且准确的示例数据集辅助下,提出一种基于异常特征模式(abnormality-feature pattern,AFP)的方法对弱标签心电数据进行标签清洗,以获取所有正确的异常标签.清洗分2个阶段,即基于聚类的规则构造和基于迭代的标签清洗.在第1阶段,通过狄利克雷过程混合模型(Dirichlet process mixture model,DPMM)聚类,识别每个异常标签对应的不同特征模式,进而构建异常发现规则、排除规则和1组二分类器.在第2阶段,根据发现和排除规则辨识初始相关标签集,然后根据二分类器迭代扩展相关标签并排除不相关标签.AFP方法捕捉了示例数据集和弱标签数据集的共享特征模式,既应用了人的知识,又充分利用了正确标记的标签;同时,渐进地去除错误标签和填补缺失标签,保证了标签清洗的可靠性.真实和模拟数据集上的实验证明了AFP方法的有效性. 展开更多
关键词 心电图 多标签分类 异常标签 异常特征模式 二分类器 标签清洗
在线阅读 下载PDF
面向实时数据流的差分隐私直方图发布技术 被引量:8
13
作者 杨庚 夏春婷 白云璐 《南京邮电大学学报(自然科学版)》 北大核心 2018年第2期69-77,共9页
差分隐私作为当前有效的隐私保护机制之一,得到广泛的应用。目前已有多种算法用来生成满足差分隐私的静态直方图,但针对实时数据流环境下的直方图的发布方法却很少,且没有较好地均衡噪声误差和数据可用性。针对实时数据流实时性高、连... 差分隐私作为当前有效的隐私保护机制之一,得到广泛的应用。目前已有多种算法用来生成满足差分隐私的静态直方图,但针对实时数据流环境下的直方图的发布方法却很少,且没有较好地均衡噪声误差和数据可用性。针对实时数据流实时性高、连续性强、以及数据规模大等特点,文中提出了面向数据流的差分隐私直方图发布方法 DDHP(Histogram Publication of Dynamic Data),该方法基于滑动窗口模型实时处理新到达数据,并采用距离测度的方法衡量相邻两个时间戳的数据相似性,以此来动态地分配隐私预算。通过比较L1、余弦、马氏距离在真实数据集上的应用的有效性,选择最优测度。DDHP采用BA(Budget Absorption)机制动态合理分配隐私预算,避免隐私预算过早耗尽或剩余,在提高数据可用性的同时降低了算法的发布误差。实验结果表明,DDHP算法是有效可行的。 展开更多
关键词 差分隐私 直方图发布 实时数据流 隐私预算分配
在线阅读 下载PDF
无线传感器网络安全MAX/MIN查询技术综述 被引量:2
14
作者 戴华 王敏 +2 位作者 易训 杨庚 叶庆群 《计算机科学与探索》 CSCD 北大核心 2017年第8期1191-1203,共13页
随着无线传感器网络(wireless sensor network,WSN)的广泛应用,对于具备安全保护能力的数据查询技术的需求日益迫切,安全MAX/MIN查询就是其中一种重要的数据查询方式。现有的安全MAX/MIN查询技术多数采用半诚实威胁模型,以保护感知节点... 随着无线传感器网络(wireless sensor network,WSN)的广泛应用,对于具备安全保护能力的数据查询技术的需求日益迫切,安全MAX/MIN查询就是其中一种重要的数据查询方式。现有的安全MAX/MIN查询技术多数采用半诚实威胁模型,以保护感知节点采集数据和查询结果的私密性为研究重点,较少关注由于数据篡改、伪造等攻击手段导致的查询结果完整性验证问题。从数据隐私保护和查询结果完整性验证这两个角度出发,分别基于传统WSN和两层WSN对现有的安全MAX/MIN查询处理技术进行了总结,介绍了网络模型和查询模型,并给出了在两种网络结构中关于私密性和完整性的问题描述;全面分析了现有方法采用的关键技术和协议流程,讨论了各自的优点和不足,同时指出未来的研究方向。 展开更多
关键词 无线传感器网络 MAX/MIN查询 隐私保护 完整性验证
在线阅读 下载PDF
面向深度学习的后门攻击及防御研究综述
15
作者 高梦楠 陈伟 +1 位作者 吴礼发 张伯雷 《软件学报》 北大核心 2025年第7期3271-3305,共35页
深度学习模型是人工智能系统的重要组成部分,被广泛应用于现实多种关键场景.现有研究表明,深度学习的低透明度与弱可解释性使得深度学习模型对扰动敏感.人工智能系统面临多种安全威胁,其中针对深度学习的后门攻击是人工智能系统面临的... 深度学习模型是人工智能系统的重要组成部分,被广泛应用于现实多种关键场景.现有研究表明,深度学习的低透明度与弱可解释性使得深度学习模型对扰动敏感.人工智能系统面临多种安全威胁,其中针对深度学习的后门攻击是人工智能系统面临的重要威胁.为了提高深度学习模型的安全性,全面地介绍计算机视觉、自然语言处理等主流深度学习系统的后门攻击与防御研究进展.首先根据现实中攻击者能力将后门攻击分为全过程可控后门、模型修改后门和仅数据投毒后门.然后根据后门构建方式进行子类划分.接着根据防御策略对象将现有后门防御方法分为基于输入的后门防御与基于模型的后门防御.最后汇总后门攻击常用数据集与评价指标,并总结后门攻击与防御领域存在的问题,在后门攻击的安全应用场景与后门防御的有效性等方面提出建议与展望. 展开更多
关键词 深度学习 后门攻击 后门防御 人工智能安全
在线阅读 下载PDF
一种面向位置数据隐私保护的离线地磁定位模型 被引量:1
16
作者 陈诗军 林利成 +2 位作者 徐小龙 陈大伟 王园园 《南京信息工程大学学报(自然科学版)》 CAS 2017年第5期509-515,共7页
基于位置服务给人们的生活带来极大的便利,而目前定位系统特别是室内定位普遍依赖于无线网络信号.很多情况下,用户有位置隐私保护的需求,然而,在目前的大数据时代,基于网络的室内定位服务要求用户将个人位置信息实时提供给服务提供商,... 基于位置服务给人们的生活带来极大的便利,而目前定位系统特别是室内定位普遍依赖于无线网络信号.很多情况下,用户有位置隐私保护的需求,然而,在目前的大数据时代,基于网络的室内定位服务要求用户将个人位置信息实时提供给服务提供商,这导致用户隐私的泄露.如何有效实现室内的基于位置服务,并且保护用户的个人位置信息就成了大数据时代的一个关键问题.本文介绍了一种面向位置数据隐私保护的离线地磁定位模型,利用加速度传感器和微机电磁力计检测行人步态和地球磁场来实现室内定位.本模型利用加速度计检测行人的步态信息,配合磁力计检测的磁场信息与指纹地图进行匹配,实现了室内定位需求的同时又解决了用户位置信息泄露的问题,为大数据时代如何保护用户的位置信息提供了一个有效的解决办法. 展开更多
关键词 隐私保护 位置隐私 地磁指纹地图 离线定位
在线阅读 下载PDF
科研论文的可比性评估与比较性引文生成方法
17
作者 李翔宇 陈景强 《计算机应用》 北大核心 2025年第6期1888-1894,共7页
针对比较性引文生成中面临的两大挑战——准确判定论文间的可比性及生成具有比较性的句子,提出科研论文的可比性评估(CA)与比较性引文生成方法SciCACG(Scientific Comparability Assessment and Citation Generation)。该方法构建了3个... 针对比较性引文生成中面临的两大挑战——准确判定论文间的可比性及生成具有比较性的句子,提出科研论文的可比性评估(CA)与比较性引文生成方法SciCACG(Scientific Comparability Assessment and Citation Generation)。该方法构建了3个核心模块:用于判断2篇论文是否具备可比性的CA模块、负责从论文与参考文献中抽取出具体的比较对象的比较对象抽取(CE)模块和用于生成相应的比较性引用句子的比较引文生成模块。首先,利用SciBERT(Scientific BERT)模型处理输入的2篇文章,并通过CA模块进行可比性的评估;其次,对于被判定为可比的文章,采用CE模块识别并抽取出关键的比较对象;最后,使用比较引文生成模块生成包含这些比较对象的比较性引文。实验结果显示,在CA阶段,所提方法在平均倒数排名(MRR)上达到了0.532,在召回率@10(R@10)上达到了0.731,较之前的SciBERT-FNN(Scientific Bidirectional Encoder Representations from Transformers-Feedforward Neural Network)方法在各个数据集上均有提升;在比较性引文生成中,相较于次优的BART-Large(Bidirectional and Auto-Regressive Transformers-Large)方法,所提方法的ROUGE(Recall-Oriented Understudy for Gisting Evaluation)-1、ROUGE-2和ROUGE-L的F1分数分别提高了1.90、1.29和2.55个百分点。此外,实验结果验证了科学文献自动化比较与分析技术对引文句子生成任务具有重要意义,特别是在提高比较信息的可追溯性和确保引用句子信息的全面性方面,展现出极大的实用价值。 展开更多
关键词 比较性引文 可比性评估 引文生成 文本生成 文本分类 比较对象抽取
在线阅读 下载PDF
生成式不完整多视图数据聚类 被引量:16
18
作者 赵博宇 张长青 +3 位作者 陈蕾 刘新旺 李泽超 胡清华 《自动化学报》 EI CAS CSCD 北大核心 2021年第8期1867-1875,共9页
基于自表示子空间聚类的多视图聚类引起越来越多的关注.大多数现有算法假设每个样本的所有视图都可获得,然而在实际应用中,由于各种因素,可能会导致某些视图缺失.为了对视图不完整数据进行聚类,本文提出了一种在统一框架下同时执行缺失... 基于自表示子空间聚类的多视图聚类引起越来越多的关注.大多数现有算法假设每个样本的所有视图都可获得,然而在实际应用中,由于各种因素,可能会导致某些视图缺失.为了对视图不完整数据进行聚类,本文提出了一种在统一框架下同时执行缺失视图补全和多视图子空间聚类的方法.具体地,缺失视图是由已观测视图数据约束的隐表示生成的.此外,多秩张量应用于挖掘不同视图之间的高阶相关性.这样通过隐表示和高阶张量同时挖掘了不同视图以及所有样本(即使是不完整视图样本)之间的相关性.本文使用增广拉格朗日交替方向最小化(AL-ADM)方法求解优化问题.在真实数据集上的实验结果表明,我们的方法优于最新的多视图聚类算法,具有更好的聚类准确度和鲁棒性. 展开更多
关键词 视图缺失 多视图聚类 张量 生成式模型
在线阅读 下载PDF
一种基于质心空间的不均衡数据欠采样方法 被引量:11
19
作者 金旭 王磊 +1 位作者 孙国梓 李华康 《计算机科学》 CSCD 北大核心 2019年第2期50-55,共6页
针对目前的分类算法在不均衡数据集上的分类效果不理想的问题,将监督学习和无监督学习相结合,提出了一种基于质心的欠采样——ICIKMDS。在现实应用中,一些数据并不容易获得,或者不同类型的数据本身在数量上就存在着差异性,因此造成了数... 针对目前的分类算法在不均衡数据集上的分类效果不理想的问题,将监督学习和无监督学习相结合,提出了一种基于质心的欠采样——ICIKMDS。在现实应用中,一些数据并不容易获得,或者不同类型的数据本身在数量上就存在着差异性,因此造成了数据集分布的不均,如疾病检测中疾病患者和正常人比例的不均、信用卡欺诈中欺诈用户和正常用户比例的不均等。所提方法很好地解决了数据集不均衡的问题,首先通过求解样本之间的欧氏距离得到初始质心,然后采用k-means算法在大类样本集上进行聚类,使不均衡数据集在分布上更加均衡,有效地改善了分类器的分类效果。所提方法使分类器在测试集小类上的分类准确率远远高于随机欠采样和SMOTE算法,在整个测试集上的准确率几乎与其他算法相同。 展开更多
关键词 不均衡 欠采样 K-MEANS SMOTE算法
在线阅读 下载PDF
基于智能合约的以太坊可信存证机制 被引量:29
20
作者 曹迪迪 陈伟 《计算机应用》 CSCD 北大核心 2019年第4期1073-1080,共8页
针对以太坊平台提供的数据管理功能简单且存在低吞吐率和高延迟的问题,提出一种基于智能合约的以太坊可信存证机制。首先针对以太坊平台暴露的数据管理问题提出一个基于智能合约的以太坊可信存证框架,然后通过集中化数据统一处理、认证... 针对以太坊平台提供的数据管理功能简单且存在低吞吐率和高延迟的问题,提出一种基于智能合约的以太坊可信存证机制。首先针对以太坊平台暴露的数据管理问题提出一个基于智能合约的以太坊可信存证框架,然后通过集中化数据统一处理、认证数据分布式存储以及高效动态取证这几个方面阐述所提机制的框架和实现,最后通过基于智能合约的系统开发表明了该机制的可实现性。实验及分析结果表明,该方法与传统关系数据库存证相比,增加了处理可信性、存储可信性和访问可信性;与区块链存证相比,丰富了数据管理功能、降低了区块存储成本、提高了存证效率。 展开更多
关键词 以太坊 智能合约 区块链 可信存证
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部