期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向睡眠研究的生理信号开源数据集综述 被引量:2
1
作者 陆敬怡 颜昌 +2 位作者 于广义 李建清 刘澄玉 《中国生物医学工程学报》 CAS CSCD 北大核心 2024年第3期358-368,共11页
临床多导睡眠数据的采集和标注耗时长且成本高,被测人群、采集设备和标注专家等因素的不同,使得采集的数据存在差异,增加了睡眠相关研究的难度和复杂度。与众多其他临床开源数据资源相同,面向睡眠研究的生理信号开源数据集的建立为全球... 临床多导睡眠数据的采集和标注耗时长且成本高,被测人群、采集设备和标注专家等因素的不同,使得采集的数据存在差异,增加了睡眠相关研究的难度和复杂度。与众多其他临床开源数据资源相同,面向睡眠研究的生理信号开源数据集的建立为全球相关研究者提供了丰富的数据资源和统一的对比平台,促进了睡眠医学领域研究的深入发展。为此,综述了在睡眠领域中常见的18个开源数据集的概况、特点及应用,这些数据集包括脑电图(EEG)、心电图(ECG)、眼电图(EOG)和肌电图(EMG)等生理信号以及涵盖睡眠障碍、心血管疾病和肥胖症等多个临床领域;总结了现有睡眠开源数据集在数据质量、数据标准、数据安全、样本代表性和外部有效性等方面存在的局限,提出了针对性的建议与展望。 展开更多
关键词 多模态生理信号 睡眠 开源数据集 生理测量
在线阅读 下载PDF
基于隐形后门水印的开源数据集版权保护
2
作者 黄智慧 肖祥立 +1 位作者 张玉书 薛明富 《计算机工程与科学》 CSCD 北大核心 2024年第6期1013-1021,共9页
针对图像分类领域开源数据集的版权保护问题,提出了一种基于后门水印的可溯源方法IBWOD,其能够保证水印在具有较强隐蔽性的同时保持良好的可用性和有效性。首先,利用一个编码器-解码器网络将后门水印嵌入到所选取的部分样本中,生成水印... 针对图像分类领域开源数据集的版权保护问题,提出了一种基于后门水印的可溯源方法IBWOD,其能够保证水印在具有较强隐蔽性的同时保持良好的可用性和有效性。首先,利用一个编码器-解码器网络将后门水印嵌入到所选取的部分样本中,生成水印样本。接着,修改这些水印样本的标签为指定标签,然后将水印样本与未修改的样本合并为水印数据集。使用该水印数据集训练的模型会留下特定后门,即从后门水印到指定标签的一种映射关系。最后,提出了一种相应的模型验证算法,基于这种特殊的映射关系来验证一个可疑模型是否使用了水印数据集。实验结果表明,IBWOD能够很好地验证模型是否使用了水印数据集,并具有较强的隐蔽性。 展开更多
关键词 开源数据集 版权保护 后门水印 机器学习 图像分类
在线阅读 下载PDF
大语言模型在开源项目主题标注中的应用与评估研究
3
作者 何德鑫 韩凡宇 王伟 《华东师范大学学报(自然科学版)》 北大核心 2025年第5期14-24,共11页
随着开源社区的快速发展, GitHub项目的数量持续激增;然而一部分项目未提供明确的主题标签,给开发者在技术选型和项目检索的过程中带来了挑战.现有的主题生成方法主要依赖于监督学习范式,存在对高质量标注数据有较强依赖性等问题.针对... 随着开源社区的快速发展, GitHub项目的数量持续激增;然而一部分项目未提供明确的主题标签,给开发者在技术选型和项目检索的过程中带来了挑战.现有的主题生成方法主要依赖于监督学习范式,存在对高质量标注数据有较强依赖性等问题.针对开源项目主题标注的准确性及效率问题,首次研究了大语言模型在GitHub项目主题预测任务中的应用效果;构建了包含3 000个GitHub热门项目的数据集,涵盖项目仓库名、README文档和描述信息等多维度特征;选择Claude 3.7 Sonnet、DeepSeek-V3、Gemini 2.0Flash、GPT-4o和Qwen-Plus等数个国内外主流大语言模型进行了对比实验.实验结果表明, Claude 3.7Sonnet在多数评估指标上表现最优,且随着数据集规模扩大,各模型的性能表现趋于稳定.实验证明,大语言模型在项目主题标注任务中展现出了良好的适用性,但不同模型间存在显著性能差异,这为开源项目管理和智能化标注系统设计提供了重要参考依据. 展开更多
关键词 大语言模型 仓库挖掘 主题标注 开源数据集
在线阅读 下载PDF
基于深度学习的跨域辐射源个体识别综述 被引量:2
4
作者 李奇真 刘佳旭 +4 位作者 梁先明 龙慧敏 董海 曹广平 李建清 《电讯技术》 北大核心 2024年第7期1163-1174,共12页
基于深度学习的辐射源个体识别已经成为识别和认证无线设备的主要研究方法之一。然而,基于传统深度学习的辐射源个体识别算法不能直接应用于跨域(跨信道条件、跨接收机、跨接收时间等)辐射源个体识别场景,因为一个域上的数据训练的模型... 基于深度学习的辐射源个体识别已经成为识别和认证无线设备的主要研究方法之一。然而,基于传统深度学习的辐射源个体识别算法不能直接应用于跨域(跨信道条件、跨接收机、跨接收时间等)辐射源个体识别场景,因为一个域上的数据训练的模型用于另一个域上进行推理,其效果通常会变差。调研了现有基于对比学习、迁移学习、域适应等先进深度学习的跨域辐射源个体识别方法,整理和归纳了跨域辐射源个体识别相关的开源数据集。分析了跨域辐射源个体识别存在的难题与挑战,展望了跨域辐射源个体识别发展趋势及未来研究方向,以助力深度学习在复杂电磁环境下辐射源个体识别的实用化。 展开更多
关键词 跨域辐射源个体识别 深度学习 域适应 开源跨域辐射源数据
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部