期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
人工智能与数字经济专题序言——人工智能赋能数字经济,共创未来无限可能 被引量:6
1
作者 于非 何玉林 贺颖 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2023年第3期253-257,共5页
1人工智能时代在人工智能产业化浪潮席卷全球的今天,越来越多的企业开始采用人工智能解决方案来替代传统的人力资源工作,据中国国际发展知识中心2022年发布的《全球发展报告》预测,2020—2025年全球约8500万个工作岗位将被机器替代.该... 1人工智能时代在人工智能产业化浪潮席卷全球的今天,越来越多的企业开始采用人工智能解决方案来替代传统的人力资源工作,据中国国际发展知识中心2022年发布的《全球发展报告》预测,2020—2025年全球约8500万个工作岗位将被机器替代.该趋势不仅会带来生产力和生产效率的提高,还会对整个社会的变革带来深刻影响.从2012年“谷歌猫”的轰动全球到2016年AlphaGo的横空出世,从2017年世界首位被授予公民身份的机器人,再到如今火爆的语言模型ChatGPT(chat generative pre-trained transformer),每一次人工智能技术的革新必然会促进产业的转型与升级,对经济发展和社会进步带来巨大影响. 展开更多
关键词 人工智能 数字经济 数字产业化 产业数字化 智能经济 大数据
在线阅读 下载PDF
ScholatGPT:面向学术社交网络的大语言模型及智能应用
2
作者 袁成哲 陈国华 +4 位作者 李丁丁 朱源 林荣华 钟昊 汤庸 《计算机应用》 北大核心 2025年第3期755-764,共10页
针对现有大语言模型(LLM)在跨领域知识处理、实时学术信息更新及输出质量保证方面的局限,提出基于学术社交网络(ASN)的学者LLM——ScholatGPT。ScholatGPT结合知识图谱增强生成(KGAG)与检索增强生成(RAG),以提升精准语义检索与动态知识... 针对现有大语言模型(LLM)在跨领域知识处理、实时学术信息更新及输出质量保证方面的局限,提出基于学术社交网络(ASN)的学者LLM——ScholatGPT。ScholatGPT结合知识图谱增强生成(KGAG)与检索增强生成(RAG),以提升精准语义检索与动态知识更新的能力,并通过微调优化以强化学术文本的生成质量。首先,基于学者网(SCHOLAT)关系数据构建学者知识图谱,并利用LLM进行语义增强;其次,提出KGAG检索模型,结合RAG实现多路混合检索,增强LLM的精准检索能力;最后,利用微调技术优化模型,使它在各学术领域的生成质量得到提升。实验结果表明,ScholatGPT在学术问答任务中的精确率达83.2%,相较于GPT-4o和AMiner AI提升了69.4和11.5个百分点,在学者画像、代表作识别和研究领域分类等任务上均表现优异。在回答相关性、连贯性和可读性方面,ScholatGPT取得了稳定且具有竞争力的表现,在专业性与可读性之间实现了较好的平衡。此外,基于ScholatGPT开发的学者智库和学术信息推荐系统等智能应用有效提升了学术信息获取的效率。 展开更多
关键词 大语言模型 学术社交网络 知识图谱 知识注入 学者网
在线阅读 下载PDF
广东经济学界“学习贯彻落实党的二十大会议精神”笔谈(一) 被引量:3
3
作者 刘志铭 田秋生 +4 位作者 周先波 罗连化 林建浩 赵俊 许林 《南方经济》 CSSCI 北大核心 2022年第12期11-22,共12页
为进一步推动深入学习贯彻党的二十大会议精神,《南方经济》编辑部继上期发表“学习贯彻落实党的二十大会议精神”座谈会发言摘编后,又特邀请广东经济学界各大高校和科研院所的知名专家与优秀中青年学者,围绕“二十大”报告中涉及经济... 为进一步推动深入学习贯彻党的二十大会议精神,《南方经济》编辑部继上期发表“学习贯彻落实党的二十大会议精神”座谈会发言摘编后,又特邀请广东经济学界各大高校和科研院所的知名专家与优秀中青年学者,围绕“二十大”报告中涉及经济建设的重要部署,以系列笔谈形式,开展研究阐释。本期为系列笔谈的第一期,邀请来自中山大学周先波、林建浩,华南理工大学田秋生、许林,华南师范大学刘志铭、赵俊共六位专家学者,分别就“中国式现代化”、“新时代十年的伟大变革”、“高质量发展”等主题,畅谈各自的观点与体会。 展开更多
关键词 华南师范大学 中青年学者 中国式现代化 华南理工大学 科研院所 贯彻落实 各大高校 伟大变革
在线阅读 下载PDF
基于改进H-AC算法的冷源系统节能优化控制策略 被引量:1
4
作者 周璇 莫浩华 闫军威 《华南理工大学学报(自然科学版)》 北大核心 2025年第1期21-31,共11页
中央空调冷源设备台数与运行参数的优化是一类离散与连续变量的协同优化问题,而经典强化学习算法难以优化此类问题。为此,该文提出了一种结合选项-评论者与演员-评论者框架的中央空调冷源系统节能优化控制策略。首先,采用分层演员-评论... 中央空调冷源设备台数与运行参数的优化是一类离散与连续变量的协同优化问题,而经典强化学习算法难以优化此类问题。为此,该文提出了一种结合选项-评论者与演员-评论者框架的中央空调冷源系统节能优化控制策略。首先,采用分层演员-评论者(H-AC)算法分层优化设备台数与运行参数,且高层和底层模型共用Q网络评估状态价值,以解决多时间尺度下的优化难题;然后,在智能体架构、策略与网络更新方式等方面对H-AC算法进行改进,以加速智能体的收敛;最后,以夏热冬暖地区某科研办公建筑中央空调冷源系统为研究对象,基于冷源系统TRNSYS仿真平台进行实验。结果表明:在平均室内舒适时间占比分别增加14.08、11.23、29.70、9.07个百分比的前提下,基于改进H-AC算法的系统能耗分别比其他4种常规深度强化学习算法减少了32.28%、28.55%、28.63%、11.53%;虽然基于改进H-AC算法的系统能耗比基于选项-评论者框架的算法增加了0.27%,但获得了更平稳的学习过程且平均室内舒适时间占比增加了4.8个百分点。该文算法可为各类建筑中央空调冷源系统节能优化提供有效的技术手段,助力建筑“双碳”目标的实现。 展开更多
关键词 冷源系统 TRNSYS仿真平台 深度分层强化学习 选项-评论者框架 协同优化
在线阅读 下载PDF
交通能源转型决策分析综述 被引量:1
5
作者 陈翠峰 林镇宏 +2 位作者 黄炽坤 赵津瑶 欧士琪 《华南理工大学学报(自然科学版)》 北大核心 2025年第1期32-48,共17页
实现交通强国目标要求高度发展基础设施、构建高效运营体系、推动技术创新和实现可持续发展。在双碳目标这一背景下,交通部门需通过能源转型实现深度减碳,这既符合交通强国构建过程中的可持续发展要素,也需要避免因能源转型决策错误或... 实现交通强国目标要求高度发展基础设施、构建高效运营体系、推动技术创新和实现可持续发展。在双碳目标这一背景下,交通部门需通过能源转型实现深度减碳,这既符合交通强国构建过程中的可持续发展要素,也需要避免因能源转型决策错误或过于急切而对交通基础设施、运营体系的资源配置产生负面影响,从而影响交通强国战略的顺利推进。交通能源转型涉及多个关键决策变量,如汽车动力技术、基础设施建设、用户行为和政策制定等,其复杂性和重要性不容忽视。该文旨在从交通强国和双碳目标相融合的角度,结合综述和案例研究,深入探讨交通能源转型决策分析的意义、方法、工具和经验,为国家政策的制定和企业决策提供理论与实践参考,引发对相关决策分析的重视和研究。首先,对交通能源转型决策分析的内涵和动机进行了阐述。然后,从汽车动力技术、基础设施、用户行为和政策制定4个角度出发,运用优化模型思维方法,并引用已有文献中的分析案例进行详细示范,涵盖诸如电动车辆行驶里程优化、充电网络规划、用户选择行为决策、政策减排效益及公平性等内容。此外,借助已发表的案例或政策实施情况,着重指出了交通能源转型决策分析中不当假设可能对行业和社会产生的影响。最后,总结了交通能源转型决策分析的重要性和可操作性,提出了若干研究课题建议,以促进该领域的深入研究。该文研究内容可为交通能源转型决策提供全面的理论支持和实践参考,有利于推动我国交通领域的可持续发展。 展开更多
关键词 交通强国 碳中和 交通能源转型 汽车动力技术 决策分析
在线阅读 下载PDF
基于TICC的建筑用电时间序列自适应季节性分割方法
6
作者 朱磊 周璇 +2 位作者 陈城 何敏 闫军威 《科学技术与工程》 北大核心 2025年第11期4689-4697,共9页
建筑用电时间序列(building electricity consumption time series, BECTS)的季节性分割对于准确的电力负荷预测与模式挖掘意义重大。针对传统定时分割、定温分割和自适应候温分割方法难以实现准确的BECTS季节性分割问题,提出了一种基于... 建筑用电时间序列(building electricity consumption time series, BECTS)的季节性分割对于准确的电力负荷预测与模式挖掘意义重大。针对传统定时分割、定温分割和自适应候温分割方法难以实现准确的BECTS季节性分割问题,提出了一种基于Toeplitz逆协方差聚类(Toeplitz inverse covariance-based clustering, TICC)的BECTS自适应季节性分割方法。该方法基于建筑逐时用电负荷与室外干球温度二元时间序列,利用TICC算法进行实时分割与聚类。夏热冬暖地区某大型公共建筑真实用电数据的分析结果表明,该方法增强了同类样本之间的相似性和异类样本之间的差异性,与定时分割、定温分割和自适应候温分割方法相比,TICC分割后各季节的平均动态时间规整(dynamic time warping, DTW)距离分别提高46.54%、35.73%和7.59%。该方法可作为数据预处理,为单体建筑数据挖掘分析如建筑用电模式挖掘和负荷预测提供数据支撑。 展开更多
关键词 时间序列 自适应季节性分割 Toeplitz逆协方差聚类 动态时间规整
在线阅读 下载PDF
我国房地产业与银行业极端风险传染研究
7
作者 杨科 刘鑫 田凤平 《系统工程学报》 北大核心 2025年第2期250-260,共11页
为防范和化解我国房地产业和银行业间的极端风险传染效应,以房地产指数和银行业指数数据为研究样本,在分位数回归框架下,构建多元多分位自回归风险价值模型,并运用分位数脉冲响应函数考察市场冲击对不同市场极端风险的动态影响过程.研... 为防范和化解我国房地产业和银行业间的极端风险传染效应,以房地产指数和银行业指数数据为研究样本,在分位数回归框架下,构建多元多分位自回归风险价值模型,并运用分位数脉冲响应函数考察市场冲击对不同市场极端风险的动态影响过程.研究发现,在整个样本考察期,由于房地产业对银行业资金供给的高度依赖性,我国银行业对房地产行业具有单向的极端风险传染效应,而两者在平稳期和危机期具有显著不同的极端风险传染效应.这些研究结论可为我国房地产业和银行业的风险管控以及宏观调控政策的制定等方面提供经验证据. 展开更多
关键词 房地产业 银行业 风险传染 MVMQ-CAViaR模型 分位数回归
在线阅读 下载PDF
横向联邦学习:研究现状、系统应用与挑战 被引量:2
8
作者 吴文泰 吴应良 +1 位作者 林伟伟 左文明 《计算机学报》 北大核心 2025年第1期35-67,共33页
随着数据和算力向网络边缘下沉,人工智能应用的研发愈加依赖隐私敏感的用户数据。在这一趋势的推动下,联邦学习因其强调隐私保护的特性而逐渐成为一个广泛应用的分布式机器学习框架。作为联邦学习的原始范式,横向联邦学习(Horizontal Fe... 随着数据和算力向网络边缘下沉,人工智能应用的研发愈加依赖隐私敏感的用户数据。在这一趋势的推动下,联邦学习因其强调隐私保护的特性而逐渐成为一个广泛应用的分布式机器学习框架。作为联邦学习的原始范式,横向联邦学习(Horizontal Federated Learning,HFL)具有扩展能力强和使用场景广泛等特点,因此是近年来该领域的研究重心,同时在产业界相关需求的驱动下有着十分广泛的应用前景。横向联邦学习的研究涉及机器学习、分布式系统、无线通信和信息安全等多个学术领域,从研究动机到技术方法都呈现多样化,但现有文献未能展现相关研究现状的全貌。此外,横向联邦学习相关技术的发展催化出了一系列开源系统框架、公开数据集以及多种场景下的应用,对进一步研究与实践都具有参考价值。为此,本文对横向联邦学习的研究现状和系统应用进行综合性调研:首先,对相关文献按照研究目标和技术角度进行全面地分类梳理,从多领域视角分析了各分支的研究现状;其次,从应用实践的视角,对比分析了面向横向联邦学习的主流系统框架与代码库、描述了数据准备方法以及典型的应用场景。在此基础上,阐明了横向联邦学习算法研究和系统应用面临的6个关键挑战,为如何缩小相关研究与系统实践之间的鸿沟提供了新的参考。 展开更多
关键词 横向联邦学习 数据隐私 分布式系统 机器学习 人工神经网络
在线阅读 下载PDF
风险最小化加权朴素贝叶斯分类器 被引量:1
9
作者 欧桂良 何玉林 +2 位作者 张曼静 黄哲学 Philippe Fournier-Viger 《计算机科学》 北大核心 2025年第3期137-151,共15页
朴素贝叶斯分类器被誉为机器学习领域的十大经典算法之一,其以完备的理论基础和简单的模型结构而闻名,在许多的实际应用中取得了良好的分类效果。然而条件属性独立性假设在一定程度上限制了朴素贝叶斯分类器的性能,因此大量的改进工作... 朴素贝叶斯分类器被誉为机器学习领域的十大经典算法之一,其以完备的理论基础和简单的模型结构而闻名,在许多的实际应用中取得了良好的分类效果。然而条件属性独立性假设在一定程度上限制了朴素贝叶斯分类器的性能,因此大量的改进工作被提出来缓解这一问题,加权朴素贝叶斯分类器便是其中之一。在对边缘概率权重作用深入分析的基础之上,文中提出了一种基于风险最小化的加权朴素贝叶斯分类器(Risk Minimization-Based Weighted Naive Bayesian Classifier,RM-WNBC),即在权重确定的过程中同时考虑分类器的经验风险和权重的结构风险。不同于现有的过分关注朴素贝叶斯分类器外在泛化性能的改进策略,RM-WNBC是从朴素贝叶斯分类器的内在概率分布出发改善其泛化性能。经验风险度量了加权朴素贝叶斯分类器的分类能力,采用后验概率的估计质量表示;结构风险刻画了加权朴素贝叶斯分类器对属性相关性的处理,采用类条件概率的均方差表示。经验风险最小化保证了RM-WNBC可以获得良好的训练精度,同时结构风险最小化又使得RM-WNBC能够取得最佳的属性相关表达能力。为了获得RM-WNBC的最优权重,推导了高效且收敛的权重更新策略来保证结构风险和经验风险的最小化。在31个UCI和KEEL标准分类数据集上对RM-WNBC的可行性、合理性和有效性进行了验证。实验结果表明:1)RM-WNBC的训练和测试精度随着边缘概率权重的不断更新逐渐增加直至收敛;2)RM-WNBC具有比现有加权朴素贝叶斯分类器更好的属性相关性表达能力;3)在给定的显著性水平下,RM-WNBC在31个数据集上能够获得比经典朴素贝叶斯分类器、3种贝叶斯网络、4种加权朴素贝叶斯分类器和1种特征选择朴素贝叶斯分类器更好的训练和测试表现。 展开更多
关键词 朴素贝叶斯 独立性假设 加权朴素贝叶斯 结构风险 经验风险 贝叶斯网络
在线阅读 下载PDF
基于本征正交分解的SCB11-800/10型干式变压器温度场降阶模型及其过负荷绝缘热安全评估
10
作者 龚嘉豪 唐文虎 +2 位作者 蓝海娟 张泽懿 许雄文 《广东电力》 北大核心 2025年第7期86-98,共13页
在变压器负荷越限运行评估研究领域,现有的方法难以针对连续变化负荷提供快速且精确的安全运行策略。为此,面向变压器允许过负载时间和寿命损失的精确评估问题,提出一种电力变压器非稳态温度场模型降阶方法。首先,通过有限元法和物理场... 在变压器负荷越限运行评估研究领域,现有的方法难以针对连续变化负荷提供快速且精确的安全运行策略。为此,面向变压器允许过负载时间和寿命损失的精确评估问题,提出一种电力变压器非稳态温度场模型降阶方法。首先,通过有限元法和物理场仿真技术建立变压器热模型,并采用基于傅立叶数的本征正交分解(proper orthogonal decomposition, POD)方法对上述模型进行降阶处理,进而提出一种非稳态导热方程的降阶与数值外推新方法;其次,通过傅立叶数选取传热过程的关键特征数据作为POD的快照集,以确保POD降阶模型能够有效捕捉传热特征的关键信息;然后,通过比较降阶模型和有限元法全阶模型的计算结果,验证降阶模型的准确性;最后,运用该模型快速预测不同负荷下的过负荷运行时间及绝缘寿命损失,并与全阶模型的计算耗时进行比较。结果显示:在绝缘温度即将超过阈值的情况下,全阶模型的计算耗时较长,而采用降阶模型后,计算时间大幅缩短,计算效率提高了28倍。这为变压器的温升快速计算及其过负荷绝缘热安全的实时计算提供了一种更高效的途径。 展开更多
关键词 干式变压器温度场 本征正交分解 模型降阶 傅立叶数 允许过负荷时间 寿命损失
在线阅读 下载PDF
基于最大均值差异的子空间高斯混合模型聚类集成算法
11
作者 何玉林 李旭 +2 位作者 贺颖婷 崔来中 黄哲学 《计算机应用》 北大核心 2025年第6期1712-1723,共12页
针对高斯混合模型(GMM)聚类算法在处理大规模高维数据聚类时出现的性能受限和参数敏感的问题,提出一种基于最大均值差异(MMD)的子空间GMM聚类集成(SGMM-CE)算法。首先,对原始大规模高维数据集进行随机样本划分(RSP)以得到多个数据子集,... 针对高斯混合模型(GMM)聚类算法在处理大规模高维数据聚类时出现的性能受限和参数敏感的问题,提出一种基于最大均值差异(MMD)的子空间GMM聚类集成(SGMM-CE)算法。首先,对原始大规模高维数据集进行随机样本划分(RSP)以得到多个数据子集,从样本量的角度缩小聚类问题的规模;其次,根据特征对最优GMM构件数的影响,在每一个数据子集对应的高维特征空间中进行子空间学习,得到每个高维特征空间对应的多个低维特征子空间,并在各个子空间上进行GMM聚类,从而得到一系列异构的GMM;再次,利用所提出的平均共享隶属概率(ASAP),重标记与融合来自同一个数据子集的不同特征子空间上的聚类结果;最后,利用扩展的子空间MMD(SubMMD)作为不同数据子集的聚类结果中2个簇之间的分布一致性的度量准则,据此重标记并融合这些数据子集的聚类结果,进而得到原始数据集的最终聚类集成结果。通过详尽的实验验证SGMM-CE算法的有效性,实验结果显示,相较于对比算法中最好的元簇聚类算法(MCLA),SGMM-CE算法在选用的数据集上的平均标准化互信息(NMI)、聚类精度(CA)和调整兰德系数(ARI)值分别提升了19%,20%和52%。此外,可行性和合理性的实验结果证实了SGMM-CE算法的参数收敛性与时间高效性,表明该算法具备高效处理大规模高维数据聚类问题的能力。 展开更多
关键词 无监督学习 集成学习 子空间学习 最大均值差异 高斯混合模型
在线阅读 下载PDF
脉冲神经网络基准测试及类脑训练框架性能评估
12
作者 胡汪鑫 成英超 +2 位作者 何玉林 黄哲学 蔡占川 《应用科学学报》 北大核心 2025年第1期169-182,共14页
随着脉冲神经网络(spiking neural network,SNN)研究需求的不断增长,开源类脑训练框架也迅速发展。然而,目前缺乏针对这些框架的系统性选择指南。为了解决该问题,提出了一种基于图像分类任务的SNN基准测试方法。本文为两种SNN训练方法,... 随着脉冲神经网络(spiking neural network,SNN)研究需求的不断增长,开源类脑训练框架也迅速发展。然而,目前缺乏针对这些框架的系统性选择指南。为了解决该问题,提出了一种基于图像分类任务的SNN基准测试方法。本文为两种SNN训练方法,即直接替代梯度反向传播训练方法以及从人工神经网络(artificial neural network,ANN)到SNN的转换训练方法分别设计了卷积神经网络和全连接深度神经网络模型,并使用MNIST、FashionMNIST和CIFAR-10基准图像数据集,以训练时间和分类准确率为评估指标,比较了不同类脑训练框架的性能差异。研究结果表明,在SNN直接训练中,类脑训练框架SpikingJelly在训练时间和分类准确率方面均表现优异;而在ANN到SNN的转换训练中,Lava框架实现了最高的分类准确率。 展开更多
关键词 深度学习 脉冲神经网络 类脑训练框架 基准测试 图像分类
在线阅读 下载PDF
经济政策不确定性冲击下全球系统性金融风险的跨市场传染——基于TVP-FAVAR和TVP-VAR模型的研究 被引量:18
13
作者 杨科 郭亚飞 田凤平 《统计研究》 CSSCI 北大核心 2023年第7期70-84,共15页
本文基于8个维度的48个基础经济金融变量,运用TVP-FAVAR模型构建系统性金融风险的度量指标,采用广义方差分解法构建系统性金融风险的溢出指数,从静态和动态角度对经济政策不确定性(EPU)冲击下全球16个主要国家的系统性金融风险水平和风... 本文基于8个维度的48个基础经济金融变量,运用TVP-FAVAR模型构建系统性金融风险的度量指标,采用广义方差分解法构建系统性金融风险的溢出指数,从静态和动态角度对经济政策不确定性(EPU)冲击下全球16个主要国家的系统性金融风险水平和风险溢出状况展开研究,并运用TVP-VAR模型从金融市场和经济基本面两个层面检验EPU冲击下系统性金融风险的跨市场传染机制。研究发现:系统性金融风险与EPU之间存在双向非对称溢出效应,并以EPU对系统性金融风险的冲击为主,发展中国家系统性金融风险对EPU冲击的反应速度更快、程度更大;EPU冲击下,发达国家是全球系统性金融风险的主要溢出方,发展中国家则是主要的风险接受者,并且这一现象随着全球EPU水平的提升而更加显著;各金融子市场和经济部门受EPU直接冲击的时间和程度存在差异,相互之间的风险溢出效应使得系统性金融风险水平进一步攀升;全球EPU对我国EPU的显著冲击更使得国内经济金融市场受到直接和间接的双重影响,风险净溢入水平也远远大于其他发展中国家。本研究对于应对全球经济政策不确定性冲击、防范化解系统性金融风险具有重要意义。 展开更多
关键词 经济政策不确定性 系统性金融风险 风险传染机制 TVP-FAVAR TVP-VAR
在线阅读 下载PDF
并发式Spark消息分发器
14
作者 何玉林 林泽杰 +2 位作者 徐毓阳 成英超 黄哲学 《深圳大学学报(理工版)》 北大核心 2025年第3期317-325,I0012,I0013,共11页
在大数据计算框架Spark中,驱动器采用迭代式消息分发机制,会增加任务提交的时间开销,影响任务执行的启动时间,限制了任务执行的并发性,导致多个执行器处于空闲等待状态,造成计算资源的浪费.使用线程池调度策略,构建一种高效且轻量级的... 在大数据计算框架Spark中,驱动器采用迭代式消息分发机制,会增加任务提交的时间开销,影响任务执行的启动时间,限制了任务执行的并发性,导致多个执行器处于空闲等待状态,造成计算资源的浪费.使用线程池调度策略,构建一种高效且轻量级的并发式Spark消息分发器.与迭代式Spark消息分发器不同,并发式消息分发器更加关注且更适合调度开销较大的细粒度任务作业,通过解析包含执行器重要信息的元数据,获取任务列表及各个任务对应的执行器标识,创建线程池并为每个任务启动异步计算,从而实现并发式任务分发,在保证系统稳定和任务顺利执行的前提下,最大程度地减少任务分发的时间开销.在虚拟机构建的仿真集群环境上,通过与迭代式消息分发器进行对比,证实了并发式消息分发器的良好效果.实验结果表明,在内存保持不变的前提下,并发式Spark消息分发器可减少约9%的任务执行时间,同时能提高约5%的中央处理器的利用率.并发式Spark消息分发器有效解决了迭代式消息分发机制针对细粒度任务分发的时间开销过大和计算资源浪费的问题. 展开更多
关键词 并行处理 大数据计算 Spark通信机制 消息分发 细粒度任务 线程池调度
在线阅读 下载PDF
一个面向人物图像修复的去噪扩散概率模型
15
作者 郑志强 王怿 《小型微型计算机系统》 北大核心 2025年第8期1950-1959,共10页
本文提出了一种基于改进去噪扩散概率模型(DDPM)的图像修复方法,特别适用于人物图像的修复任务.与传统图像修复方法相比,本方法通过引入渐进式采样策略和采样调度机制,提高了修复质量和效率.此外,本文还在模型微调中应用了LoRA技术,通... 本文提出了一种基于改进去噪扩散概率模型(DDPM)的图像修复方法,特别适用于人物图像的修复任务.与传统图像修复方法相比,本方法通过引入渐进式采样策略和采样调度机制,提高了修复质量和效率.此外,本文还在模型微调中应用了LoRA技术,通过低秩矩阵分解大幅减少了计算资源的占用并应用缩放梯度下降法改进优化器更好地学习图像风格.实验结果表明,该方法在复杂纹理、非重复性结构及大范围缺失区域的修复方面取得了显著的效果,为图像修复技术的进一步发展提供了新的思路和方法. 展开更多
关键词 图像修复 DDPM 渐进式采样 采样调度 缩放梯度下降 LoRA
在线阅读 下载PDF
针对模相近数据的启发式核密度估计器
16
作者 何玉林 陈纯佳 +2 位作者 黄哲学 李俊杰 FOURNIER-VIGER Philippe 《数据采集与处理》 北大核心 2025年第3期711-729,共19页
区别于经典的基于Parzen窗口法的概率密度函数估计器构建策略,提出了基于近邻误差度量函数的启发式核密度估计器(Heuristic kernel density estimator,HKDE),用以提升对模相近数据概率密度函数拟合的准确性。首次从数据不确定性和模型... 区别于经典的基于Parzen窗口法的概率密度函数估计器构建策略,提出了基于近邻误差度量函数的启发式核密度估计器(Heuristic kernel density estimator,HKDE),用以提升对模相近数据概率密度函数拟合的准确性。首次从数据不确定性和模型不确定性的角度分析了传统核密度估计器解决模相近数据概率密度函数估计问题时的缺陷:利用概率密度值对于直方图箱宽参数的收敛性确定观测数据的启发式概率密度值,降低数据概率密度值计算的不确定性;基于启发式概率密度值构建用于确定核密度估计器最优带宽的目标函数,降低最优带宽优化过程中的不确定性。在18个模相近数据集上对新估计器HKDE的可行性、合理性和有效性进行了系统性的验证。实验结果表明,与7种具有代表性的概率密度函数估计器相比,HKDE能够获得更加优异的概率分布近似表现,具有比其他估计器更低的估计误差,能够确定出更接近真实值的概率密度函数估计值。 展开更多
关键词 核密度估计器 模相近观察值 不确定性 启发式概率密度值 直方图箱宽
在线阅读 下载PDF
基于节点抽样的分布式二阶段聚类方法
17
作者 张曼静 何玉林 +1 位作者 李旭 黄哲学 《计算机科学》 北大核心 2025年第2期134-144,共11页
针对大数据聚类中存在的计算资源消耗大、聚类效率低的问题,提出了一种新的基于节点抽样的分布式二阶段聚类方法。该方法首先在各个本地节点对节点上的数据执行局部聚类操作,并基于局部聚类结果,从每个节点中抽取代表性的数据样本,然后... 针对大数据聚类中存在的计算资源消耗大、聚类效率低的问题,提出了一种新的基于节点抽样的分布式二阶段聚类方法。该方法首先在各个本地节点对节点上的数据执行局部聚类操作,并基于局部聚类结果,从每个节点中抽取代表性的数据样本,然后将各节点选定的样本数据传输至中央节点。之后,在中央节点上,对合并的样本数据进行进一步的聚类分析,并将样本聚类的结果传回各个本地节点。最后,各本地节点结合自身的局部聚类结果和中央节点的样本聚类结果,完成最终的聚类标签统一。通过以上流程,所提方法实现了对集中式聚类算法的分布式改造,能够快速一致地完成对全局数据的聚类分析。理论分析和数值实验均表明,与传统的全量数据集中式聚类方法相比,二阶段聚类方法有效地结合了并行处理的高效性和集成分析的准确性,在保证聚类质量的前提下能够显著降低计算资源的消耗,是一种可行的大数据聚类分布式解决方案。 展开更多
关键词 大数据聚类 分布式计算 节点抽样 并行计算 二阶段聚类
在线阅读 下载PDF
求解多模概率分布Gamma混合模型的半EM算法
18
作者 陈佳琪 何玉林 +1 位作者 成英超 黄哲学 《计算机应用》 北大核心 2025年第7期2153-2161,共9页
期望最大化(EM)算法在混合模型参数估计中发挥着重要作用,然而现有的EM算法在求解Gamma混合模型(GaMM)参数时存在局限性,主要体现在因近似计算导致的低质量参数估计,以及由于大量数值计算造成的计算效率低下问题。为了克服这些局限,并... 期望最大化(EM)算法在混合模型参数估计中发挥着重要作用,然而现有的EM算法在求解Gamma混合模型(GaMM)参数时存在局限性,主要体现在因近似计算导致的低质量参数估计,以及由于大量数值计算造成的计算效率低下问题。为了克服这些局限,并充分利用数据的多模性质,提出一种半EM(Semi-EM)算法求解用于估计多模概率分布的GaMM。首先,通过聚类探测数据的空间分布特性,以初始化GaMM参数,进而更准确地刻画数据的多模性;其次,在EM算法框架的基础上,对于缺乏封闭更新表达式而导致的参数更新困难问题,采用自定义的启发式策略对GaMM形状参数进行更新,使它们朝着最大化对数似然值的方向逐步调整,同时以封闭形式更新其他参数。经过一系列具有说服力的实验,验证了Semi-EM算法的可行性、合理性和有效性。实验结果表明,Semi-EM算法在精确估计多模概率分布方面优于对比的4种算法,具有更低的误差指标以及更高的对数似然值,表明该算法能提供更准确的模型参数估计,从而更精确地刻画数据的多模性质。 展开更多
关键词 多模概率密度函数 Gamma混合模型 期望最大化算法 聚类 对数似然函数
在线阅读 下载PDF
以标注确定性增强为导向的正类-无标签学习算法
19
作者 何玉林 何芃 +2 位作者 黄哲学 解为成 PHILIPPE Fournier-Viger 《计算机应用》 北大核心 2025年第7期2101-2112,共12页
正类-无标签学习(PUL)是在负例样本未知时,利用已知的少量正类样本和大量无标签样本训练出性能可被实际应用接受的分类器。现有的PUL算法存在共性的缺陷,即对无标签样本标注的不确定性较大,这将导致分类器学习到的分类边界不准确,并且... 正类-无标签学习(PUL)是在负例样本未知时,利用已知的少量正类样本和大量无标签样本训练出性能可被实际应用接受的分类器。现有的PUL算法存在共性的缺陷,即对无标签样本标注的不确定性较大,这将导致分类器学习到的分类边界不准确,并且限制了所训练分类器在新数据上的泛化能力。为了解决这一问题,提出一种以无标签样本标注确定性增强为导向的PUL(LCE-PUL)算法。首先,通过验证集的后验概率均值和正类样本集中心点的相似程度筛选出可靠的正类样本,并通过多轮迭代逐步精细化标注过程,以提升对无标签样本初步类别判断的准确性,从而提高无标签样本标注的确定性;其次,把这些可靠的正类样本与原始正类样本集合并,以形成新的正类样本集,之后从无标签样本集中将它剔除;然后,遍历新的无标签样本集,并利用每个样本与若干近邻点的相似程度再次筛选可靠正类样本,以更准确地推断无标签样本的潜在标签,从而减少误标注的可能性,并提升标注的确定性;最后,更新正类样本集,并把未被选中的无标签样本视为负类样本。在具有代表性的数据集上对LCE-PUL算法的可行性、合理性和有效性进行验证。随着迭代次数的增加,LCE-PUL算法的训练呈现收敛的特性,且当正类样本比例为40%、35%和30%时,LCE-PUL算法构建的分类器测试精度相较于基于特定成本函数的偏置支持向量机(BiasedSVM)算法、基于Dijkstra的PUL标签传播(LP-PUL)算法和基于标签传播的PUL(PU-LP)算法等5种代表性对比算法中最多提升了5.8、8.8和7.6个百分点。实验结果表明,LCE-PUL是一种有效处理PUL问题的机器学习算法。 展开更多
关键词 正类-无标签学习 标注确定性增强 后验概率 贝叶斯分类器 两步法
在线阅读 下载PDF
重大公共卫生事件背景下公众服务安全感知的度量研究
20
作者 白卫静 左文明 +1 位作者 陈飞扬 丘心心 《管理学报》 北大核心 2025年第1期145-155,共11页
运用扎根理论对微博数据进行多级编码,构建服务安全理论框架,并结合BERT模型从另一数据集中提取服务安全信息,计算“服务安全感知指数”以量化公众服务安全感知水平。研究表明,服务安全包括身体生命、资金财务和情感心理安全。服务安全... 运用扎根理论对微博数据进行多级编码,构建服务安全理论框架,并结合BERT模型从另一数据集中提取服务安全信息,计算“服务安全感知指数”以量化公众服务安全感知水平。研究表明,服务安全包括身体生命、资金财务和情感心理安全。服务安全涵盖7个核心类属,前3类为保护服务安全的措施,后4类为影响措施实施的条件。服务安全各维度及综合指数均经历了初期震荡、逐步上升、缓慢下降至谷底、防控措施放开后回升的过程,尽管总体趋势一致,但各维度的具体变化存在差异。 展开更多
关键词 重大公共卫生事件 服务安全 服务安全感知指数 BERT模型 大数据
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部