-
题名融合三支多属性决策与SAC的兵棋推演智能决策技术
被引量:2
- 1
-
-
作者
彭莉莎
孙宇祥
薛宇凡
周献中
-
机构
南京大学工程管理学院
浙江财经大学信息技术与人工智能学院
南京大学智能装备新技术研究中心
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2024年第7期2310-2322,共13页
-
基金
国家自然科学青年基金(62306135)
教育部青年基金(23YJC630156)
+1 种基金
江苏省青年基金(BK20230783)
南京大学技术创新基金(SC-2023-039)资助课题。
-
文摘
近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making,TWMADM)与强化学习的智能决策技术。基于经典软表演者-批评家(soft actor-critic,SAC)算法开发兵棋智能体,利用TWMADM方法评估对方算子的威胁情况,并将该威胁评估结果以先验知识的形式引入到SAC算法中规划战术决策。在典型兵棋推演系统中开展博弈对抗实验,结果显示所提算法可有效加快训练收敛速度,提升智能体的对抗策略生成效率和博弈胜率。
-
关键词
兵棋推演
三支多属性决策
软表演者-批评家
强化学习
智能决策
-
Keywords
wargame
three-way multiple attribute decision making(TWMADM)
soft actor-critic(SAC)
reinforcement learning(RL)
intelligent decision
-
分类号
TN95
[电子电信—信号与信息处理]
TP181
[自动化与计算机技术—控制理论与控制工程]
E91
[军事]
-
-
题名环境处罚信息披露的市场有效性及影响因素研究
被引量:2
- 2
-
-
作者
李梦雨
郑倩
季山
-
机构
北京工商大学经济学院
浙江财经大学信息技术与人工智能学院
-
出处
《南开经济研究》
CSSCI
北大核心
2024年第11期121-137,共17页
-
基金
国家社科基金一般项目“全面注册制下市场操纵诱发股市系统性风险的机理与对策研究”(23BJY253)的资助。
-
文摘
本文基于2015—2022年中国沪深两市833个上市公司的环境处罚案例,采用事件研究法对环境处罚信息披露的市场有效性进行检验。研究结果显示,环境处罚信息披露事件窗口期内的累计平均异常收益率显著为负,说明市场对环境处罚信息做出惩罚性反应。异质性分析表明,市场对重污染企业的惩罚性反应显著大于非重污染企业的惩罚性反应,且市场反应的大小与环境处罚的程度呈正相关关系。在市场反应的影响因素方面,企业所在地区的环境规制、涉案公司的媒体关注及公众环境关注能够显著加大市场的惩罚性反应。进一步研究表明,企业环境处罚事件对股票异常收益率的影响能够维持20天左右的时间,并且显著增加了股票的价格波动风险。本文拓展了环境处罚信息披露与资产定价的相关研究,也为引导资本市场绿色发展提供了现实启示。
-
关键词
环境处罚信息披露
市场反应
事件研究法
-
Keywords
Disclosure of Environmental Penalties
Market Response
Event-study Methodology
-
分类号
F275
[经济管理—企业管理]
-
-
题名基于混合蒙特卡洛树搜索的电缆盘装箱方法
- 3
-
-
作者
肖泽远
林剑
-
机构
浙江财经大学信息技术与人工智能学院
-
出处
《计算机集成制造系统》
北大核心
2025年第1期355-366,共12页
-
基金
国家自然科学基金资助项目(61973267)
浙江省自然科学基金资助项目(LY24F030008)。
-
文摘
电缆盘装箱问题广泛存在于线缆企业的生产实际中,本质上属于带载重约束和正交旋转的多箱型二维装箱问题。针对电缆盘装箱问题,建立以装箱成本最小化为目标的混合整数规划模型,提出一种混合蒙特卡洛树搜索(HMCTS)算法。在蒙特卡洛树搜索框架下,通过融入高效邻域搜索策略,寻找得到较优的箱子选择方案,并确定每个箱子中货物的装箱位置和方式。在此基础上,构建电缆盘装箱问题的松弛模型,有效降低算法的计算成本。基于线缆企业生产实际中6种不同规模的数据集,对HMCTS算法进行仿真实验和对比分析,结果表明所提算法在求解电缆盘装箱问题中具有较高的有效性和鲁棒性。
-
关键词
蒙特卡洛树搜索
混合整数规划模型
松弛模型
电缆盘装箱问题
多箱型
-
Keywords
Monte Carlo tree search
mixed integer programming model
relaxation model
cable reel packing problem
variable-sized
-
分类号
TM24
[一般工业技术—材料科学与工程]
-
-
题名四阶代数双曲毕达哥拉斯速端曲线插值方法
- 4
-
-
作者
刘昊明
徐帝纳
方林聪
李毓君
-
机构
浙江财经大学信息技术与人工智能学院
浙江财经大学东方学院信息与人工智能学院
-
出处
《浙江大学学报(理学版)》
北大核心
2025年第4期464-472,共9页
-
文摘
研究了四阶代数双曲毕达哥拉斯速端(algebraic hyperbolic Pythagorean Hodograph,AHPH)曲线的几何插值方法,包括G^(1) Hermite插值、C^(1) Hermite插值以及平面三点插值。在代数双曲空间中,AHPH曲线是PH曲线的推广,研究AHPH曲线的插值方法可丰富和完善PH曲线的相关几何理论。对于G^(1) Hermite插值问题,在实数域下应用向量内积符号构建一元二次实方程并求解。对于C^(1) Hermite插值问题,应用平面参数曲线的复数表示方法和AHPH曲线控制多边形的充分必要条件,将曲线的构造问题转化为关于控制顶点的复一元二次方程进行求解。对于平面三点插值问题,通过插值点参数化将插值条件转化为在AHPH曲线族中搜索目标曲线的初值条件,进而构建一元二次复方程求解目标曲线。以上问题均不超过2条AHPH曲线满足插值条件。最后,通过数值实例,验证了本文方法的有效性。此外,应用本文方法可构造AHPH样条。
-
关键词
曲线建模
几何构造
HERMITE插值
AH
Bézier曲线
AHPH曲线
-
Keywords
curve modeling
geometric construction
Hermite interpolation
AH Bézier curve
AHPH curve
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于句法CYK图神经网络的知识增强文本分类
被引量:1
- 5
-
-
作者
章巍
陈学奇
韩剑锋
虞小江
吴海燕
-
机构
浙江浙能临海海上风力发电有限公司
杭州蓝城新能源科技有限公司
浙江财经大学信息技术与人工智能学院
-
出处
《计算机应用》
CSCD
北大核心
2024年第S01期11-17,共7页
-
基金
国家自然科学基金资助项目(62306267)
浙江省自然科学基金资助项目(LY22F020027)。
-
文摘
句子分类方法主要分为基于特征工程的机器学习方法、序列化模型和结构化模型,但基于特征工程的机器学习方法对词序不敏感易产生稀疏向量,序列化模型忽略了句子的短语、依存关系等句法结构信息,结构化模型如句法树、二叉树等的准确率受句法解析工具影响。针对上述问题,构建基于句法CYK(Cocke Younger Kasami)图神经网络(GNN)的知识增强文本分类模型S-CYK,对输入句子分别构建对应的短语树和CYK图以形成句法CYK图,并利用关系图注意力网络(RGAT)进行句子分类。在公共数据集AG’s News、DBpedia、ARP(Amazon Review Polarity)和ARF(Amazon Review Full)上的实验结果表明,与现有先进模型半监督变分自编码器(SSVAE)、对抗性微调BERT(AFTB)、基于GloVe的ABLSTM(GloVe+ABLSTM)和融合FastText的CNN(CNN with FastText)相比,S-CYK模型在4个数据集的准确率提升了0.04%~1.21%。S-CYK使用句法CYK图结构进行知识增强,能有效增强聚合句子信息的能力。
-
关键词
句法知识
CYK算法
知识增强
图神经网络
文本分类
-
Keywords
syntactic knowledge
CYK(Cocke Younger Kasami)algorithm
knowledge enhancement
Graph Neural Network(GNN)
text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度学习的楼梯行走地面反作用力及压力中心预测
- 6
-
-
作者
马晔
刘东威
侯美金
-
机构
宁波大学体育学院
浙江财经大学信息技术与人工智能学院
福建中医药大学康复产业研究院
-
出处
《医用生物力学》
CAS
CSCD
北大核心
2024年第S01期159-159,共1页
-
基金
国家自然科学基金项目,12002177
中国康复医学会2022年度科技发展项目,KFKT-2022-016
-
文摘
目的地面反作用力(GRFs)及足底压力中心(COPs)是生物力学动力学分析以及姿势控制研究的重要指标。在楼梯行走中需要使用配备至少两块测力台的特制楼梯采集完整的GRF和COP数据。该楼梯并非标准配置,且在实验室外场景也较难实现。因此,本研究将基于深度学习算法开发GRF和COP估算模型,使得在没有测力台的情况下能够进行楼梯行走的动力学分析。方法基于一维卷积神经网络(CNN)架构构建了一个深度学习模型,使用运动学数据作为输入来估算楼梯行走任务中的三维GRFs和二维COPs。构建了一个大型数据集训练该模型,包括从172名受试者中采集到的3782个楼梯行走实验数据。受试者包括健康人、膝骨性关节炎患者以及中高风险心血管疾病患者。使用十折交叉验证来评估模型的性能。通过比较测试集中整个步态周期估算的GRFs和COPs与测力台金标准数据得出的归一化均方根误差(n RMSE)来评估模型性能。结果所建模型在上下楼梯任务中达到了最先进的估计性能,其中三维GRFs和二维COPs的n RMSE分别为2.525%~7.518%和5.012%~19.434。结论所建模型基于运动学数据,在估计上下楼梯任务中的地面反作用力(GRFs)和压力中心(Co Ps)方面达到了最先进的准确性,可以满足临床使用或生物力学研究的要求。使用本研究提出的模型,可以在不配备测力台的楼梯行走场景中估计上下楼梯时的GRFs和Co Ps。
-
关键词
膝骨性关节炎
地面反作用力
生物力学研究
足底压力中心
深度学习
比较测试
十折交叉验证
步态周期
-
分类号
R318.01
[医药卫生—生物医学工程]
-
-
题名考虑资源下沉与家庭签约的医联体多目标协调优化决策
- 7
-
-
作者
隆清琦
刘杰鹏
彭娟娟
张树柱
-
机构
浙江财经大学信息技术与人工智能学院
-
出处
《运筹与管理》
CSSCI
CSCD
北大核心
2024年第12期24-31,共8页
-
基金
国家自然科学基金资助项目(72171208,71771195)
之江实验室开放课题(2021KG0AB04)。
-
文摘
资源下沉与家庭签约是推进医联体建设与发展的关键战略之一,对医疗资源配置优化具有重要意义。本文建立考虑三级医院资源下沉与社区医院家庭签约的双向转诊医疗服务供应链计算实验模型;围绕三级医院收益、社区医院患者到达率以及患者群体感知效用等目标函数,结合患者的病情轻重、自我诊断与个人偏好等随机因素,探索多目标进化算法所求解的帕累托前沿面;基于前景理论和Dematel-熵权法对最优帕累托前沿面进行VIKOR排序,得到了三种决策者偏好下的折衷方案。一个医疗服务供应链案例被用于验证研究框架的可行性与合理性,且案例结果显示该研究框架能有效处理三级医院、社区医院和患者群体间的协调优化决策问题,具有较强的方法论的有效性和结论的可靠性。本文在医联体内创新性地兼顾资源下沉与家庭签约,集成计算实验、多目标进化算法和改进的VIKOR排序至同一研究框架,有效提高了管理者的决策质量和能力,促进医疗服务供应链良性运作。
-
关键词
医联体协调
资源下沉
家庭签约
多目标优化
决策制定
-
Keywords
medical association coordination
resources sinking
family contract
multi-objective optimization
decision-making
-
分类号
C939
[经济管理—管理学]
R197.32
[医药卫生—卫生事业管理]
-