检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

融合Dead-ends和离线监督Actor-Critic的动态治疗策略生成模型: 1; 作者杨莎莎于亚新 +3 位作者王跃茹许晶铭魏阳杰李新华《计算机科学》 CSCD 北大核心 2024年第7期80-88,共9页; 强化学习对数学模型依赖性低,利用经验便于架构和优化模型,非常适合用于动态治疗策略学习。但现有研究仍存在以下问题:1)学习策略最优性的同时未考虑风险,导致学到的策略存在一定的风险;2)忽略了分布偏移问题,导致学到的策略与医生策略... 展开更多; 关键词动态治疗策略 Dead-ends Actor-Critic 状态表征; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	融合Dead-ends和离线监督Actor-Critic的动态治疗策略生成模型	杨莎莎于亚新王跃茹许晶铭魏阳杰李新华	《计算机科学》 CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析