-
题名评《统计学:思想、方法与应用》
- 1
-
-
作者
耿直
-
机构
北京大学数学科学学院
北京大学统计科学中心
中国现场统计研究会
中国统计学会
-
出处
《统计研究》
CSSCI
北大核心
2012年第9期110-112,共3页
-
文摘
《统计学:思想、方法与应用》是一本具有国际视野、别具一格、面向非统计学专业学生的统计学教材。该教材立意高,努力探索新形势下我国统计学教材改革和发展的方向。本文旨在对该教材作一评介和推荐,希望能引起教师和学生的阅读兴趣。
-
关键词
统计学
统计教材
书评
-
Keywords
Statistics
Statistics Textbook
Book Review
-
分类号
C829.29
[社会学—统计学]
-
-
题名通用域适应综述
被引量:2
- 2
-
-
作者
何秋妍
邓明华
-
机构
北京大学数学科学学院
北京大学统计科学中心
北京大学定量生物学中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第1期120-144,共25页
-
基金
国家重点研发计划项目(2021YFF1200902)
国家自然科学基金项目(32270689,12126305)。
-
文摘
域适应问题放宽了传统机器学习问题关于训练样本和测试样本同分布的假设,在域间差异存在的情况下从富有标签的源域迁移知识到缺少标签的目标域.但现有域适应方法大多依赖于对源域和目标域标签集合的相对关系的假设,不贴合实际应用场景,因此,通用域适应问题考虑如何在缺少源域和目标域的标签集合先验信息的情况下,实现对目标域的标记.在此过程中,通用域适应方法需要判定目标域样本是否属于源域类别,克服域间差异和潜在的类别差异,在源域和目标域共有类上完成标签的迁移.首先从问题设置与方法策略2方面,对通用域适应方法进行梳理;然后通过实验对比了典型方法,进而分析了通用域适应问题的研究难点;随后整理了现有方法的应用情况,对与之有关的实际应用问题进行了分析;最后探讨了通用域适应问题未来研究方向.
-
关键词
通用域适应
迁移学习
对抗学习
对比学习
自训练
-
Keywords
universal domain adaptation
transfer learning
adversarial learning
contrastive learning
self-training
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名甲流了解程度、疫苗安全感知、接种行为及其影响机制
被引量:9
- 3
-
-
作者
秦昕
牛丛
黄振雷
徐敏亚
-
机构
北京大学光华管理学院
北京大学统计科学中心
-
出处
《心理学报》
CSSCI
CSCD
北大核心
2011年第6期684-695,共12页
-
基金
国家自然科学基金青年项目(10901010)
北京大学青年教师科研启动基金项目
-
文摘
采用问卷调查的方法,对甲流了解程度、疫苗安全感知、接种行为及其影响机制进行了研究,并运用结构方程对提出的模型进行了验证和调整。结果表明:(1)民众对甲流疫情基本情况、疫苗接种要求和传播途径等方面有较高的了解程度,但对预防措施和疫苗信息了解较少。(2)交流卷入对了解程度不存在显著影响;而新闻卷入对了解程度有显著正向影响,并且新闻卷入对感知疫苗安全程度的正向影响受到了解程度的部分中介。(3)感知甲流疫苗越安全,越倾向于选择接种疫苗。(4)人格对疫苗的风险认知存在显著影响,个人随和性(Agreeableness)程度越高,则感知疫苗的安全程度越高,而年龄和性别对其均没有显著影响。
-
关键词
甲流
疫苗
风险感知
人格
影响机制
-
Keywords
influenza A (H1N1)
vaccine
risk perception
personality
influential mechanism
-
分类号
B849
[哲学宗教—应用心理学]
C91
[经济管理]
-
-
题名蛋白质中残基远程相互作用预测算法研究综述
被引量:6
- 4
-
-
作者
张海仓
高玉娟
邓明华
郑伟谋
卜东波
-
机构
中国科学院计算技术研究所
中国科学院大学
北京大学定量生物学中心
北京大学数学科学学院
北京大学统计科学中心
中国科学院理论物理研究所
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第1期1-19,共19页
-
基金
国家"九七三"重点基础研究发展计划基金项目(2012CB316502
2015CB910303)
+7 种基金
国家自然科学基金项目(11175224
11121403
31270834
61272318
31171262
31428012
31471246)
中国科学院理论物理研究所理论物理国家重点实验室开放工程项目(Y4KF171CJ1)~~
-
文摘
蛋白质是由多个氨基酸残基顺序连接而成的长链.在天然状态下,蛋白质并不是无规则的自由状态,而是自发形成特定的空间结构,以执行其特定的生物学功能.驱动蛋白质形成特定空间结构的主要因素是残基间的非共价相互作用,包括疏水作用、静电相互作用、范德华力等.因此,对残基之间远程相互作用的准确预测将有助于对蛋白质空间结构的预测,进而有助于对蛋白质生物学功能的了解.在蛋白质进化过程,有相互作用残基对之间存在一种"共进化"模式,即当一个残基发生变异时,与其有相互作用的残基也要发生相应的变异,以维持相互作用,进而维持整体空间结构以及生物学功能.基于上述生物学观察,研究者开发了多个统计模型和算法以预测残基对之间的相互作用:1)概述残基之间远程相互作用的两大类基本预测算法,包括无监督学习方法和监督学习方法;2)使用蛋白质结构预测CASP比赛结果来客观比较上述各类算法的性能,分析各个算法的特点和优势;3)从生物学观察和统计模型2个角度分析总结了未来的发展趋势.
-
关键词
残基远程相互作用预测
蛋白质三级结构预测
图模型
共进化
机器学习
-
Keywords
protein contact prediction
protein tertiary structure prediction
graphical model
coevolution
machine learning
-
分类号
O62
[理学—有机化学]
-
-
题名复杂网络上疾病传播溯源算法综述
被引量:16
- 5
-
-
作者
黄春林
刘兴武
邓明华
周杨
卜东波
-
机构
中国科学院计算技术研究所
中国科学院大学
国家计算机网络应急技术处理协调中心
北京大学定量生物学中心
北京大学数学科学学院
北京大学统计科学中心
中国疾病预防控制中心
内梅亨大学
-
出处
《计算机学报》
EI
CSCD
北大核心
2018年第6期1376-1399,共24页
-
基金
国家科技重大专项(2008ZX10003009-005)
国家"九七三"重点基础研究发展规(2012CB316502)
+6 种基金
国家自然科学基金(11175224
11121403
31270834
31671369
31770775
61272318)
中国科学院理论物理研究所理论物理国家重点实验室开放工程项目(Y4KF171CJ1)资助~~
-
文摘
流感、肺结核等呼吸道传染病严重威胁人类的健康,因此当疫情爆发时,快速、准确地推断疾病起源,对于疾病防控具有重要的理论意义和应用价值.和社交网络上的谣言传播以及计算机网络上的病毒传播不同,呼吸道疾病依赖于人际物理接触,而且具有更为复杂的疾病传播模型.在该篇综述里,作者首先介绍了人际接触网络、疾病传播模型和疾病传播溯源问题的形式化定义,以及溯源问题在传播时间、快照覆盖程度、传播源数量和传播源候选节点这四个层面上的推广,给出了溯源算法的评价指标(准确率和错误距离)和基于贝叶斯极大似然估计的设计脉络;然后分别分析了现有的溯源算法,包括基于传染源中心性的算法、基于置信传播的算法、基于蒙特卡洛的算法以及基于最小描述长度的算法.在这四类算法中,基于传染源中心性的算法最多,使用了包括传播中心性、Jordan中心性、动态年龄和无偏中介中心性共4种中心性指标,并且基于传播中心性和Jordan中心性的算法被推广到更为一般的情形,如多个传播源、快照信息不完全等.作者分别在四种理想网络和两种真实人际接触网络下,实现并比较了常用溯源算法的性能.评估结果(包括准确率、错误距离、运行时间)表明:(1)溯源算法普遍对网络结构较为敏感;(2)多数算法对疾病传播参数具有鲁棒性;(3)相对于其他算法而言,动态消息传递算法尽管耗时几乎最长,但具有最高的准确度;(4)在耗时较短的算法中,无偏中介中心性具有相对较小的误差距离.根据实验结果,根据不同的使用场景推荐了不同的算法:(1)当运行时间不重要时,推荐动态消息传递算法;(2)相反,当希望快速溯源时,应该考虑基于无偏中介中心性的算法,当网络是随机树时,Jordan中心估计算法更优;(3)反向贪心算法和动态年龄算法分别在随机网络和无标度网络上兼顾了准确率和运行时间.最后,作者总结了该文中介绍的所有溯源算法的适用性和时间空间复杂度,讨论了它们的实际应用以及后续的免疫措施,并提出未来的研究趋势,包括研究更准确的极大似然估计算法以提高算法的准确度、挖掘并利用传播过程中的信息以提高现有溯源算法的效率,以及考虑动态人际接触网络以提高算法的实用性等.
-
关键词
复杂网络
疾病溯源
极大似然
置信传播
蒙特卡洛
-
Keywords
complex network
epidemic source identification
maximum likelihood
belief propagation
Monte - Carlo
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名自由响应ROC方法与相应多读者多病例研究的分析
被引量:3
- 6
-
-
作者
刘雪晴
周晓华
-
机构
北京大学公共卫生学院生物统计系
北京大学北京国际数学研究中心
北京大学统计科学中心
-
出处
《中国卫生统计》
CSCD
北大核心
2021年第4期607-610,614,共5页
-
文摘
目的本文旨在探讨自由响应ROC(free-response ROC,FROC)方法和变异FROC(alternative FROC,AFROC)方法相对传统ROC方法的优势与局限性,并提出生成平均AFROC曲线的非参数方法。方法通过FROC曲线和AFROC曲线的定义,从理论角度阐述两种方法的联系与优缺点。阐述在MRMC研究中生成平均AFROC曲线的方法,并证明平均AFROC曲线下的面积与平均AFROC-AUC相等。在实际数据中应用以上方法并对结果进行比较。结果与FROC曲线不同,不同的诊断试验产生的AFROC曲线具有相同的长度,因此能够进行多个曲线间的比较。平均AFROC曲线能够反映不同诊断试验的准确度大小,且与回归模型得到的结果一致。结论FROC研究更适合涉及多病变检测和定位任务的诊断试验。改进后的AFROC曲线能解决原始FROC曲线不利于比较的问题。基于非参数方法得到的平均AFROC曲线能直观地反映出诊断准确度,可在进行诊断试验评价时辅助其他结果共同报告。
-
关键词
诊断准确度
ROC曲线
自由响应
多读者多病例
-
分类号
R195.1
[医药卫生—卫生统计学]
-
-
题名一种基于集合最优插值的排放源快速反演方法
- 7
-
-
作者
吴煌坚
林伟
孔磊
唐晓
王威
王自发
陈松蹊
-
机构
北京大学光华管理学院
北京大学数学科学学院
北京大学统计科学中心
中国科学院大气物理研究所大气边界层物理和大气化学国家重点实验室
中国科学院大学
中国环境监测总站
中国科学院区域大气环境研究卓越创新中心
-
出处
《气候与环境研究》
CSCD
北大核心
2021年第2期191-201,共11页
-
基金
国家重点研发计划2016YFC0207703、2016YFC0207701、2016YFC0208903
北京市自然科学基金Z190001
+1 种基金
国家自然科学基金11671018、71532001、41875164
北京智源人工智能研究院项目。
-
文摘
基于集合卡尔曼滤波的源反演方法是估计排放源、提高空气质量模拟和预报精度的有效方法。为构建排放源与污染物浓度之间的误差协方差矩阵,该方法通常需要运行几十次大气化学传输模式。庞大的计算量限制了该方法的应用,使其无法为实时预报系统快速更新排放源。本研究发展了一种基于集合最优插值的排放源反演方法。该方法使用历史集合数据构建误差协方差矩阵,仅需一次常规的空气质量模拟便可根据观测模拟差异反演排放源,从而显著降低计算量。本文使用该方法同化2015年1月全国1107个地面站点观测的CO小时浓度数据,结合2014年1月的历史集合数据集,估计2015年1月全国15 km分辨率的CO排放源。该方案反演的全国CO排放总量仅比使用2015年1月集合数据集的反演量高1%,表明历史时段与反演时段的气象条件差异对月均CO排放的影响有限。使用历史集合数据集更新的排放源再次模拟可将全国349个独立验证站点的平均低估从0.74 mg m^(−3)降至0.01 mg m^(−3),均方根误差降低18%,表明该方法可快速更新排放源并降低其不确定性。
-
关键词
排放源反演
集合最优插值
CO排放源
-
Keywords
Emission inversion
Ensemble optimal interpolation
CO emission
-
分类号
P402
[天文地球—大气物理学与大气环境]
-