期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
医学研究生统计学教育的发展与思考 被引量:17
1
作者 武晓岩 李康 《中国卫生统计》 CSCD 北大核心 2007年第3期305-307,共3页
关键词 医学统计学 医学研究生 教育 统计分析方法 科学性 百科全书 艺术
在线阅读 下载PDF
代谢组学数据分析的统计学方法 被引量:47
2
作者 柯朝甫 张涛 +1 位作者 武晓岩 李康 《中国卫生统计》 CSCD 北大核心 2014年第2期357-359,365,共4页
代谢组学是近年发展快速的一门学科,目前在医学、植物学、微生物学、毒理学、药物研发等诸多领域中得到了广泛的应用。代谢组学研究产生大量的数据,这些数据具有高维、小样本、高噪声等复杂特征。如何从复杂的代谢组学数据中提取出有... 代谢组学是近年发展快速的一门学科,目前在医学、植物学、微生物学、毒理学、药物研发等诸多领域中得到了广泛的应用。代谢组学研究产生大量的数据,这些数据具有高维、小样本、高噪声等复杂特征。如何从复杂的代谢组学数据中提取出有价值的信息,筛选出潜在的生物标志物成为近年来代谢组学研究的热点和难点。据此,本文针对目前代谢组学数据分析中的常用统计学方法及其研究进展进行介绍。 展开更多
关键词 代谢组学 统计学方法 生物标志物 微生物学 药物研发 植物学 毒理学
在线阅读 下载PDF
三臂非劣效性设计生存时间数据的半参数统计推断方法
3
作者 李轶群 吴莹 侯艳 《中国卫生统计》 CSCD 北大核心 2013年第4期476-479,483,共5页
目的推荐并改进一种用于新药临床试验中生存分析三臂非劣效性设计的半参数统计推断方法。方法采用Cox比例风险模型建立用于生存时间数据的三臂非劣效检验方法,通过模拟试验验证该方法的有效性,并给出样本含量估计的R语言程序。结果模拟... 目的推荐并改进一种用于新药临床试验中生存分析三臂非劣效性设计的半参数统计推断方法。方法采用Cox比例风险模型建立用于生存时间数据的三臂非劣效检验方法,通过模拟试验验证该方法的有效性,并给出样本含量估计的R语言程序。结果模拟试验结果证实,在样本删失风险率维持在一定水平时,三臂Cox模型能有效地控制I类错误发生概率,并保证较高的检验效能,实际应用简单有效。结论本文推荐的方法,可以有效地应用于三臂生存时间数据的非劣效性研究。 展开更多
关键词 临床试验 三臂非劣效 生存分析 COX模型
在线阅读 下载PDF
临床试验统计分析报告SAS与R语言图形表达宏程序的实现 被引量:3
4
作者 张雷 吴莹 +1 位作者 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2013年第2期294-299,共6页
目前我国的临床试验统计分析工作,通常由具有临床试验经验的统计人员通过SAS软件实现并给出统计分析报告。对于重要的研究结果,若能在统计分析报告中恰当配合统计图形则更便于对结果的理解和解释。在SAS系统中,SAS/GRAPH作为专门的... 目前我国的临床试验统计分析工作,通常由具有临床试验经验的统计人员通过SAS软件实现并给出统计分析报告。对于重要的研究结果,若能在统计分析报告中恰当配合统计图形则更便于对结果的理解和解释。在SAS系统中,SAS/GRAPH作为专门的图形可视化模块具有十分强大的图形表现功能,利用图形功能可以在数据分析的同时更好地展现数据特点和相互之间的关系。SAS/GRPAH中提供了大量的图形选择和相应的选项,通过修改控制图形的选项之后,可以生成各种图形。 展开更多
关键词 统计分析报告 SAS系统 统计图形 临床试验 程序 语言 软件实现 统计人员
在线阅读 下载PDF
PLS-DA模型四种诊断统计量在代谢组学应用中的比较 被引量:9
5
作者 柯朝甫 武晓岩 李康 《中国卫生统计》 CSCD 北大核心 2014年第3期403-406,共4页
目的比较PLS-DA模型四种诊断统计量在代谢组学数据分析中的检验效能和稳定性。方法采用双重交叉验证和置换检验的PLS-DA模型验证策略,并分别使用四种诊断统计量对模拟数据和实际数据进行分析。结果AUC统计量较误判数(率)、Q2和DQ2统计... 目的比较PLS-DA模型四种诊断统计量在代谢组学数据分析中的检验效能和稳定性。方法采用双重交叉验证和置换检验的PLS-DA模型验证策略,并分别使用四种诊断统计量对模拟数据和实际数据进行分析。结果AUC统计量较误判数(率)、Q2和DQ2统计量具有更高的检验效能;同时,AUC统计量与其他三种诊断统计量相比较,具有更高的稳定性。结论 AUC统计量是PLS-DA模型验证过程中一种稳定有效的诊断统计量,推荐作为代谢组学研究中进行PLS-DA分析时的首选诊断统计量。 展开更多
关键词 PLS—DA 代谢组学 诊断统计量 双重交叉验证 置换检验
在线阅读 下载PDF
候选基因关联研究的统计分析方法
6
作者 肖纯 史晓雯 +2 位作者 刘芸良 张奇 刘艳 《中国卫生统计》 CSCD 北大核心 2017年第1期181-184,共4页
随着新一代测序技术的发展及全基因组关联研究(genome-wide association study,GWAS)策略的推广,复杂性疾病基因关联研究涉及的SNP位点逐渐增加,且资料收集的逐渐完善促使描述疾病结局相关的指标增多,使样本信息多元化。
关键词 关联研究 候选基因 复杂性疾病 测序技术 连锁分析 表达产物 资料收集 统计量 基因序列 变量模型
在线阅读 下载PDF
疾病治疗质量纵向综合评价模型的构建及在CIS中的应用
7
作者 于磊 刘梦洋 +2 位作者 王超 栗景坤 刘美娜 《中国卫生统计》 CSCD 北大核心 2024年第5期662-666,670,共6页
目的构建疾病治疗质量纵向综合评价模型,应用模型评价急性缺血性脑卒中(cerebral ischemic stroke,CIS)的治疗质量。方法潜变量测量模型联合多项式和多水平回归,建立疾病治疗质量纵向综合评价模型,利用马尔科夫蒙特卡洛(Markov Chain Mo... 目的构建疾病治疗质量纵向综合评价模型,应用模型评价急性缺血性脑卒中(cerebral ischemic stroke,CIS)的治疗质量。方法潜变量测量模型联合多项式和多水平回归,建立疾病治疗质量纵向综合评价模型,利用马尔科夫蒙特卡洛(Markov Chain Monte Carlo,MCMC)方法进行参数估计。模拟研究确定模型的适用条件,通过均方根误差(root mean square error,RMSE)和秩相关系数评价模型参数估计的准确性,并与潜变量增长曲线模型(latent growth curve model,LGCM)进行效果比较。结果构建可用于评价疾病治疗质量纵向变化、趋势变化及协变量影响的综合模型。模拟研究结果:评价对象数对模型效果影响较小,观测时间数6个、评价指标数20个时,模型可获得评价对象不同时间点治疗质量及变化趋势。治疗质量估计值与真值的秩相关系数均值为0.8128,高于LGCM的0.7610,协变量回归系数估计值与真值的RMSE均值为0.3756,低于LGCM的0.448;观测时间数及评价指标数越多,纵向综合评价模型效果越准确,且始终高于LGCM。应用结果:2011年到2016年,医院CIS平均治疗质量综合得分增加了0.9256,二级和三级医院分别增加了0.9432和1.321,教学和非教学医院分别增加了1.4904和1.1155。结论纵向综合评价模型可以全面合理评价疾病治疗质量及其纵向变化,分析评价对象的差异对变化趋势的影响。我国CIS治疗质量总体向好,变化趋势受医院等级及教学状态影响,研究结果可为后续有针对性的治疗质量干预措施制定及治疗质量的持续改善提供参考。 展开更多
关键词 治疗质量评价 纵向研究 综合评价模型 急性缺血性脑卒中
在线阅读 下载PDF
SDAEC算法在单细胞测序数据批次校正中的应用
8
作者 王文杰 李康 谢宏宇 《中国卫生统计》 CSCD 北大核心 2024年第4期501-506,共6页
目的 提出深度堆叠降噪自编码嵌套聚类(stacked denoising auto encoder embedded cluster, SDAEC)算法并用于单细胞mRNA测序(single cell mRNA sequence, scRNA-seq)数据的批次效应移除,对其移除批次效应性能进行评估。方法 基于单细... 目的 提出深度堆叠降噪自编码嵌套聚类(stacked denoising auto encoder embedded cluster, SDAEC)算法并用于单细胞mRNA测序(single cell mRNA sequence, scRNA-seq)数据的批次效应移除,对其移除批次效应性能进行评估。方法 基于单细胞数据具有高维度、高稀疏性及高度非线性误差特点,通过将单细胞Louvain聚类算法嵌入堆叠降噪自动编码器(stacked denoising auto encoder, SDAE)算法中,形成SDAEC算法,用于单细胞测序数据的批次效应移除。结合实际卵巢癌组织scRNA-seq数据,利用分布邻域嵌入(t-distributed stochastic neighbor embedding, tSNE)、 k最近邻批次效应检测(k-nearest-neighbor batch-effect test, kBET)、调整兰德系数(adjusted rand index, ARI)、标准化互信息(normalized mutual information, NMI)、平均轮廓宽度(average silhouette width, ASW)评价其移除批次效应性能。结果 利用SDAEC方法对scRNA-seq数据批次效应移除性能高于Combat、相互最近邻(mutual nearest neighbors, MNN)、分布匹配残差网络(maximum mean discrepancy distribution-matching residual networks, MMD-ResNet)和基于零膨胀负二项的方差提取法(zero-inflated negative binomial-based wanted variation extraction, ZINB-WaVE)。结论 SDAEC算法能够移除scRNA-seq数据的批次效应,提高scRNA-seq数据下游分析的有效性,具有实际应用价值。 展开更多
关键词 深度堆叠降噪自编码嵌套聚类 单细胞测序 批次效应 卵巢癌
在线阅读 下载PDF
基于增强子调控化疗相关基因的结直肠癌分型研究
9
作者 田伟 严光灿 +1 位作者 张秋菊 刘美娜 《中国卫生统计》 CSCD 北大核心 2024年第1期45-48,52,共5页
目的 利用增强子RNA调控的化疗相关基因对结直肠癌患者进行分型,为精准医疗提供依据。方法 通过TCGA、 GEO数据库获取结直肠癌患者基因表达数据,筛选增强子调控的化疗相关基因,利用非负矩阵分解方法进行直肠癌患者分型,并在独立数据集... 目的 利用增强子RNA调控的化疗相关基因对结直肠癌患者进行分型,为精准医疗提供依据。方法 通过TCGA、 GEO数据库获取结直肠癌患者基因表达数据,筛选增强子调控的化疗相关基因,利用非负矩阵分解方法进行直肠癌患者分型,并在独立数据集中验证分型结果的稳定性。通过生存分析、 GSVA、 SubMap方法,比较各亚型患者在生存结局、代谢通路活性、免疫浸润细胞浸润等方面的差异。收集结直肠癌新辅助化疗患者血浆,检测血浆蛋白表达量,分析增强子RNA(eRNA)调控基因与结果化疗敏感性的相关性。结果 本研究收集了581人的TCGA基因表达数据,筛选50个eRNA调控的化疗相关基因,通过非负矩阵分解获得三个结直肠癌亚型:eRNA1、 eRNA2、 eRNA3, GEO验证集的分型结果与TCGA基因表达数据一致,均分为3个亚型。生存分析、代谢通路分析、免疫浸润分析提示:eRNA2,生存结局最差、 32个代谢相关通路异常激活、免疫浸润程度明显偏低。在蛋白水平上,eRNA调控基因与化疗敏感性存在关联性。结论 在缺乏有效结直肠癌临床分型的前提下,本研究通过eRNA调控的化疗相关靶基因可以进行结直肠癌稳定有效的分型;各亚型在生存结局、免疫细胞浸润、代谢相关通路研究中的差异,可为临床个体化治疗提供指导,并为相关机制研究指供线索。 展开更多
关键词 结直肠癌 增强子RNA 化疗 代谢通路
在线阅读 下载PDF
随机森林回归分析及在代谢调控关系研究中的应用 被引量:33
10
作者 李贞子 张涛 +1 位作者 武晓岩 李康 《中国卫生统计》 CSCD 北大核心 2012年第2期158-160,163,共4页
目的探讨随机森林回归处理非线性、具有交互作用数据的性能,并将其应用于高维代谢组学数据的代谢网络变量筛选。方法通过模拟试验验证随机森林回归在具有交互作用和非线性情况下回归分析的效果,同时应用于卵巢良恶性肿瘤鉴别的代谢组学... 目的探讨随机森林回归处理非线性、具有交互作用数据的性能,并将其应用于高维代谢组学数据的代谢网络变量筛选。方法通过模拟试验验证随机森林回归在具有交互作用和非线性情况下回归分析的效果,同时应用于卵巢良恶性肿瘤鉴别的代谢组学数据分析。结果模拟实验结果显示:对于具有交互作用及其他非线性关系的模拟数据,随机森林回归模型的效果明显优于多元线性回归模型;卵巢癌代谢组学数据分析显示,使用随机森林回归分析能够获得更为理想的结果。结论随机森林回归作为一种非参数回归技术,在一定的样本含量下(如n>100),能够在高维数据中有效地分析具有交互作用和非线性关系的数据。 展开更多
关键词 随机森林 多元回归分析 代谢组学 代谢调控网络
在线阅读 下载PDF
OPLS方法的原理及其在代谢组学数据判别分析中的应用 被引量:16
11
作者 李俊南 侯艳 +1 位作者 孙凤宇 李康 《中国卫生统计》 CSCD 北大核心 2014年第5期765-769,共5页
目的探讨orthogonal projection to latent structures(OPLS)方法的原理、特点及其在代谢组学高维数据分析中的应用。方法通过R语言编程实现OPLS方法,利用模拟试验探索OPLS的特性及适用条件,并通过实际数据进行验证。结果利用一个OPLS... 目的探讨orthogonal projection to latent structures(OPLS)方法的原理、特点及其在代谢组学高维数据分析中的应用。方法通过R语言编程实现OPLS方法,利用模拟试验探索OPLS的特性及适用条件,并通过实际数据进行验证。结果利用一个OPLS预测主成分的模型拟合效果与利用偏最小二乘(PLS)多个主成分的模型拟合效果相同,同时具有较好的判别能力,其得分图的可视化效果优于PLS。结论 OPLS能够有效去除自变量矩阵X中与因变量Y无关的信息,使模型变得简单、易于解释,同时具有较好的可视化效果,可有效地用于代谢组学数据分析中。 展开更多
关键词 ORTHOGONAL PROJECTION to LATENT structures(OPLS) 模型拟合 可视化 代谢组学
在线阅读 下载PDF
中介分析方法及在其医学研究中的应用 被引量:23
12
作者 杨春艳 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2017年第1期159-162,共4页
目前,中介分析已经被广泛应用于心理、预防、流行病等的医学研究,与传统的多元分析方法不同,中介分析不仅需要分析自变量与因变量之间的关系,还需要对自变量的不同作用加以分析,在一定程度上揭示自变量对因变量影响的内在机制,是一种因... 目前,中介分析已经被广泛应用于心理、预防、流行病等的医学研究,与传统的多元分析方法不同,中介分析不仅需要分析自变量与因变量之间的关系,还需要对自变量的不同作用加以分析,在一定程度上揭示自变量对因变量影响的内在机制,是一种因果效应推断的方法,已经越来越受到医学科研工作者的关注。 展开更多
关键词 医学研究 多元分析方法 分析模型 调节变量 置信区间 因果关系 BOOTSTRAP 回归方程 非参数方法 蒙特卡罗方法
在线阅读 下载PDF
多重假设检验中FDR的控制与估计方法 被引量:15
13
作者 刘晋 张涛 李康 《中国卫生统计》 CSCD 北大核心 2012年第2期305-308,共4页
近年来,基因组学、蛋白组学和代谢组学等高通量检测技术得到迅速发展〔1-4〕,由此产生变量数目巨大的数据(如m〉2000),而样品数目较小(如10≤n≤100),用传统的统计检验方法对生物标志物进行鉴别会产生大量的假阳性结果 (如检验水... 近年来,基因组学、蛋白组学和代谢组学等高通量检测技术得到迅速发展〔1-4〕,由此产生变量数目巨大的数据(如m〉2000),而样品数目较小(如10≤n≤100),用传统的统计检验方法对生物标志物进行鉴别会产生大量的假阳性结果 (如检验水准取α=0. 展开更多
关键词 多重假设检验 估计方法 FDR 统计检验方法 假阳性结果 生物标志物 基因组学 检测技术
在线阅读 下载PDF
基于色谱-质谱平台的代谢组学数据预处理方法 被引量:6
14
作者 孙琳 张秋菊 +4 位作者 王文佶 曲思杨 谢彪 高兵 刘美娜 《中国卫生统计》 CSCD 北大核心 2017年第3期518-522,共5页
代谢组学的概念自20世纪90年代被正式提出,已被广泛应用于医学研究领域,其一般研究流程包括样本采集、样本检测、数据预处理、数据分析和生物学解释等。常用的样本检测技术有核磁共振(nuclear magnetic resonance,NMR)和高分辨率色谱... 代谢组学的概念自20世纪90年代被正式提出,已被广泛应用于医学研究领域,其一般研究流程包括样本采集、样本检测、数据预处理、数据分析和生物学解释等。常用的样本检测技术有核磁共振(nuclear magnetic resonance,NMR)和高分辨率色谱-质谱联用技术,本文所述方法针对后者。 展开更多
关键词 代谢组学 数据预处理方法 色谱-质谱 样本采集 医学研究领域 研究流程 数据分析 高分辨率 噪声强度 缺失数据
在线阅读 下载PDF
随机森林方法在基因表达数据分析中的应用及研究进展 被引量:29
15
作者 武晓岩 李康 《中国卫生统计》 CSCD 北大核心 2009年第4期437-440,共4页
关键词 基因表达数据 基因芯片技术 人类基因组 森林 随机 相关基因表达 后基因组时代 基因功能
在线阅读 下载PDF
基因表达数据的随机森林逐步判别分析方法 被引量:14
16
作者 武晓岩 闫晓光 李康 《中国卫生统计》 CSCD 北大核心 2007年第2期151-154,共4页
目的给出一种新的随机森林算法,它能在建模过程中自动对变量进行筛选,建立“最优”判断模型。方法采用变量重要性评分和逐步迭代算法选择有作用的变量;通过实际基因表达数据考核其应用效果,并使用R语言编程做模拟试验验证其有效性。结... 目的给出一种新的随机森林算法,它能在建模过程中自动对变量进行筛选,建立“最优”判断模型。方法采用变量重要性评分和逐步迭代算法选择有作用的变量;通过实际基因表达数据考核其应用效果,并使用R语言编程做模拟试验验证其有效性。结果三种疾病基因表达数据的判别模型,在包含很少量的基因情况下便获得了理想的分类效果;模拟试验则显示在类间区分度较大的情况下,随机森林逐步判别分析的效果明显,能有效地将有作用的变量保留在模型中,提高模型的判别效果;在类间区分度不够大的情况下分类效果提高不明显。结论随机森林逐步判别分析可以有效地应用于基因表达数据的基因筛选和分类研究,但要特别注意由随机波动对分析结果造成的影响。 展开更多
关键词 随机森林 基因表达数据 判别分析 基因筛选
在线阅读 下载PDF
高维组学数据的变量筛选方法及其应用 被引量:5
17
作者 侯艳 谢宏宇 +1 位作者 张晓凤 李康 《中国卫生统计》 CSCD 北大核心 2016年第3期521-526,共6页
随着生物检测技术的不断发展,实际中可以获得基因组、蛋白质组和代谢组等各种来源的高维组学数据,如何从海量数据中准确选择与疾病有关的特征变量,从而构建准确的预测模型一直是国内外的研究热点。
关键词 变量筛选 特征变量 遗传算法 预测模型 马尔科夫 回归系数 评价函数 变量选择 过拟合 主成分分析
在线阅读 下载PDF
临床试验评价的ROC分析方法 被引量:13
18
作者 赵发林 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2007年第4期349-351,共3页
目的探讨新药临床试验效果的评价问题,给出一种新的统计分析方法。方法基于ROC分析给出多变量ROC模型,采用有序logit联系函数,利用SAS软件进行参数估计,得到有协变量及交互作用情况下的ROC曲线方程及曲线下面积。结果采用文中给出的方法... 目的探讨新药临床试验效果的评价问题,给出一种新的统计分析方法。方法基于ROC分析给出多变量ROC模型,采用有序logit联系函数,利用SAS软件进行参数估计,得到有协变量及交互作用情况下的ROC曲线方程及曲线下面积。结果采用文中给出的方法,可以有效地扣除协变量的影响,用ROC曲线直观地评价药物之间的差别和作用。结论本文提供的方法能够更有效地对临床试验做出客观和准确的评价。 展开更多
关键词 临床试验 ROC分析 有序LOGIT模型
在线阅读 下载PDF
基因表达数据判别分析的随机森林方法 被引量:22
19
作者 武晓岩 李康 《中国卫生统计》 CSCD 北大核心 2006年第6期491-494,共4页
目的探讨随机森林算法在基因表达数据分类研究中的应用。方法通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在存在大量无差异表达基因情况下对分类产生的影响。结果随机森林算法对基因表达数据的分类具有较高的... 目的探讨随机森林算法在基因表达数据分类研究中的应用。方法通过实际基因表达数据考核其应用效果,并通过模拟试验进一步验证和研究在存在大量无差异表达基因情况下对分类产生的影响。结果随机森林算法对基因表达数据的分类具有较高的准确性,但随着基因数量的增加其判别效果呈下降的趋势,在差异表达基因之间具有相关性时,下降趋势明显减慢,能够获得较理想的分类效果。结论随机森林算法对基因表达数据的分类研究有较好的判别效果。 展开更多
关键词 分类树 随机森林 基因表达数据 模拟试验
在线阅读 下载PDF
不同专科重症监护病房高频接触物体表面的量性研究 被引量:5
20
作者 张慧琳 芦桂芝 +5 位作者 陈天成 仰曙芬 李静 宋艳蕾 王秀丽 陈颖丽 《中国感染控制杂志》 CAS 北大核心 2017年第6期506-510,共5页
目的通过对不同专科重症监护病房(ICU)常见物体表面接触次数进行观察统计,明确不同专科ICU的高频接触物体表面,为医院环境管理提供依据。方法采用直接观察法对医务人员的日常活动进行观察,记录各类常见物体表面的接触次数,采用Poisson... 目的通过对不同专科重症监护病房(ICU)常见物体表面接触次数进行观察统计,明确不同专科ICU的高频接触物体表面,为医院环境管理提供依据。方法采用直接观察法对医务人员的日常活动进行观察,记录各类常见物体表面的接触次数,采用Poisson分布对数据进行统计分析。结果 ICU的高频接触物体表面日平均接触次数由高至低依次为病历夹(28.00次)、椅子(18.38次)、抢救车(治疗车,17.29次)、床表面(13.90次)、静脉输液管路(13.76次)、医护用笔(13.38次)和静脉输液泵(11.81次)。这7类物体表面在观察期间的接触次数占所有物体表面接触次数的64.01%。不同专科ICU又略有差异:综合ICU的高频接触物体表面是上述的前6类;心胸外科ICU的高频接触物体表面除了包含上述的7类外还包括键盘与鼠标,共9类;内科ICU的高频接触物体表面是上述前6类及手机。结论同一所医院不同专科ICU高频接触物体表面不同,因此医院应根据各科室高频接触物体表面的实际情况制定相应的消毒管理措施,继而减少医院感染的发生。 展开更多
关键词 高频接触 物体表面 重症监护病房 量性
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部