期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别 被引量:13
1
作者 潘璀然 王青华 +3 位作者 汤步洲 姜磊 黄勋 王理 《第二军医大学学报》 CAS CSCD 北大核心 2019年第5期497-506,共10页
目的提出一种基于Re-entity新分词方法的条件随机场(CRF)模型,并与双向长短记忆神经网络(BiLSTM)-CRF和Lattice-长短记忆神经网络(LSTM)进行比较。方法比较了现有实体识别方法和模型后,针对2018年全国知识图谱与语义计算大会(CCKS2018)... 目的提出一种基于Re-entity新分词方法的条件随机场(CRF)模型,并与双向长短记忆神经网络(BiLSTM)-CRF和Lattice-长短记忆神经网络(LSTM)进行比较。方法比较了现有实体识别方法和模型后,针对2018年全国知识图谱与语义计算大会(CCKS2018)任务一“电子病历命名实体识别”,提出基于Re-entity的CRF、BiLSTM-CRF、Lattice-LSTM方法,并在不同语料库训练不同参数级别的字符向量集。分别将各方法引入神经网络模型中进行模型性能对比实验,最后分别基于句子级和篇级输入句长进行对比研究。结果CRF模型在最优特征工程的结果下引入Re-entity方法后性能得到提高,句子级的Lattice-LSTM模型在该任务上取得了89.75%的严格F1-measure,优于CCKS2018任务一的最高结果(89.25%)。结论基于Re-entity新分词方法的CRF模型可利用中文临床药物知识库有效提高电子病历中药物的识别率,Re-entity方法可改善数据预处理阶段分词导致的错误累加,Lattice结构可以更好地结合字符和词序列的潜在语义信息,同时句子级输入能有效提高神经网络模型的识别准确率。 展开更多
关键词 计算机化病案系统 中文电子病历 实体识别 条件随机场 双向长短记忆神经网络 点阵长短记忆神经网络
在线阅读 下载PDF
乳腺癌患者新发心血管疾病预测模型的建立与验证:基于内蒙古区域医疗数据 被引量:1
2
作者 张云静 乔丽颖 +6 位作者 祁萌 严颖 亢伟伟 刘国臻 王明远 席云峰 王胜锋 《北京大学学报(医学版)》 CAS CSCD 北大核心 2023年第3期471-479,共9页
目的:开发和验证乳腺癌患者新发心血管疾病(cardiovascular disease,CVD)的3年预测模型。方法:基于内蒙古区域医疗数据,纳入接受抗肿瘤治疗的18岁以上乳腺癌女性患者。多因素Fine&Gray模型纳入预测因子后,使用Lasso回归筛选变量,在... 目的:开发和验证乳腺癌患者新发心血管疾病(cardiovascular disease,CVD)的3年预测模型。方法:基于内蒙古区域医疗数据,纳入接受抗肿瘤治疗的18岁以上乳腺癌女性患者。多因素Fine&Gray模型纳入预测因子后,使用Lasso回归筛选变量,在训练集上拟合Cox比例风险、Logistic回归、Fine&Gray、随机森林和XGBoost模型,在测试集上分别用受试者工作特征(receiver operating characteristics,ROC)曲线下面积(area under the curve,AUC)和校准曲线评价模型区分度和校准度。结果:共纳入19325例接受抗肿瘤治疗的乳腺癌患者,平均年龄(52.76±10.44)岁,中位随访时间1.18年[四分位距(interquartile range,IQR):2.71]。7856例患者(40.65%)在乳腺癌诊断3年内发生CVD。Lasso回归筛选的预测因子为乳腺癌诊断年龄、居住地国内生产总值(gross domestic product,GDP)、肿瘤分期、高血压、缺血性心脏病及脑血管疾病既往史、手术类型、化疗类型、放疗类型。不考虑生存时间时,XGBoost模型的AUC显著高于随机森林模型[0.660(95%CI:0.644~0.675)vs.0.608(95%CI:0.591~0.624),P<0.001]和Logistic回归[0.609(95%CI:0.593~0.625),P<0.001],Logistic回归和XGBoost模型的校准度更好。考虑生存时间时,Cox比例风险模型和Fine&Gray模型的AUC差异无统计学意义[0.600(95%CI:0.584~0.616)vs.0.615(95%CI:0.599~0.631),P=0.188],但Fine&Gray模型的校准度更好。结论:基于区域医疗数据建立乳腺癌新发CVD的预测模型具有可行性。不考虑生存时间时,Logistic回归和XGBoost模型的预测性能更好;考虑生存时间时,Fine&Gray模型的预测性能更好。 展开更多
关键词 乳腺肿瘤 心血管疾病 风险预测模型 危险性评估 计算机化病案系统
在线阅读 下载PDF
人工智能技术在基于电子病历研究中的应用与展望 被引量:10
3
作者 唐仕超 于观贞 姜磊 《第二军医大学学报》 CAS CSCD 北大核心 2018年第8期928-934,共7页
人工智能技术在临床医学领域已取得突破性进展,如诊断、影像、疾病分期分级等。电子病历蕴含疾病描述、诊断、检查、治疗等大量临床数据,在医学专家和信息学家的共同参与下,利用人工智能技术挖掘电子病历数据的研究急剧增加。虽然该方... 人工智能技术在临床医学领域已取得突破性进展,如诊断、影像、疾病分期分级等。电子病历蕴含疾病描述、诊断、检查、治疗等大量临床数据,在医学专家和信息学家的共同参与下,利用人工智能技术挖掘电子病历数据的研究急剧增加。虽然该方法目前存在一些局限性,但与传统人工研究相比其具有更快速、经济、方便等优势,有望更好地服务于人类健康医学事业的发展。本文对利用人工智能技术挖掘电子病历数据的现状,包括相关技术、具体实例、局限性等进行综述。 展开更多
关键词 人工智能 计算机化病案系统 数据源 自然语言处理
在线阅读 下载PDF
非结构化电子病历中信息抽取的定制化方法 被引量:22
4
作者 包小源 黄婉晶 +3 位作者 张凯 金梦 李岩 牛承志 《北京大学学报(医学版)》 CAS CSCD 北大核心 2018年第2期256-263,共8页
目的:电子病历数据中的主诉、现病史、既往史、鉴别诊断、影像诊断、手术记录等主体内主要采用中文自然语言文字描述,是临床医生实际诊疗细节的具体体现,包含了诊疗细节的大量、丰富信息。本研究目的在于建立一种从中进行有效信息提取... 目的:电子病历数据中的主诉、现病史、既往史、鉴别诊断、影像诊断、手术记录等主体内主要采用中文自然语言文字描述,是临床医生实际诊疗细节的具体体现,包含了诊疗细节的大量、丰富信息。本研究目的在于建立一种从中进行有效信息提取并组织成可分析利用的形式,供目前医学数据处理、医学研究之用。方法:基于医院的真实电子病历数据,设计定制化的基于规则学习及信息抽取方法,采用三个步骤实现中文信息的抽取:(1)抽样标注,随机抽取600份电子病历的病史信息(包括现病史、既往史、个人史、家族史等),采用本研究开发的标注平台,对其中需要抽取的信息(以糖尿病史为实例)进行标注;(2)根据标注结果,进行抽取模版归纳,并将抽取模版进行重写,生成可以直接用于抽取的Perl语言正则表达式抽取规则,并利用这些规则进行实际信息抽取;(3)对抽取结果进行人工验证与自动化验证相结合的方法,对方法的有效性进行验证。结果:所设计方法已在国家医疗数据中心平台上实现,并针对糖尿病病史抽取在医院进行了单个科室的现场验证,2015年1 436份糖尿病患者病历的病史抽取结果为召回率87.6%、准确率99.5%、F分数(F-Score)0.93;全体糖尿病患者10%抽样病历共1 223份的抽取结果为召回率89.2%、准确率99.2%、F-Score 0.94,效果较好。结论:主要采用自然语言处理与基于规则的信息抽取相结合的方法,设计并实现了从非结构化的中文电子病历文本数据中抽取定制化信息的算法,与已有工作比对效果较好。 展开更多
关键词 病案系统 计算机化 信息获取 糖尿病 病史记录
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部