期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于真实世界临床数据的失眠病判别分析 被引量:2
1
作者 朱威 颜仕星 +1 位作者 张磊 李国正 《中国科学技术大学学报》 CAS CSCD 北大核心 2016年第10期867-873,共7页
基于真实世界中医医疗数据集,提出了针对性的中医非结构化转结构化的数据预处理方法,并在监督分类模型和半监督分类模型上对得到的症状特征进行了实验验证.在真实医疗数据集上进行实验,发现无论是监督分类算法还是半监督分类算法在所提... 基于真实世界中医医疗数据集,提出了针对性的中医非结构化转结构化的数据预处理方法,并在监督分类模型和半监督分类模型上对得到的症状特征进行了实验验证.在真实医疗数据集上进行实验,发现无论是监督分类算法还是半监督分类算法在所提出的数据预处理模型上都得到了较优的分类效果,并且发现标签传播算法不仅在分类器稳定性上取得了较大的优势,在带标注数据较少时,仍能取得较好的实验结果. 展开更多
关键词 结构化 半监督学习 标签传播 中医 疾病判别 失眠
在线阅读 下载PDF
中医临床不均衡数据疾病分类方法研究 被引量:3
2
作者 潘主强 张林 +2 位作者 张磊 李国正 颜仕星 《智能系统学报》 CSCD 北大核心 2017年第6期848-856,共9页
基于欠采样的不均衡数据分类算法是一种随机数据优化算法,但它不能最好地反映中医临床原始数据的分布并解决数据的特征冗余问题。提出了基于预测风险的最远病例不均衡装袋算法(PRFS-FPUSAB)。该算法中首先基于欠采样提出了改进的抽样方... 基于欠采样的不均衡数据分类算法是一种随机数据优化算法,但它不能最好地反映中医临床原始数据的分布并解决数据的特征冗余问题。提出了基于预测风险的最远病例不均衡装袋算法(PRFS-FPUSAB)。该算法中首先基于欠采样提出了改进的抽样方式尽可能地反映原始数据分布,然后结合集成学习、预测风险标准提高不均衡的分类性能并进行特征选择。在中医临床采集的经络电阻数据上的实验结果表明,该算法改善了曲线下面积并且选择的特征也符合中医学相关理论。 展开更多
关键词 中医临床 不均衡数据分类 原始数据分布 特征选择
在线阅读 下载PDF
中医临床数据疾病分类机器学习方法研究 被引量:3
3
作者 潘主强 张林 +1 位作者 颜仕星 张磊 《计算机工程与应用》 CSCD 北大核心 2017年第13期146-154,245,共10页
数字化经络仪、中医健康量表和四诊仪是中医临床常用辅助诊断工具,提供了很多中医临床数据。数据分布不均衡,同一个病例具有多个诊断标记是临床数据常见现象。以亚健康数据为例探索针对不均衡数据的机器学习分类方法;以肾脏疾病为例研... 数字化经络仪、中医健康量表和四诊仪是中医临床常用辅助诊断工具,提供了很多中医临床数据。数据分布不均衡,同一个病例具有多个诊断标记是临床数据常见现象。以亚健康数据为例探索针对不均衡数据的机器学习分类方法;以肾脏疾病为例研究综合三种辅助诊断工具的混合分类模型;以心血管病、血脂异常疾病、尿酸升高类疾病为例,探索多标记数据分类方法。实验均取得良好分类效果,同时所选择特征符合医学理论,具有临床指导意义。 展开更多
关键词 不均衡数据 混合模型 多标记学习 特征选择
在线阅读 下载PDF
中医睡眠情绪类疾病不均衡数据的分类研究 被引量:3
4
作者 潘主强 张林 +2 位作者 颜仕星 李国正 张磊 《济南大学学报(自然科学版)》 北大核心 2017年第1期55-60,共6页
针对中医临床在对有病个体分类时获得的数据很可能是不均衡的、缺失的,而且这种数据往往偏向于无病的个体这一问题,采用病例匹配最近邻填充算法(P-KNN算法)填充缺失值,同时使用基于风险预报准则特征选择的非对称Bagging(PRIFEAB)算法处... 针对中医临床在对有病个体分类时获得的数据很可能是不均衡的、缺失的,而且这种数据往往偏向于无病的个体这一问题,采用病例匹配最近邻填充算法(P-KNN算法)填充缺失值,同时使用基于风险预报准则特征选择的非对称Bagging(PRIFEAB)算法处理睡眠情绪类疾病的不均衡数据和特征选择问题。在中医临床采集的经络电阻数据上的实验结果显示,PRIFEAB算法改善了曲线下面积,并且选择的特征也符合中医学相关理论,同时P-KNN算法比平均值填充算法具有更好的性能。 展开更多
关键词 睡眠情绪类疾病 缺失值填充 不均衡数据 特征选择
在线阅读 下载PDF
中医临床疾病数据多标记分类方法研究 被引量:1
5
作者 潘主强 张林 +2 位作者 张磊 李国正 颜仕星 《计算机科学与探索》 CSCD 北大核心 2018年第8期1295-1304,共10页
WML-kN N(weighted multi-label k nearest neighbor)算法中近邻点个数取固定值,而没有考虑样本数据的实际特点,可能会将相似度高的点排除在近邻集外,或者将相似度低的点包含在近邻集内,这些都会影响分类器的性能。而中医(traditional C... WML-kN N(weighted multi-label k nearest neighbor)算法中近邻点个数取固定值,而没有考虑样本数据的实际特点,可能会将相似度高的点排除在近邻集外,或者将相似度低的点包含在近邻集内,这些都会影响分类器的性能。而中医(traditional Chinese medicine,TCM)临床获得的关于疾病的数据很可能是多标记的,同时由于病例的特殊性,每个病例可能具有不同的相似近邻集。因此,对WML-kNN算法进行了改进,提出WML-GkN N(WML-granular kNN)算法。该算法通过粒计算对粒度空间进行控制,从而确定近邻点集,使得邻域内的样本点有高相似性。在中医临床采集的经络电阻数据上的实验结果显示,WML-GkNN算法提高了分类性能。 展开更多
关键词 中医临床数据 多标记学习 粒计算 权重
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部