题名 信息熵方法及在中文问题分类中的应用
被引量:5
1
作者
张巍
陈俊杰
机构
山西职工医学院信息中心
太原理工大学计算机科学与技术学院
出处
《计算机工程与应用》
CSCD
2013年第10期129-131,179,共4页
基金
国家自然科学基金(No.60970059)
山西省科技攻关项目(No.20110313019)
山西省卫生厅科技攻关计划项目(No.2011073)
文摘
针对中文问题分类方法中布尔模型提取特征信息损失较大的问题,提出了一种新的特征权重计算方法。在提取问题特征时,通过把信息熵算法和医院本体概念模型结合在一起,进行问题的特征模型计算,在此基础上使用支持向量机方法进行中文问题分类。在城域医院问答系统的中文问题集上进行实验,证明了该方法的有效性,大类准确率及小类准确率分别达到89.0%和87.1%,取得了较好的效果。
关键词
信息熵
本体
问题分类
支持向量机
Keywords
information entropy
ontology
question classification
support vector machine
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于本体的高血压诊疗系统推理模型研究
被引量:4
2
作者
张巍
张绚
陈俊杰
机构
太原理工大学计算机科学与技术学院
山西职工医学院信息中心
山西 省疾病预防控制中心
出处
《计算机工程与设计》
CSCD
北大核心
2013年第11期4016-4020,共5页
基金
山西省科技攻关基金项目(20110313019)
山西省卫生厅科技攻关计划基金项目(2011073)
文摘
为了使用计算机辅助诊断和治疗高血压,提出了基于本体和案例推理的高血压诊疗系统的模型。构建高血压领域本体及推理规则,使用Jess推理机进行推理操作,用推理得到的新知识丰富知识库,提取部分本体实例作为小型案例库,使用Jena实现对本体库和案例库并行的查询,将查询和推理结果返回,给出一个适合病人情况的药物治疗和非药物治疗处方。实验结果表明,该方法具有可行性,对高血压诊疗系统的研究有较大的价值。
关键词
高血压
本体
案例推理
语义网规则语言
诊疗系统
Keywords
hypertension
ontology
CBR
SWRL
diagnosis and treatment system
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
题名 浅层语义分析及SPARQL在问答系统中的应用
被引量:3
3
作者
张巍
陈俊杰
机构
太原理工大学计算机与软件学院
山西职工医学院信息中心
出处
《计算机工程与应用》
CSCD
北大核心
2011年第2期118-120,共3页
基金
国家自然科学基金(No.60970059)
山西省国际科技合作计划项目(No.2009081022)~~
文摘
为了解决受限域问答系统中答案抽取的问题,提出了一种基于浅层语义分析的问答系统模型。该模型以自然语言为接口,利用医院信息本体,采用浅层语义分析技术,由语义块定义规则和语义块判定规则,首先生成问句向量,然后利用SPARQL查询技术,在本体中进行查询,从而得到答案。实验表明该方法可行,对自动问答系统的设计具有借鉴意义和深入研究的价值。
关键词
问答系统
浅层语义分析
自然语言处理
Keywords
question answering system
shallow semantic analysis
nature language processing
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 流形学习算法在中文问题分类中的应用研究
被引量:1
4
作者
张巍
张绚
陈俊杰
机构
山西职工医学院信息中心
太原理工大学计算机科学与技术学院
山西 省疾病预防控制中心
出处
《计算机应用与软件》
CSCD
北大核心
2014年第8期269-272,287,共5页
基金
国家自然科学基金项目(60970059)
山西省科技攻关项目(20110313019)
山西省卫生厅科技攻关计划项目(2011073)
文摘
针对中文问题分类方法中特征向量维数过高导致处理速度过慢的问题,提出一种基于局部鉴别索引和支持向量聚类的中文问题分类方法。首先利用局部鉴别索引算法对原始高维问句数据集进行降维,将其映射到一个低维空间中,然后通过支持向量聚类算法对问句进行分类。在哈工大社会计算与信息检索研究中心的中文问题集上进行实验,实验结果证明了该方法的有效性,大类准确率87.6%,小类准确率72.5%,取得了较好的效果。
关键词
问题分类
局部鉴别索引
支持向量聚类
流形学习
Keywords
Question classification Locality discriminating indexing Support vector clustering Manifold learning
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于fMRI脑机接口的数据分类方法的研究
被引量:1
5
作者
张巍
陈俊杰
机构
太原理工大学计算机科学与技术学院
山西职工医学院信息中心
出处
《太原理工大学学报》
CAS
北大核心
2017年第1期86-90,共5页
基金
国家自然科学基金资助项目:抑郁症fMRI数据分析方法及辅助诊断治疗模型研究(61170136)
多模态脑功能复杂网络分析方法及应用研究(61373101)
山西省软科学研究资助项目(2016041035-1)
文摘
为了解决脑机接口中功能磁共振成像(functional magnetic resonance imaging,fMRI)信号的数据分类问题,提出了使用后顶叶皮层进行特征选择的支持向量机分类方法。首先通过核磁设备采集数据,对数据预处理后,将后顶叶皮层的体素选择为特征,然后把血氧水平依赖(blood oxygen level dependent,BOLD)值的峰值和累积变化作为特征提取,最后使用支持向量机进行数据的分类。实验表明,选择后顶叶皮层作为特征是可行的;使用BOLD峰值的分类精度要高于使用BOLD累积变化的分类精度。
关键词
脑机接口
功能磁共振成像
支持向量机
分类
血氧水平依赖
Keywords
brain-computer interface
functional magnetic resonance imaging(fMRI)
supportvector machines
classification
BOLD
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 面向情感聚类的文本相似度计算方法研究
被引量:8
6
作者
李欣
李旸
王素格
机构
山西职工医学院信息中心
山西 大学计算机与信息 技术学院
山西 大学计算智能与中文信息 处理教育部重点实验室
出处
《中文信息学报》
CSCD
北大核心
2018年第5期97-104,共8页
基金
国家自然科学基金(61573231
61632011
+2 种基金
61672331
61432011)
山西省科技基础条件平台计划项目(2015091001-0102)
文摘
在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。实验结果表明,基于RESS的文本相似度计算方法,有效解决了文本向量的高维问题,更好地表达了文本间情感相似性,并获得较好的聚类结果。
关键词
文本情感聚类
文本相似度计算
文本语义子空间
Keywords
sentiment-based text clustering
text similarity calculation
text semantic subspace
分类号
TP391
[自动化与计算机技术—计算机应用技术]