期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向医疗文本的实体及关系标注平台的构建及应用 被引量:16
1
作者 张坤丽 赵旭 +3 位作者 关同峰 尚柏羽 李羽蒙 昝红英 《中文信息学报》 CSCD 北大核心 2020年第6期36-44,共9页
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标... 医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标注方法费力费时,已难以适应大数据发展的需求。该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能。利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率。同时该平台也被应用于其他文本标注任务,表明该平台具有较好的任务移植性。 展开更多
关键词 文本标注 标注平台 实体标注 关系标注 数据分析
在线阅读 下载PDF
AS关系标注的因特网拓扑图的dK序列分析技术 被引量:2
2
作者 杨国强 窦强 窦文华 《计算机研究与发展》 EI CSCD 北大核心 2010年第9期1633-1642,共10页
拓扑特征分析和拓扑图生成是因特网拓扑研究的一个重要研究方向.dK特征序列被证明是一种有效的系统化拓扑特征分析方法,2K图已经能够在各种重要的拓扑度量方面与实际因特网拓扑图保持一致.在使用dK特征序列分析因特网拓扑时是用无向图... 拓扑特征分析和拓扑图生成是因特网拓扑研究的一个重要研究方向.dK特征序列被证明是一种有效的系统化拓扑特征分析方法,2K图已经能够在各种重要的拓扑度量方面与实际因特网拓扑图保持一致.在使用dK特征序列分析因特网拓扑时是用无向图来对因特网拓扑进行抽象的,然而对于自治系统(AS)级拓扑,由于AS之间存在复杂的商业关系,使用AS关系标注的拓扑图才能更精确地描述AS级拓扑特征.对dK特征序列进行了改进,提出了能够分析AS关系标注的拓扑图的dK′特征序列,并给出了生成满足指定2K′特征的拓扑图的算法.分析实验结果发现,2K′特征已经能够描述AS关系标注的拓扑图的各种重要特征. 展开更多
关键词 因特网 网络拓扑 自治系统 AS关系标注的拓扑图 dK序列
在线阅读 下载PDF
糖尿病电子病历实体及关系标注语料库构建 被引量:1
3
作者 叶娅娟 胡斌 +1 位作者 张坤丽 昝红英 《中文信息学报》 CSCD 北大核心 2023年第12期17-25,共9页
电子病历是医疗信息的重要来源,包含大量与医疗相关的领域知识。该文从糖尿病电子病历文本入手,在调研了国内外已有的电子病历语料库的基础上,参考I2B2实体及关系分类,建立了糖尿病电子病历实体及实体关系分类体系,并制定了标注规范。... 电子病历是医疗信息的重要来源,包含大量与医疗相关的领域知识。该文从糖尿病电子病历文本入手,在调研了国内外已有的电子病历语料库的基础上,参考I2B2实体及关系分类,建立了糖尿病电子病历实体及实体关系分类体系,并制定了标注规范。利用实体及关系标注平台,进行了实体及关系预标注及多轮人工校对工作,形成了糖尿病电子病历实体及关系标注语料库(Diabetes Electronic Medical Record entity and relation Corpus, DEMRC)。DEMRC共包含8 899个实体、456个实体修饰及16 564个关系,对其进行一致性评价和分析,发现实体及关系标注一致性达到了0.854 2和0.941 6。针对实体识别和实体关系抽取任务,分别采用基于迁移学习的BiLSTM-CRF模型和RoBERTa模型进行初步实验,并对语料库中的各类实体及关系进行评估,为后续糖尿病电子病历实体识别、关系抽取研究及糖尿病知识图谱构建打下基础。 展开更多
关键词 糖尿病 电子病历 实体及关系标注体系 语料库构建
在线阅读 下载PDF
基于动词名词和CHI特征选择的中文人物社会关系抽取 被引量:6
4
作者 曾辉 唐佳丽 +1 位作者 熊李艳 黄晓辉 《计算机应用研究》 CSCD 北大核心 2017年第6期1631-1635,共5页
针对中文人物社会关系标注语料库的匮乏和人物关系分类过于粗糙的问题,采用一种简单的方式标注了八类主要人物社会关系。为了有效地降低特征向量的维数避免维数灾难,并尽可能去除噪声特征以提高关系抽取的准确率,提出一种基于动词和名... 针对中文人物社会关系标注语料库的匮乏和人物关系分类过于粗糙的问题,采用一种简单的方式标注了八类主要人物社会关系。为了有效地降低特征向量的维数避免维数灾难,并尽可能去除噪声特征以提高关系抽取的准确率,提出一种基于动词和名词抽取与χ~2统计量法(CHI)相结合的特征选择方法,并使用TF-IDF计算特征权重。通过SVM分类器进行实验,F值和正确率都得到了提高;为了充分利用数据集对该特征选择方法的效果进行测试,使用k-折交叉验证检验该方法的有效性,实验表明通过该方法产生的分类模型具有较强的区分能力和泛化能力。 展开更多
关键词 人物关系抽取 人物关系标注 特征选择 CHI SVM分类器
在线阅读 下载PDF
基于文本挖掘机制的区域经济关系分析 被引量:5
5
作者 丁堃 刘盛博 许侃 《情报学报》 CSSCI 北大核心 2008年第3期418-424,共7页
已有的经济关系研究大都采用实证的或单纯的计量学的方法来实现的。本文则针对非结构化的文本特点,采用信息抽取和文本挖掘方法挖掘用户感兴趣的区域经济关系是具有十分重大应用价值的研究课题。本文在探讨了基于实体关系的文本挖掘机... 已有的经济关系研究大都采用实证的或单纯的计量学的方法来实现的。本文则针对非结构化的文本特点,采用信息抽取和文本挖掘方法挖掘用户感兴趣的区域经济关系是具有十分重大应用价值的研究课题。本文在探讨了基于实体关系的文本挖掘机制的基础上,对31个省、市、自治区的区域经济关系进行了分析。运用文本挖掘技术对经济关系的挖掘包括两种方式:一是基于属性的经济关系挖掘,利用信息抽取获取各个实体属性,采用聚类方法分析经济实体关系;二是基于相互引用的经济关系挖掘,首先构造经济实体关系分类词典,提出了实体关系标注算法,利用信息抽取获得实体之间的引用情况,然后构造关系有向图,从中挖掘区域经济之间的关系。研究表明,运用文本挖掘技术,既可以对各个区域经济发展状况进行分析和评价,也可以发现特定区域经济之间的内在关系。 展开更多
关键词 文本挖掘 同义扩充 实体关系 关系标注 聚类分析 区域经济
在线阅读 下载PDF
基于核数分层的AS关系拓扑建模 被引量:2
6
作者 郭虹 兰巨龙 +1 位作者 汪涛 刘洛琨 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2627-2634,共8页
基于真实AS级互联网拓扑实测数据进行层次特性和AS关系特性分析,提出了一种基于核数分层的AS关系拓扑动态演化模型.建模和仿真评估表明该模型在整体上具与实际网络相似的拓扑宏特性,还再现了AS商业关系的规律,是一种能够逼真模拟互联网A... 基于真实AS级互联网拓扑实测数据进行层次特性和AS关系特性分析,提出了一种基于核数分层的AS关系拓扑动态演化模型.建模和仿真评估表明该模型在整体上具与实际网络相似的拓扑宏特性,还再现了AS商业关系的规律,是一种能够逼真模拟互联网AS级拓扑宏观、微观特性的动态演化模型,并且作为一种AS关系推测算法,还能为任意的AS级无向图提供带AS关系标注的拓扑图,拓展了模型的应用. 展开更多
关键词 自治域级拓扑建模 带AS关系标注的拓扑图 带标记的度分布 层次性 k-core分解
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部