期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
中文医学细粒度知识表示体系与标注语料库构建 被引量:4
1
作者 杨洋 关毅 +3 位作者 李雪 姜京池 史怀璋 柳曦光 《中文信息学报》 CSCD 北大核心 2023年第6期52-66,共15页
面向医学知识的细粒度、可共享性与高精准性的需求,该文提出了中文医学文本知识表示体系,融合了电子病历、医学书籍与专业医学网站文本三个数据来源的医疗知识。该体系包括9类医学实体、60类实体关系。基于此,开发了可操作性高的标注工... 面向医学知识的细粒度、可共享性与高精准性的需求,该文提出了中文医学文本知识表示体系,融合了电子病历、医学书籍与专业医学网站文本三个数据来源的医疗知识。该体系包括9类医学实体、60类实体关系。基于此,开发了可操作性高的标注工具,并为每种来源提供了规范标注的医学文本数据,构建了涵盖范围广、一致性高的细粒度标注语料库。4名临床医生对《诊断学》书籍标注了6526个医学实体,4229条关系,标注一致性可达0.974。三个数据源融合后实体数量344475个,关系数量3196787条。该文综述了数据源融合的映射过程、标注细则,分析了各数据源的文本特点并总结标注模式,通过应用场景与文本特点表明医学书籍标注必要性。该文为中文医学语料库构建提供标注规范,并为中文医学实体识别与关系抽取提供语料支持。 展开更多
关键词 细粒度标注规范 多源医疗文本 语义标注 语料库构建
在线阅读 下载PDF
藏语口语语音语料库的设计与研究 被引量:9
2
作者 黄晓辉 李京 马睿 《计算机工程与应用》 CSCD 北大核心 2018年第13期231-235,共5页
基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、... 基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供了可靠的数据支撑。 展开更多
关键词 语音语料库 口语语音 语音识别 标注规范 藏语拉萨话
在线阅读 下载PDF
基于模型定义的数字化设计系统的建设思路 被引量:6
3
作者 卢健钊 方伟 王东 《机械设计与制造》 北大核心 2018年第10期180-183,共4页
随着数字化技术的高速发展,基于模型定义的数字化设计与制造技术已经成为制造业信息化的发展趋势。针对我所产品的设计及制造现状,指出了基于模型定义的系统建设工作的必要性,构建了MBD设计系统的框架,并从MBD数字化设计流程、MBD设计... 随着数字化技术的高速发展,基于模型定义的数字化设计与制造技术已经成为制造业信息化的发展趋势。针对我所产品的设计及制造现状,指出了基于模型定义的系统建设工作的必要性,构建了MBD设计系统的框架,并从MBD数字化设计流程、MBD设计标准规范体系的建立、NX设计软件平台的集成开发、模型检查工具及MBD工艺标注等方面提出了较为详细的建设思路。随着MBD理念的推广和设计系统的应用,有助于推进我所未来数字化设计、智能化制造的发展。 展开更多
关键词 基于模型定义 设计流程 标准规范体系 集成开发 模型检查 工艺标注
在线阅读 下载PDF
铝硅合金实体关系抽取数据集的构建方法 被引量:5
4
作者 刘英莉 吴瑞刚 +1 位作者 么长慧 沈韬 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期245-253,共9页
针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标... 针对材料领域没有适合材料实体关系抽取技术研究工作的公开数据集这一问题,通过研究高硅铝合金喷射沉积文献提出铝硅合金实体关系抽取数据集的构建方法.在材料领域专家的指导下制定铝硅合金实体关系抽取数据集的构建标准,并根据构建标准对收集的数据进行实体标注和关系标注.在标注完成后,通过数据预处理生成铝硅合金实体关系抽取数据集.通过实体关系联合抽取模型进行实验,验证该数据集可以应用于实体关系抽取任务.与公开数据集相比,材料数据集句子的语义和语法更为复杂,长句更多,导致实体关系联合抽取模型在材料数据集上的表现略差.针对上述问题,在实体关系联合抽取模型上加入自注意力机制,使该模型整体的F1值提高了约5.8%.该数据集的构建方法具有普适性,可以通过该构建方法构建材料数据集. 展开更多
关键词 数据集 构建标准 数据标注 实体关系联合抽取模型 自注意力机制
在线阅读 下载PDF
兼类说反思 被引量:12
5
作者 周韧 《语言科学》 CSSCI 北大核心 2015年第5期504-516,共13页
朱德熙先生的词类观和他确立的汉语词类体系在汉语语法学界影响深远。本文认为,如果深入贯彻朱先生最主要的词类观,那么在汉语的词类划分体系当中,便不宜有兼类的概念。文章首先说明设立兼类词所依据的"数量原则"其实难以把握... 朱德熙先生的词类观和他确立的汉语词类体系在汉语语法学界影响深远。本文认为,如果深入贯彻朱先生最主要的词类观,那么在汉语的词类划分体系当中,便不宜有兼类的概念。文章首先说明设立兼类词所依据的"数量原则"其实难以把握,进而从概括词和个体词关系、词类划分标准的确定和词性标注三个方面说明兼类概念带来的理论困境。我们认为,一旦确立"汉语词类和句法成分不是一一对应关系"这一重要原则,那么设置兼类便会多多少少和这一原则产生矛盾。 展开更多
关键词 兼类 概括词和个体词 词类划分标准 词性标注
在线阅读 下载PDF
学术期刊中注释的规范化问题辨析 被引量:2
6
作者 章永林 《编辑之友》 CSSCI 北大核心 2016年第11期78-81,共4页
在我国学术期刊编辑过程中,注释是常规使用的文献著录方式,且有着专业化、行业化的用途。但在具体操作中,存在诸多不规范现象:如注释的定义有待规范,脚注和尾注使用的不统一,脚注的当页单排和通篇统排的不一致,文献引证性注释与参考文... 在我国学术期刊编辑过程中,注释是常规使用的文献著录方式,且有着专业化、行业化的用途。但在具体操作中,存在诸多不规范现象:如注释的定义有待规范,脚注和尾注使用的不统一,脚注的当页单排和通篇统排的不一致,文献引证性注释与参考文献的混淆等。基于此,文章对学术期刊注释的使用从学理、办刊的价值体现方面进行探讨,以期实现注释使用的规范化。 展开更多
关键词 学术期刊 注释 规范化
在线阅读 下载PDF
计算机辅助设计中的国标实用化新软件 被引量:2
7
作者 於时才 《甘肃工业大学学报》 1999年第2期71-75,共5页
介绍了作者继AutoGBBZ后研究开发的新版“国标标注软件”GBBZ的新功能、新特征、新界面,该软件能依照最新的国家标准及CAD通用技术规范,方便迅速高质量地创建初始绘图环境,完成粗糙度、形位公差、基准代号、焊缝符号... 介绍了作者继AutoGBBZ后研究开发的新版“国标标注软件”GBBZ的新功能、新特征、新界面,该软件能依照最新的国家标准及CAD通用技术规范,方便迅速高质量地创建初始绘图环境,完成粗糙度、形位公差、基准代号、焊缝符号、技术要求等文字及符号的标注,绘制并填写标题栏、明细表,为工程CAD提供了极大的方便. 展开更多
关键词 计算机绘图 软件 标准化 标注 CAD AutoGBBZ
在线阅读 下载PDF
高级Petri网:基于ISO/IEC15909的理解
8
作者 黄映辉 李冠宇 《系统仿真学报》 CAS CSCD 北大核心 2007年第A01期49-51,共3页
ISO/IEC15909从构成角度给出了高级Petri网的定义,对其的理解分为结点、扩展、关联矩阵和初始标识四个层次。高级Petri网的本质特征是扩展域D和扩展映射Type,二者的不同取值衍生了着色Petri网、谓词/变迁网和时间Petri网等类型。高级Pe... ISO/IEC15909从构成角度给出了高级Petri网的定义,对其的理解分为结点、扩展、关联矩阵和初始标识四个层次。高级Petri网的本质特征是扩展域D和扩展映射Type,二者的不同取值衍生了着色Petri网、谓词/变迁网和时间Petri网等类型。高级Petri网实际上是"高层Petri网"。高级Petri网图形是对库所/变迁网图形的折叠,具体方法是减少图元数量而增加图元信息。高级Petri网图形的结构可概括为"三类图元及其注释"。 展开更多
关键词 高级PETRI网 高级Petri网图形 ISO标准 图元 注释
在线阅读 下载PDF
颜师古注释用语“今”所言唐代通语研究
9
作者 胡继明 《西南大学学报(社会科学版)》 CSSCI 北大核心 2010年第6期141-145,共5页
颜师古在训诂著作中,常用注释用语"今"来指称唐代通语,说明从东汉到唐代汉语词语的演变发展轨迹。这些唐代通语与被释词相比较,在形态上,主要有一成不变、貌合神离、改头换面、面目全非等四种变化,而以后两种为主。在构词法上... 颜师古在训诂著作中,常用注释用语"今"来指称唐代通语,说明从东汉到唐代汉语词语的演变发展轨迹。这些唐代通语与被释词相比较,在形态上,主要有一成不变、貌合神离、改头换面、面目全非等四种变化,而以后两种为主。在构词法上,单音词演变为复音词,以合成词为主且偏正式最多。今天仍有一部分唐代通语作为现代汉语基本词汇、一般词汇或方言词汇在沿用。 展开更多
关键词 颜师古 注释用语 “今” 唐代通语 形态 构词方式 存留
在线阅读 下载PDF
糖尿病视网膜病变眼底彩照人工智能研究标准数据库的建立规范 被引量:7
10
作者 于伟泓 张潇 +25 位作者 吴婵 陈欢 杨治坤 贺峰 张枝桥 张碧磊 巩迪 王月麟 杨景元 李冰 孙燕媛 马亚静 陆慧琴 夏蔚 周伟 张东磊 潘庆敏 杨宁 王淑娜 孙晓蕾 遇颖 苏畅 万博 汪明启 王敏 陈有信 《协和医学杂志》 CSCD 2021年第5期684-688,共5页
近年来,随着人工智能技术的兴起,世界范围内对于眼底病尤其是糖尿病视网膜病变的人工智能识别研究越来越多,但不同人工智能识别软件准确度的验证与比较问题尚未解决。本文对北京协和医院眼科在建立1.5万张糖尿病视网膜病变眼底彩照人工... 近年来,随着人工智能技术的兴起,世界范围内对于眼底病尤其是糖尿病视网膜病变的人工智能识别研究越来越多,但不同人工智能识别软件准确度的验证与比较问题尚未解决。本文对北京协和医院眼科在建立1.5万张糖尿病视网膜病变眼底彩照人工智能研究标准数据库的过程中所遵循的规范进行阐述,以期为后续眼科以及其他相关学科建立更多的相关数据库提供参考。 展开更多
关键词 糖尿病视网膜病变 人工智能 标注 数据库 标准流程
在线阅读 下载PDF
基于层叠CRF模型的词结构分析 被引量:7
11
作者 方艳 周国栋 《中文信息学报》 CSCD 北大核心 2015年第4期1-7,24,共8页
传统的中文分词就是识别出每个词的边界,它忽略了汉语中词与短语分界不清这一特点。在理论上,语言学家对词边界的确定往往各持己见,各语料库的分词标准不能统一,在实践中也不能完全满足具体应用的需求。该文给出了基于层叠CRF模型的词... 传统的中文分词就是识别出每个词的边界,它忽略了汉语中词与短语分界不清这一特点。在理论上,语言学家对词边界的确定往往各持己见,各语料库的分词标准不能统一,在实践中也不能完全满足具体应用的需求。该文给出了基于层叠CRF模型的词结构自动分析方法,能够以较高的精确度获得词的边界信息和内部结构信息。相比于传统的分词,词的结构分析更加符合汉语词法与句法边界模糊的事实,解决了语料库标准的不一致性以及应用的不同需求。 展开更多
关键词 中文分词 内部结构 分词标准 层叠CRF
在线阅读 下载PDF
基于IFC标准的施工图注释自动生成方法研究 被引量:6
12
作者 黄静菲 赖华辉 邓雪原 《图学学报》 CSCD 北大核心 2017年第5期760-766,共7页
BIM作为一种新的理念和技术,正逐步改变工程设计行业的工作习惯。目前BIM应用中普遍采用"先出图,后建模"的工作模式,模型制作过程是脱离和滞后的,并未真正优化设计质量和提升工作效率。引入IFC标准对施工图自动生成方法进行研... BIM作为一种新的理念和技术,正逐步改变工程设计行业的工作习惯。目前BIM应用中普遍采用"先出图,后建模"的工作模式,模型制作过程是脱离和滞后的,并未真正优化设计质量和提升工作效率。引入IFC标准对施工图自动生成方法进行研究,通过分析施工图的技术特点,总结基于IFC标准的三维对象和二维注释的表达方法,结合实际制图需求,提出基于IFC标准的施工图注释自动生成方法,为本地化协同设计平台的开发提供参考。 展开更多
关键词 建筑信息模型 IFC标准 施工图 注释自动生成
在线阅读 下载PDF
融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别 被引量:17
13
作者 程名 于红 +4 位作者 冯艳红 任媛 付博 刘巨升 杨鹤 《大连海洋大学学报》 CAS CSCD 北大核心 2020年第2期296-301,共6页
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF(BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模... 为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF(BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。 展开更多
关键词 渔业标准命名实体识别 标注方法 双向长短时记忆网络(BiLSTM) 注意力机制 条件随机场
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部