期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于词模式规则的轻量级日志模板提取方法
1
作者 顾兆军 张智凯 +1 位作者 刘春波 叶经纬 《现代电子技术》 北大核心 2024年第21期156-164,共9页
传统基于规则的日志解析方法针对每类日志需单独编写规则,且随着系统更新,出现新的日志模式时,需人工再次干预;基于深度学习的日志解析方法虽准确率高,但计算复杂度高。为解决日志解析方法人力成本和计算复杂度高的问题,文中提出一种基... 传统基于规则的日志解析方法针对每类日志需单独编写规则,且随着系统更新,出现新的日志模式时,需人工再次干预;基于深度学习的日志解析方法虽准确率高,但计算复杂度高。为解决日志解析方法人力成本和计算复杂度高的问题,文中提出一种基于词模式规则的轻量级日志模板提取方法,该方法由初始规则集生成、词模式规则应用、潜在错误样本发掘三个部分构成。首先,原始日志基于自适应随机抽样获取彼此间相似度较低的代表性日志;然后,基于专家反馈提取初始词模式规则集,在词模式规则应用模块对原始日志进行处理并提取日志模板;最后,在潜在错误样本发掘模块检查生成的日志模板聚类,发现潜在的错误分类样本并对其进行规则集更新。经过实验验证,在16个公开日志数据集上,文中方法的平均准确度达到97.8%,与基于深度学习的日志解析算法准确度基本持平;在计算效率方面,文中方法的单线程解析速度达到每秒20000条,且随着可用内核数量的增加,性能持续提升,满足系统日志的故障诊断和安全分析需求。 展开更多
关键词 日志解析 模板提取 词模式规则 正则匹配 启发式策略 规则集
在线阅读 下载PDF
基于词模式嵌入的词语上下位关系分类 被引量:12
2
作者 孙佳伟 李正华 +1 位作者 陈文亮 张民 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第1期1-7,共7页
提出一种基于词模式的上下位关系分类方法,可以有效地缓解传统的基于模式的分类方法存在的稀疏问题,提高了关系分类的召回率。进一步地,通过词模式嵌入,将基于模式的方法与基于词嵌入的方法进行有效的融合。为了验证方法的有效性,标注... 提出一种基于词模式的上下位关系分类方法,可以有效地缓解传统的基于模式的分类方法存在的稀疏问题,提高了关系分类的召回率。进一步地,通过词模式嵌入,将基于模式的方法与基于词嵌入的方法进行有效的融合。为了验证方法的有效性,标注一个包含12000个汉语词语对的数据集。实验结果表明,该词模式嵌入方法是有效的, F1值可以达到95.36%。 展开更多
关键词 上下位关系分类 词模式 词嵌入 词模式嵌入
在线阅读 下载PDF
母语认知模式对外语学习中词汇网络建构的影响 被引量:1
3
作者 汤漫江 《山地农业生物学报》 2006年第2期185-188,共4页
词汇学习和记忆是英语教学中的基础。大学阶段的英语学习者由于有高中阶段的基础和认知能力的优势可以在相对较短的时间内扩充词汇量。而在写作和汉译英等体现语言输出能力的练习中,词汇误用和错用却很普遍,这显然会影响到进一步的词汇... 词汇学习和记忆是英语教学中的基础。大学阶段的英语学习者由于有高中阶段的基础和认知能力的优势可以在相对较短的时间内扩充词汇量。而在写作和汉译英等体现语言输出能力的练习中,词汇误用和错用却很普遍,这显然会影响到进一步的词汇记忆和整体语言学习的效能。对此,通过从系统论的视角解析,发现这些错误源于母语认知模式的影响。着力于通过汉语和英语词汇意义网络的比对和两种语言语义构造(即组词和造句)比对的方式以改善学生对词汇的记忆,提高语言学习效能。 展开更多
关键词 词汇网络 认知模式 汉语组词模式
在线阅读 下载PDF
面向中文电子病历的属性挖掘 被引量:1
4
作者 费超群 张书涵 李阳阳 《高技术通讯》 CAS 2022年第6期597-606,共10页
电子病历(EMR)的属性挖掘任务旨在从一组同一科室下的病历文本中抽取该科室医学检查项目。传统的频繁项或序列挖掘技术并不能直接用于该任务。本文提出一种新的不需要人工干预的属性挖掘框架,并借助无标注技术来处理这一难题,即将属性... 电子病历(EMR)的属性挖掘任务旨在从一组同一科室下的病历文本中抽取该科室医学检查项目。传统的频繁项或序列挖掘技术并不能直接用于该任务。本文提出一种新的不需要人工干预的属性挖掘框架,并借助无标注技术来处理这一难题,即将属性挖掘问题形式化为半结构化的频繁子序列挖掘任务,并提出一种有效的算法从电子病历中挖掘候选的词模式。在中文电子病历上进行的各项综合实验,证明了本文提出的方法可以有效处理属性挖掘任务。 展开更多
关键词 属性挖掘 电子病历(EMR) 频繁子序列挖掘 词模式 频繁词模式
在线阅读 下载PDF
王念孙的联绵词“天籁”说证 被引量:5
5
作者 江荻 《语言科学》 CSSCI 北大核心 2013年第5期469-476,共8页
文章指出在众多的联绵词产生和形成学说中,唯清代大学者王念孙提出的联绵词"天籁"说准确刻画了联绵词的起源性质。具体论证上以扬雄《方言》联绵词为例说明汉语并非自古就是单音节词语言,然后用抑扬格词模式演化定律以及达让... 文章指出在众多的联绵词产生和形成学说中,唯清代大学者王念孙提出的联绵词"天籁"说准确刻画了联绵词的起源性质。具体论证上以扬雄《方言》联绵词为例说明汉语并非自古就是单音节词语言,然后用抑扬格词模式演化定律以及达让语案例阐述了多音节词演化为单音节词的演变机制。文章认为甲金文之前的汉语经历了这样的演化过程,多音节的联绵词就是这个演化过程的遗存。 展开更多
关键词 联绵词 抑扬格词模式 多音节词 单音节化
在线阅读 下载PDF
基于特征Boosting的真核启动子预测方法
6
作者 曾庆尚 武栓虎 《计算机工程与应用》 CSCD 北大核心 2009年第4期180-182,195,共4页
提出了一个新的启动子检测方法,它基于以下假设:启动子是由一些词模式决定的且不同的启动子由不同的词决定。通过计算散度距离选择最可能的特征并用feature-boosting构造一系列的弱分类器。一定数目的弱分类器可构造一强分类器,这样就... 提出了一个新的启动子检测方法,它基于以下假设:启动子是由一些词模式决定的且不同的启动子由不同的词决定。通过计算散度距离选择最可能的特征并用feature-boosting构造一系列的弱分类器。一定数目的弱分类器可构造一强分类器,这样就可以达到一个较好的性能。和其他分类器不同的是,采用了不同的训练和分类策略。对大型基因序列实验结果和一些较好的算法比较显示该方法预测启动子区域是有效的,且具有较好的敏感性和特异性。 展开更多
关键词 DNA序列分析 启动子预测 词模式 特征boosting
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部