期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于词模式规则的轻量级日志模板提取方法
1
作者
顾兆军
张智凯
+1 位作者
刘春波
叶经纬
《现代电子技术》
北大核心
2024年第21期156-164,共9页
传统基于规则的日志解析方法针对每类日志需单独编写规则,且随着系统更新,出现新的日志模式时,需人工再次干预;基于深度学习的日志解析方法虽准确率高,但计算复杂度高。为解决日志解析方法人力成本和计算复杂度高的问题,文中提出一种基...
传统基于规则的日志解析方法针对每类日志需单独编写规则,且随着系统更新,出现新的日志模式时,需人工再次干预;基于深度学习的日志解析方法虽准确率高,但计算复杂度高。为解决日志解析方法人力成本和计算复杂度高的问题,文中提出一种基于词模式规则的轻量级日志模板提取方法,该方法由初始规则集生成、词模式规则应用、潜在错误样本发掘三个部分构成。首先,原始日志基于自适应随机抽样获取彼此间相似度较低的代表性日志;然后,基于专家反馈提取初始词模式规则集,在词模式规则应用模块对原始日志进行处理并提取日志模板;最后,在潜在错误样本发掘模块检查生成的日志模板聚类,发现潜在的错误分类样本并对其进行规则集更新。经过实验验证,在16个公开日志数据集上,文中方法的平均准确度达到97.8%,与基于深度学习的日志解析算法准确度基本持平;在计算效率方面,文中方法的单线程解析速度达到每秒20000条,且随着可用内核数量的增加,性能持续提升,满足系统日志的故障诊断和安全分析需求。
展开更多
关键词
日志解析
模板提取
词模式
规则
正则匹配
启发式策略
规则集
在线阅读
下载PDF
职称材料
基于词模式嵌入的词语上下位关系分类
被引量:
12
2
作者
孙佳伟
李正华
+1 位作者
陈文亮
张民
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2019年第1期1-7,共7页
提出一种基于词模式的上下位关系分类方法,可以有效地缓解传统的基于模式的分类方法存在的稀疏问题,提高了关系分类的召回率。进一步地,通过词模式嵌入,将基于模式的方法与基于词嵌入的方法进行有效的融合。为了验证方法的有效性,标注...
提出一种基于词模式的上下位关系分类方法,可以有效地缓解传统的基于模式的分类方法存在的稀疏问题,提高了关系分类的召回率。进一步地,通过词模式嵌入,将基于模式的方法与基于词嵌入的方法进行有效的融合。为了验证方法的有效性,标注一个包含12000个汉语词语对的数据集。实验结果表明,该词模式嵌入方法是有效的, F1值可以达到95.36%。
展开更多
关键词
上下位关系分类
词模式
词嵌入
词模式
嵌入
在线阅读
下载PDF
职称材料
母语认知模式对外语学习中词汇网络建构的影响
被引量:
1
3
作者
汤漫江
《山地农业生物学报》
2006年第2期185-188,共4页
词汇学习和记忆是英语教学中的基础。大学阶段的英语学习者由于有高中阶段的基础和认知能力的优势可以在相对较短的时间内扩充词汇量。而在写作和汉译英等体现语言输出能力的练习中,词汇误用和错用却很普遍,这显然会影响到进一步的词汇...
词汇学习和记忆是英语教学中的基础。大学阶段的英语学习者由于有高中阶段的基础和认知能力的优势可以在相对较短的时间内扩充词汇量。而在写作和汉译英等体现语言输出能力的练习中,词汇误用和错用却很普遍,这显然会影响到进一步的词汇记忆和整体语言学习的效能。对此,通过从系统论的视角解析,发现这些错误源于母语认知模式的影响。着力于通过汉语和英语词汇意义网络的比对和两种语言语义构造(即组词和造句)比对的方式以改善学生对词汇的记忆,提高语言学习效能。
展开更多
关键词
词汇网络
认知
模式
汉语组
词模式
在线阅读
下载PDF
职称材料
面向中文电子病历的属性挖掘
被引量:
1
4
作者
费超群
张书涵
李阳阳
《高技术通讯》
CAS
2022年第6期597-606,共10页
电子病历(EMR)的属性挖掘任务旨在从一组同一科室下的病历文本中抽取该科室医学检查项目。传统的频繁项或序列挖掘技术并不能直接用于该任务。本文提出一种新的不需要人工干预的属性挖掘框架,并借助无标注技术来处理这一难题,即将属性...
电子病历(EMR)的属性挖掘任务旨在从一组同一科室下的病历文本中抽取该科室医学检查项目。传统的频繁项或序列挖掘技术并不能直接用于该任务。本文提出一种新的不需要人工干预的属性挖掘框架,并借助无标注技术来处理这一难题,即将属性挖掘问题形式化为半结构化的频繁子序列挖掘任务,并提出一种有效的算法从电子病历中挖掘候选的词模式。在中文电子病历上进行的各项综合实验,证明了本文提出的方法可以有效处理属性挖掘任务。
展开更多
关键词
属性挖掘
电子病历(EMR)
频繁子序列挖掘
词模式
频繁
词模式
在线阅读
下载PDF
职称材料
王念孙的联绵词“天籁”说证
被引量:
5
5
作者
江荻
《语言科学》
CSSCI
北大核心
2013年第5期469-476,共8页
文章指出在众多的联绵词产生和形成学说中,唯清代大学者王念孙提出的联绵词"天籁"说准确刻画了联绵词的起源性质。具体论证上以扬雄《方言》联绵词为例说明汉语并非自古就是单音节词语言,然后用抑扬格词模式演化定律以及达让...
文章指出在众多的联绵词产生和形成学说中,唯清代大学者王念孙提出的联绵词"天籁"说准确刻画了联绵词的起源性质。具体论证上以扬雄《方言》联绵词为例说明汉语并非自古就是单音节词语言,然后用抑扬格词模式演化定律以及达让语案例阐述了多音节词演化为单音节词的演变机制。文章认为甲金文之前的汉语经历了这样的演化过程,多音节的联绵词就是这个演化过程的遗存。
展开更多
关键词
联绵词
抑扬格
词模式
多音节词
单音节化
在线阅读
下载PDF
职称材料
基于特征Boosting的真核启动子预测方法
6
作者
曾庆尚
武栓虎
《计算机工程与应用》
CSCD
北大核心
2009年第4期180-182,195,共4页
提出了一个新的启动子检测方法,它基于以下假设:启动子是由一些词模式决定的且不同的启动子由不同的词决定。通过计算散度距离选择最可能的特征并用feature-boosting构造一系列的弱分类器。一定数目的弱分类器可构造一强分类器,这样就...
提出了一个新的启动子检测方法,它基于以下假设:启动子是由一些词模式决定的且不同的启动子由不同的词决定。通过计算散度距离选择最可能的特征并用feature-boosting构造一系列的弱分类器。一定数目的弱分类器可构造一强分类器,这样就可以达到一个较好的性能。和其他分类器不同的是,采用了不同的训练和分类策略。对大型基因序列实验结果和一些较好的算法比较显示该方法预测启动子区域是有效的,且具有较好的敏感性和特异性。
展开更多
关键词
DNA序列分析
启动子预测
词模式
特征boosting
在线阅读
下载PDF
职称材料
题名
基于词模式规则的轻量级日志模板提取方法
1
作者
顾兆军
张智凯
刘春波
叶经纬
机构
中国民航大学信息安全测评中心
中国民航大学计算机科学与技术学院
出处
《现代电子技术》
北大核心
2024年第21期156-164,共9页
基金
中国民航大学联合基金项目(U2333201)。
文摘
传统基于规则的日志解析方法针对每类日志需单独编写规则,且随着系统更新,出现新的日志模式时,需人工再次干预;基于深度学习的日志解析方法虽准确率高,但计算复杂度高。为解决日志解析方法人力成本和计算复杂度高的问题,文中提出一种基于词模式规则的轻量级日志模板提取方法,该方法由初始规则集生成、词模式规则应用、潜在错误样本发掘三个部分构成。首先,原始日志基于自适应随机抽样获取彼此间相似度较低的代表性日志;然后,基于专家反馈提取初始词模式规则集,在词模式规则应用模块对原始日志进行处理并提取日志模板;最后,在潜在错误样本发掘模块检查生成的日志模板聚类,发现潜在的错误分类样本并对其进行规则集更新。经过实验验证,在16个公开日志数据集上,文中方法的平均准确度达到97.8%,与基于深度学习的日志解析算法准确度基本持平;在计算效率方面,文中方法的单线程解析速度达到每秒20000条,且随着可用内核数量的增加,性能持续提升,满足系统日志的故障诊断和安全分析需求。
关键词
日志解析
模板提取
词模式
规则
正则匹配
启发式策略
规则集
Keywords
log paring
template extraction
word pattern rule
regex match
heuristic strategy
rule set
分类号
TN911-34 [电子电信—通信与信息系统]
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于词模式嵌入的词语上下位关系分类
被引量:
12
2
作者
孙佳伟
李正华
陈文亮
张民
机构
苏州大学计算机科学与技术学院
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2019年第1期1-7,共7页
基金
国家自然科学基金(61876116
61673289)
江苏省高校自然科学研究重大项目(16KJA520001)资助
文摘
提出一种基于词模式的上下位关系分类方法,可以有效地缓解传统的基于模式的分类方法存在的稀疏问题,提高了关系分类的召回率。进一步地,通过词模式嵌入,将基于模式的方法与基于词嵌入的方法进行有效的融合。为了验证方法的有效性,标注一个包含12000个汉语词语对的数据集。实验结果表明,该词模式嵌入方法是有效的, F1值可以达到95.36%。
关键词
上下位关系分类
词模式
词嵌入
词模式
嵌入
Keywords
hypernym relation classification
word pattern
word embedding
word pattern embedding
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
母语认知模式对外语学习中词汇网络建构的影响
被引量:
1
3
作者
汤漫江
机构
贵州大学外国语学院
出处
《山地农业生物学报》
2006年第2期185-188,共4页
文摘
词汇学习和记忆是英语教学中的基础。大学阶段的英语学习者由于有高中阶段的基础和认知能力的优势可以在相对较短的时间内扩充词汇量。而在写作和汉译英等体现语言输出能力的练习中,词汇误用和错用却很普遍,这显然会影响到进一步的词汇记忆和整体语言学习的效能。对此,通过从系统论的视角解析,发现这些错误源于母语认知模式的影响。着力于通过汉语和英语词汇意义网络的比对和两种语言语义构造(即组词和造句)比对的方式以改善学生对词汇的记忆,提高语言学习效能。
关键词
词汇网络
认知
模式
汉语组
词模式
分类号
H319 [语言文字—英语]
H313 [语言文字—英语]
在线阅读
下载PDF
职称材料
题名
面向中文电子病历的属性挖掘
被引量:
1
4
作者
费超群
张书涵
李阳阳
机构
智能信息处理重点实验室
中国科学院计算技术研究所
中国科学院大学
管理、决策与信息系统重点实验室
中国科学院数学与系统科学研究院
出处
《高技术通讯》
CAS
2022年第6期597-606,共10页
基金
国家自然科学基金(61232015,61472412,61621003)
国家重点研发计划(2016YFB1000902)
+1 种基金
中国博士后科学基金(2020TQ0341)
北京科技项目和清华-腾讯-AMSS联合项目资助。
文摘
电子病历(EMR)的属性挖掘任务旨在从一组同一科室下的病历文本中抽取该科室医学检查项目。传统的频繁项或序列挖掘技术并不能直接用于该任务。本文提出一种新的不需要人工干预的属性挖掘框架,并借助无标注技术来处理这一难题,即将属性挖掘问题形式化为半结构化的频繁子序列挖掘任务,并提出一种有效的算法从电子病历中挖掘候选的词模式。在中文电子病历上进行的各项综合实验,证明了本文提出的方法可以有效处理属性挖掘任务。
关键词
属性挖掘
电子病历(EMR)
频繁子序列挖掘
词模式
频繁
词模式
Keywords
attribute mining
electronic medical record(EMR)
frequent subsequence mining
word pattern
frequent word pattern
分类号
R197.323 [医药卫生—卫生事业管理]
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
王念孙的联绵词“天籁”说证
被引量:
5
5
作者
江荻
机构
中国社会科学院民族学与人类学研究所
出处
《语言科学》
CSSCI
北大核心
2013年第5期469-476,共8页
基金
国家自然科学基金(31271337)
国家社科基金重大项目(12&ZD174)的资助
文摘
文章指出在众多的联绵词产生和形成学说中,唯清代大学者王念孙提出的联绵词"天籁"说准确刻画了联绵词的起源性质。具体论证上以扬雄《方言》联绵词为例说明汉语并非自古就是单音节词语言,然后用抑扬格词模式演化定律以及达让语案例阐述了多音节词演化为单音节词的演变机制。文章认为甲金文之前的汉语经历了这样的演化过程,多音节的联绵词就是这个演化过程的遗存。
关键词
联绵词
抑扬格
词模式
多音节词
单音节化
Keywords
disyllabic roots
iambic pattern
polysyllabic words
monosyllabization
分类号
H13 [语言文字—汉语]
在线阅读
下载PDF
职称材料
题名
基于特征Boosting的真核启动子预测方法
6
作者
曾庆尚
武栓虎
机构
烟台大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2009年第4期180-182,195,共4页
基金
国家自然科学基金No.60772028~~
文摘
提出了一个新的启动子检测方法,它基于以下假设:启动子是由一些词模式决定的且不同的启动子由不同的词决定。通过计算散度距离选择最可能的特征并用feature-boosting构造一系列的弱分类器。一定数目的弱分类器可构造一强分类器,这样就可以达到一个较好的性能。和其他分类器不同的是,采用了不同的训练和分类策略。对大型基因序列实验结果和一些较好的算法比较显示该方法预测启动子区域是有效的,且具有较好的敏感性和特异性。
关键词
DNA序列分析
启动子预测
词模式
特征boosting
Keywords
DNA sequence analysis
promoter prediction
word patterns
feature-boosting
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于词模式规则的轻量级日志模板提取方法
顾兆军
张智凯
刘春波
叶经纬
《现代电子技术》
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
基于词模式嵌入的词语上下位关系分类
孙佳伟
李正华
陈文亮
张民
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2019
12
在线阅读
下载PDF
职称材料
3
母语认知模式对外语学习中词汇网络建构的影响
汤漫江
《山地农业生物学报》
2006
1
在线阅读
下载PDF
职称材料
4
面向中文电子病历的属性挖掘
费超群
张书涵
李阳阳
《高技术通讯》
CAS
2022
1
在线阅读
下载PDF
职称材料
5
王念孙的联绵词“天籁”说证
江荻
《语言科学》
CSSCI
北大核心
2013
5
在线阅读
下载PDF
职称材料
6
基于特征Boosting的真核启动子预测方法
曾庆尚
武栓虎
《计算机工程与应用》
CSCD
北大核心
2009
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部