期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
词语感情色彩极性判断与强度测量方法研究
1
作者
李淑云
王世昌
杨振兰
《现代语文》
2022年第6期70-77,共8页
感情色彩是词义的重要组成部分,目前对感情色彩极性的判断和强度的测量多采用内省法,尚未形成客观有效的标准。从语境、语义韵、构形、计算等四个角度,对感情色彩极性与强度的判断、测量方法进行研究,并以典型的感情色彩种子词来验证方...
感情色彩是词义的重要组成部分,目前对感情色彩极性的判断和强度的测量多采用内省法,尚未形成客观有效的标准。从语境、语义韵、构形、计算等四个角度,对感情色彩极性与强度的判断、测量方法进行研究,并以典型的感情色彩种子词来验证方法的可行性。希望能够探索出较为科学客观的方法,以规避内省法所产生的主观性偏误。
展开更多
关键词
感情色彩极性
感情色彩强度
种子词
语义韵
在线阅读
下载PDF
职称材料
基于Boot Strapping的中文实体关系自动生成
被引量:
3
2
作者
张素香
李蕾
+1 位作者
秦颖
钟义信
《微电子学与计算机》
CSCD
北大核心
2006年第12期15-18,共4页
针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关...
针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关系的特征词。在此基础上,利用最近邻居的原则,进而生成更多的抽取模板。丰富了知识库,为分析二元实体关系奠定基础,使得生成复杂的消息模板成为可能,同时极大地减轻手工建立模板的复杂度,有利于系统进行移植。
展开更多
关键词
BOOT
Strapping
种子词
种子
模板
标量聚类
在线阅读
下载PDF
职称材料
基于LOTClass模型的弱监督中文短文本分类算法
3
作者
刘硕
王庚润
任玉媛
《信息工程大学学报》
2021年第5期613-620,共8页
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别...
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别种子词表指导训练中文伪标签生成模型,并使用该模型生成大量伪标签数据;最后,利用优质伪标签数据训练一个中文短文本分类模型。在THUCNews新闻标题数据集和论文标题数据集上进行实验,结果表明,该算法在仅使用少量标签数据的情况下,其性能优于主流的半监督分类算法,同时不逊于一般的全监督分类算法,为无标签数据分类任务提供了一种较好的解决方案。
展开更多
关键词
弱监督学习
中文文本
短文本分类
预训练模型
种子词
在线阅读
下载PDF
职称材料
题名
词语感情色彩极性判断与强度测量方法研究
1
作者
李淑云
王世昌
杨振兰
机构
山东大学文学院
出处
《现代语文》
2022年第6期70-77,共8页
基金
山东大学文学院研究项目“情感语义的理论研究与情感词库的资源构建”。
文摘
感情色彩是词义的重要组成部分,目前对感情色彩极性的判断和强度的测量多采用内省法,尚未形成客观有效的标准。从语境、语义韵、构形、计算等四个角度,对感情色彩极性与强度的判断、测量方法进行研究,并以典型的感情色彩种子词来验证方法的可行性。希望能够探索出较为科学客观的方法,以规避内省法所产生的主观性偏误。
关键词
感情色彩极性
感情色彩强度
种子词
语义韵
Keywords
polarity of emotional coloring
intensity of emotional coloring
seed words
semantic prosody
分类号
H136 [语言文字—汉语]
在线阅读
下载PDF
职称材料
题名
基于Boot Strapping的中文实体关系自动生成
被引量:
3
2
作者
张素香
李蕾
秦颖
钟义信
机构
北京邮电大学信息工程学院智能科学技术研究中心
出处
《微电子学与计算机》
CSCD
北大核心
2006年第12期15-18,共4页
基金
国家863计划重大项目(2001AA114210)
文摘
针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关系的特征词。在此基础上,利用最近邻居的原则,进而生成更多的抽取模板。丰富了知识库,为分析二元实体关系奠定基础,使得生成复杂的消息模板成为可能,同时极大地减轻手工建立模板的复杂度,有利于系统进行移植。
关键词
BOOT
Strapping
种子词
种子
模板
标量聚类
Keywords
Boot strapping, Seed word, Seed pattern, Scalar cluster
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于LOTClass模型的弱监督中文短文本分类算法
3
作者
刘硕
王庚润
任玉媛
机构
信息工程大学
出处
《信息工程大学学报》
2021年第5期613-620,共8页
文摘
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别种子词表指导训练中文伪标签生成模型,并使用该模型生成大量伪标签数据;最后,利用优质伪标签数据训练一个中文短文本分类模型。在THUCNews新闻标题数据集和论文标题数据集上进行实验,结果表明,该算法在仅使用少量标签数据的情况下,其性能优于主流的半监督分类算法,同时不逊于一般的全监督分类算法,为无标签数据分类任务提供了一种较好的解决方案。
关键词
弱监督学习
中文文本
短文本分类
预训练模型
种子词
Keywords
weakly-supervised learning
Chinese text
short text classification
pre-training model
seed words
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
词语感情色彩极性判断与强度测量方法研究
李淑云
王世昌
杨振兰
《现代语文》
2022
0
在线阅读
下载PDF
职称材料
2
基于Boot Strapping的中文实体关系自动生成
张素香
李蕾
秦颖
钟义信
《微电子学与计算机》
CSCD
北大核心
2006
3
在线阅读
下载PDF
职称材料
3
基于LOTClass模型的弱监督中文短文本分类算法
刘硕
王庚润
任玉媛
《信息工程大学学报》
2021
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部