期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
词语感情色彩极性判断与强度测量方法研究
1
作者 李淑云 王世昌 杨振兰 《现代语文》 2022年第6期70-77,共8页
感情色彩是词义的重要组成部分,目前对感情色彩极性的判断和强度的测量多采用内省法,尚未形成客观有效的标准。从语境、语义韵、构形、计算等四个角度,对感情色彩极性与强度的判断、测量方法进行研究,并以典型的感情色彩种子词来验证方... 感情色彩是词义的重要组成部分,目前对感情色彩极性的判断和强度的测量多采用内省法,尚未形成客观有效的标准。从语境、语义韵、构形、计算等四个角度,对感情色彩极性与强度的判断、测量方法进行研究,并以典型的感情色彩种子词来验证方法的可行性。希望能够探索出较为科学客观的方法,以规避内省法所产生的主观性偏误。 展开更多
关键词 感情色彩极性 感情色彩强度 种子词 语义韵
在线阅读 下载PDF
基于Boot Strapping的中文实体关系自动生成 被引量:3
2
作者 张素香 李蕾 +1 位作者 秦颖 钟义信 《微电子学与计算机》 CSCD 北大核心 2006年第12期15-18,共4页
针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关... 针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关系的特征词。在此基础上,利用最近邻居的原则,进而生成更多的抽取模板。丰富了知识库,为分析二元实体关系奠定基础,使得生成复杂的消息模板成为可能,同时极大地减轻手工建立模板的复杂度,有利于系统进行移植。 展开更多
关键词 BOOT Strapping 种子词 种子模板 标量聚类
在线阅读 下载PDF
基于LOTClass模型的弱监督中文短文本分类算法
3
作者 刘硕 王庚润 任玉媛 《信息工程大学学报》 2021年第5期613-620,共8页
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别... 基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别种子词表指导训练中文伪标签生成模型,并使用该模型生成大量伪标签数据;最后,利用优质伪标签数据训练一个中文短文本分类模型。在THUCNews新闻标题数据集和论文标题数据集上进行实验,结果表明,该算法在仅使用少量标签数据的情况下,其性能优于主流的半监督分类算法,同时不逊于一般的全监督分类算法,为无标签数据分类任务提供了一种较好的解决方案。 展开更多
关键词 弱监督学习 中文文本 短文本分类 预训练模型 种子词
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部