期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
结合表示学习和迁移学习的跨领域情感分类 被引量:9
1
作者 廖祥文 吴晓静 +2 位作者 桂林 黄锦辉 陈国龙 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第1期37-46,共10页
针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先,利用低维稠密的词向量对文本进行初始化,通过分... 针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先,利用低维稠密的词向量对文本进行初始化,通过分层注意力网络,对文本中重要单词与句子的情感信息进行建模,从而学习源领域与目标领域的文档级分布式表示。随后,采用类噪声估计方法,对源领域中的迁移数据进行检测,剔除负面迁移样例,挑选高质量样例来扩充目标领域的训练集。最后,训练支持向量机对目标领域文本进行情感分类。在大规模公开数据集上进行的两个实验结果表明,与基准方法相比,所提方法的均方根误差分别降低1.5%和1.0%,说明该方法可以有效地提高跨领域情感分类性能。 展开更多
关键词 文本表示学习 迁移学习 类噪声估计 跨领域 情感分类
在线阅读 下载PDF
基于语义知识的汉语句法结构排歧 被引量:12
2
作者 苑春法 黄锦辉 李文捷 《中文信息学报》 CSCD 北大核心 1999年第1期1-8,共8页
汉语在词类这个语言层次上存在着许多歧义结构,这给汉语的自动句法分析带来了难以逾越的障碍。通过寻找汉语语义类之间可能存在的句法关系建立汉语语义关联网,这为用汉语语义知识来解决句法歧义开辟了道路。文章针对具体的汉语歧义结... 汉语在词类这个语言层次上存在着许多歧义结构,这给汉语的自动句法分析带来了难以逾越的障碍。通过寻找汉语语义类之间可能存在的句法关系建立汉语语义关联网,这为用汉语语义知识来解决句法歧义开辟了道路。文章针对具体的汉语歧义结构研究具体的解决办法,从而减少了计算的复杂度。 展开更多
关键词 语义关联网 依存语法 语义知识 汉语句法分析
在线阅读 下载PDF
CHIQL的多语句查询特征及其优化处理 被引量:1
3
作者 孟小峰 王珊 +2 位作者 林耀燊 黄锦辉 刘文琸 《软件学报》 EI CSCD 北大核心 1997年第7期549-554,共6页
CHIQL(Chinesequerylanguage)是一个正在开发中的中文数据库查询语言.为满足各种用户的需要,CHIQL在设计上具有如下的特点:符合中国用户思维方式的较自然的中文表述方式;过程化与非过程化相结合的多语句查询.对CHIQL而言,在实... CHIQL(Chinesequerylanguage)是一个正在开发中的中文数据库查询语言.为满足各种用户的需要,CHIQL在设计上具有如下的特点:符合中国用户思维方式的较自然的中文表述方式;过程化与非过程化相结合的多语句查询.对CHIQL而言,在实现上与传统SQL的最大区别在于它的多语句查询处理技术方面.本文在描述了CHIQL语言特征之后,重点讨论了多语句查询独特的优化问题,提出了基于语句合并的优化方法,并定性地分析了效率改善情况. 展开更多
关键词 中文查询语言 SQL 用户界面 数据库系统
在线阅读 下载PDF
基于小规模标注语料的机器学习方法研究 被引量:7
4
作者 李庆中 苑春法 黄锦辉 《计算机应用》 CSCD 北大核心 2004年第2期56-58,共3页
文中通过讨论机器学习和自然语言处理之间的关系,论述了语料库语言工程中机器学习的困境,概述分析了应用半监督学习的现状,研究有限样本下结合未标注样本的方法和统计学习理论框架的结合前景。
关键词 机器学习 语料库 未标注样本 CO-TRAINING 主动学习 统计学习理论
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部