期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
面向小样本抽取式问答的多标签语义校准方法
1
作者 刘青 陈艳平 +2 位作者 邹安琪 秦永彬 黄瑞章 《应用科学学报》 CAS CSCD 北大核心 2024年第1期161-173,共13页
小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同... 小样本抽取式问答任务旨在利用文章给定的上下文片段,抽取出真实的答案片段。其基线模型采用的方法只针对跨度进行学习,缺乏对全局语义信息的利用,在含有多组不同重复跨度的实例中存在着理解偏差等问题。为了解决上述问题,该文利用不同层级的语义提出了一种面向小样本抽取式问答任务的多标签语义校准方法。采用包含全局语义信息的头标签和基线模型中的特殊字符构成多标签进行语义融合,并利用语义融合门来控制全局信息流的引入,将全局语义信息融合到特殊字符的语义信息中。然后,利用语义筛选门对新融入的全局语义信息和该特殊字符的原有语义信息进行保留与更替,实现对标签偏差语义的校准。在8个小样本抽取式问答数据集中的56组实验结果表明:该方法在评价指标F1值上均明显优于基线模型,证明了所提方法的有效性和先进性。 展开更多
关键词 小样本抽取式问答 跨度抽取式问答 多标签语义融合 双门控机制 机器阅读理解
在线阅读 下载PDF
CMDC:一种差异互补的迭代式多维度文本聚类算法 被引量:4
2
作者 黄瑞章 白瑞娜 +3 位作者 陈艳平 秦永彬 程欣宇 田有亮 《通信学报》 EI CSCD 北大核心 2020年第8期155-164,共10页
针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化。CMDC算法挑选维度聚类间结果的互补文本,基于局部... 针对传统多维度文本聚类算法把文本表示与聚类过程分离,忽略了维度间的互补特性的问题,提出了一种差异互补的迭代式多维度文本聚类算法——CMDC,实现文本聚类与特征调整过程的统一优化。CMDC算法挑选维度聚类间结果的互补文本,基于局部度量学习算法利用互补文本促进聚类的特征调优,以维度的度量一致性来解决多维度文本聚类的划分一致性。实验结果表明,CMDC算法有效地提升了多维度聚类性能。 展开更多
关键词 多维度文本聚类 互补文本 约束文本聚类 度量计算
在线阅读 下载PDF
基于Highway-BiLSTM网络的汉语谓语中心词识别研究 被引量:4
3
作者 黄瑞章 靳文繁 +2 位作者 陈艳平 秦永彬 郑庆华 《通信学报》 EI CSCD 北大核心 2021年第1期100-107,共8页
针对汉语谓语中心词识别困难及唯一性的问题,提出了一种基于Highway-BiLSTM网络的深度学习模型。首先,通过多层BiLSTM网络叠加获取句子内部不同粒度抽象语义信息的直接依赖关系;然后,利用Highway网络缓解深层模型出现的梯度消失问题;最... 针对汉语谓语中心词识别困难及唯一性的问题,提出了一种基于Highway-BiLSTM网络的深度学习模型。首先,通过多层BiLSTM网络叠加获取句子内部不同粒度抽象语义信息的直接依赖关系;然后,利用Highway网络缓解深层模型出现的梯度消失问题;最后,通过约束层对输出路径进行规划,解决谓语中心词的唯一性问题。实验结果表明,该方法有效提升了谓语中心词识别的性能。 展开更多
关键词 谓语中心词 高速公路连接 双向长短期记忆网络 唯一性
在线阅读 下载PDF
抛石挤淤结合强夯置换法在道路软基处理中的应用 被引量:19
4
作者 黄瑞章 潘瑞春 周新年 《路基工程》 2013年第2期73-77,82,共6页
以泉州市泉港区某道路采用抛石挤淤结合强夯法置换处理软基为例,阐述了软基处理方案的选择、设计与施工。采用钻孔揭露结合瑞雷波法对软基处理效果进行检测,通过计算校核检测结果,表明采用该方法处理软基科学合理,能满足工程要求。
关键词 软基处理 抛石挤淤 强夯置换法 钻孔揭露 瑞雷波法 检测
在线阅读 下载PDF
基于VB 6.0的抛物线理论多跨索道侧型图设计
5
作者 周新年 巫志龙 +3 位作者 周成军 王小桃 黄瑞章 郑端生 《福建林学院学报》 CSCD 北大核心 2012年第3期208-212,共5页
多跨索道侧型图对架空索道设计有着重要意义,通过索道侧型图可以判断索道运输对地面变坡是否安全,确定索道集材方式方法。在多跨抛物线理论的基础上,通过建立绘制索道侧型图的数学模型,利用VB 6.0研发的索道侧型图设计系统,实现设计计... 多跨索道侧型图对架空索道设计有着重要意义,通过索道侧型图可以判断索道运输对地面变坡是否安全,确定索道集材方式方法。在多跨抛物线理论的基础上,通过建立绘制索道侧型图的数学模型,利用VB 6.0研发的索道侧型图设计系统,实现设计计算与侧型图绘制一体化。以福建省建宁金铙山货运索道工程为例,验证多跨索道侧型图设计系统的可行性。 展开更多
关键词 抛物线理论 多跨索道 侧型图 VB 6.0 程序设计
在线阅读 下载PDF
跨度语义增强的命名实体识别方法 被引量:3
6
作者 耿汝山 陈艳平 +3 位作者 唐瑞雪 黄瑞章 秦永彬 董博 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第7期118-126,共9页
针对命名实体识别方法存在字与字之间语义信息丢失、模型召回率不佳等问题,提出了一种跨度语义信息增强的命名实体识别方法。首先,使用ALBERT预训练语言模型提取文本中包含上下文信息的字符向量,并使用GloVe模型生成字符向量;其次,将两... 针对命名实体识别方法存在字与字之间语义信息丢失、模型召回率不佳等问题,提出了一种跨度语义信息增强的命名实体识别方法。首先,使用ALBERT预训练语言模型提取文本中包含上下文信息的字符向量,并使用GloVe模型生成字符向量;其次,将两种向量进行拼接作为模型输入向量,对输入向量进行枚举拼接形成跨度信息矩阵;然后,使用多维循环神经网络和注意力网络对跨度信息矩阵进行运算,增强跨度之间的语义联系;最后,将跨度信息增强后的矩阵进行跨度分类以识别命名实体。实验表明:与传统的跨度方法相比该方法能够有效增强跨度之间的语义依赖特征,从而提升命名实体识别的召回率;该方法在ACE2005英文数据集上比传统的方法召回率提高了0.42%,并且取得了最高的F1值。 展开更多
关键词 命名实体识别 跨度语义增强 多维循环神经网络 ALBERT预训练语言模型
在线阅读 下载PDF
一种采用机器阅读理解模型的中文分词方法 被引量:2
7
作者 周裕林 陈艳平 +2 位作者 黄瑞章 秦永彬 林川 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第8期95-103,共9页
针对中文分词序列标注模型很难获取句子的长距离语义依赖,导致输入特征使用不充分、边界样本少导致数据不平衡的问题,提出了一种基于机器阅读理解模型的中文分词方法。将序列标注任务转换成机器阅读理解任务,通过构建问题信息、文本内... 针对中文分词序列标注模型很难获取句子的长距离语义依赖,导致输入特征使用不充分、边界样本少导致数据不平衡的问题,提出了一种基于机器阅读理解模型的中文分词方法。将序列标注任务转换成机器阅读理解任务,通过构建问题信息、文本内容和词组答案的三元组,以有效利用句子中的输入特征;将三元组信息通过Transformer的双向编码器(BERT)进行预训练捕获上下文信息,结合二进制分类器预测词组答案;通过改进原有的交叉熵损失函数缓解数据不平衡问题。在Bakeoff2005语料库的4个公共数据集PKU、MSRA、CITYU和AS上的实验结果表明:所提方法的F_(1)分别为96.64%、97.8%、97.02%和96.02%,与其他主流的神经网络序列标注模型进行对比,分别提高了0.13%、0.37%、0.4%和0.08%。 展开更多
关键词 中文分词 序列标注 歧义词 机器阅读理解
在线阅读 下载PDF
基于跨度回归的中文事件触发词抽取 被引量:3
8
作者 赵宇豪 陈艳平 +1 位作者 黄瑞章 秦永彬 《应用科学学报》 CAS CSCD 北大核心 2023年第1期95-106,共12页
在中文事件触发词抽取任务中,基于词的模型会受到分词带来的错误,而基于字符的模型则难以捕获触发词的结构信息和上下文语义信息,为此提出了一种基于跨度回归的触发词抽取方法。该方法考虑到句子中特定长度的字符子序列(跨度)可能构成... 在中文事件触发词抽取任务中,基于词的模型会受到分词带来的错误,而基于字符的模型则难以捕获触发词的结构信息和上下文语义信息,为此提出了一种基于跨度回归的触发词抽取方法。该方法考虑到句子中特定长度的字符子序列(跨度)可能构成一个事件触发词,用基于Transformer的双向编码器的预训练语言模型获取句子的特征表示,进而生成触发词候选跨度;然后用一个分类器过滤低置信度的候选跨度,通过回归调整候选跨度的边界来准确定位触发词;最后对调整后的候选跨度进行分类得到抽取结果。在ACE2005中文数据集上的实验结果表明:基于跨度回归的方法对触发词识别任务的F1值为73.20%,对触发词分类任务的F1值为71.60%,优于现有模型;并与仅基于跨度的方法进行对比,验证了对跨度边界进行回归调整可以提高事件触发词检测的准确性。 展开更多
关键词 事件抽取 事件触发词 基于Transformer的双向编码器 特征表示 跨度表示 回归调整
在线阅读 下载PDF
半监督语义动态文本聚类算法 被引量:1
9
作者 钱志森 黄瑞章 +2 位作者 魏琴 秦永彬 陈艳平 《电子科技大学学报》 EI CAS CSCD 北大核心 2019年第6期803-808,共6页
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中... 针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类.同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果.实验结果表明该文提出的算法是有效可行的. 展开更多
关键词 动态文本聚类 语义学习 半监督文本聚类 文本聚类
在线阅读 下载PDF
基于上下文语义的新闻人名纠错方法 被引量:1
10
作者 杨越 黄瑞章 +2 位作者 魏琴 陈艳平 秦永彬 《电子科技大学学报》 EI CAS CSCD 北大核心 2019年第6期809-814,共6页
新闻文本中的人名纠错存在以下难点:1)人名中含有错误字段会影响甚至改变文本语义表达,故无法用传统命名实体识别方法识别句中人名;2)人名字段的特殊性极易产生重名或者歧义,使得误报率增加,并提升了人名纠错的难度.为此,本文提出了一... 新闻文本中的人名纠错存在以下难点:1)人名中含有错误字段会影响甚至改变文本语义表达,故无法用传统命名实体识别方法识别句中人名;2)人名字段的特殊性极易产生重名或者歧义,使得误报率增加,并提升了人名纠错的难度.为此,本文提出了一种基于上下文语义的新闻人名纠错方法.该方法使用卷积神经网络提取文本语义信息,并使用词激活力模型计算文本中其他词语与人名字段的关联程度来捕捉并使用文本上下文语义信息.同时,针对文本中人名字段中含有错误而导致的识别效果低下的问题,使用人名实体边界识别算法提高对文本中疑似含有错误人名的识别提取效果.实验结果表明,该方法能够有效地识别文本中的人名并对其中的错误内容进行纠正. 展开更多
关键词 边界识别 上下语义 命名实体识别 人名纠错
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部