期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
层次融合多元知识的命名实体识别框架——HTLR
1
作者 吕学强 王涛 +1 位作者 游新冬 徐戈 《计算机应用》 北大核心 2025年第1期40-47,共8页
中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hi... 中文命名实体识别(NER)任务旨在抽取非结构化文本中包含的实体并给它们分配预定义的实体类别。针对大多数中文NER方法在上下文信息缺乏时的语义学习不足问题,提出一种层次融合多元知识的NER框架——HTLR(Chinese NER method based on Hierarchical Transformer fusing Lexicon and Radical),以通过分层次融合的多元知识来帮助模型学习更丰富、全面的上下文信息和语义信息。首先,通过发布的中文词汇表和词汇向量表识别语料中包含的潜在词汇并把它们向量化,同时通过优化后的位置编码建模词汇和相关字符的语义关系,以学习中文的词汇知识;其次,通过汉典网发布的基于汉字字形的编码将语料转换为相应的编码序列以代表字形信息,并提出RFECNN(Radical Feature Extraction-Convolutional Neural Network)模型来提取字形知识;最后,提出Hierarchical Transformer模型,其中由低层模块分别学习字符和词汇以及字符和字形的语义关系,并由高层模块进一步融合字符、词汇、字形等多元知识,从而帮助模型学习语义更丰富的字符表征。在Weibo、Resume、MSRA和OntoNotes4.0公开数据集进行了实验,与主流方法NFLAT(Non-Flat-LAttice Transformer for Chinese named entity recognition)的对比结果表明,所提方法的F1值在4个数据集上分别提升了9.43、0.75、1.76和6.45个百分点,达到最优水平。可见,多元语义知识、层次化融合、RFE-CNN结构和Hierarchical Transformer结构对学习丰富的语义知识及提高模型性能是有效的。 展开更多
关键词 命名实体识别 自然语言处理 知识图谱构建 词汇增强 字形增强
在线阅读 下载PDF
融合概念对齐信息的中文AMR语料库的构建 被引量:23
2
作者 李斌 闻媛 +3 位作者 宋丽 卜丽君 曲维光 薛念文 《中文信息学报》 CSCD 北大核心 2017年第6期93-102,共10页
作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的... 作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,目前已经建立了较大规模的英文语料库。然而,句子中的词语和AMR图的概念对齐信息缺失,使得自动分析效果和语料标注质量受到影响,同时中文尚无较大规模的AMR语料库。该文介绍了中文AMR语料库的构建工作,针对汉语特点调整了AMR的标注体系,增加对复句关系的标注,提出了融合概念对齐的一体化标注方案,解决了中英文输入法频繁切换的问题,增加了错别字纠正和未标注词高亮功能,提高了标注效率。然后,从CTB中选取了6 923句进行人工标注,形成中文AMR语料库,统计得到图和环的比例分别为48%和1%,以及利用对齐信息才能获取的非投影句的比例32%,为中文AMR的理论和自动分析研究奠定基础。 展开更多
关键词 抽象语义表示 语义图 句子语义 语言知识库
在线阅读 下载PDF
喷杆喷雾机旋翼悬浮式喷杆自动调平控制系统研究 被引量:16
3
作者 周志艳 周铭杰 +3 位作者 陈羽立 明锐 向颖 罗锡文 《农业机械学报》 EI CAS CSCD 北大核心 2022年第12期70-79,共10页
现有的大型喷杆喷雾机的喷杆大多采用传统桁架结构,随着喷杆长度的增加,配套机构、设计复杂度及整机质量相应增加,整机质量大,农田中行走的通过性差,陷车风险高;喷杆平衡控制难度加大,降低了整机的可靠性和便利性;特别是在水田喷施作业... 现有的大型喷杆喷雾机的喷杆大多采用传统桁架结构,随着喷杆长度的增加,配套机构、设计复杂度及整机质量相应增加,整机质量大,农田中行走的通过性差,陷车风险高;喷杆平衡控制难度加大,降低了整机的可靠性和便利性;特别是在水田喷施作业中,大型喷杆喷雾机的功能受到很大限制。本文提出了一种旋翼悬浮式喷杆,分别融合地面机械高续航、载重大和空中无人机作业灵活、受地形地貌限制小的优点,并设计了自动调平控制系统以实现喷雾机喷杆在喷施作业过程中保持水平姿态。分析了喷杆的受力情况,对自动调平控制系统进行了辨识和建模,采用“陀螺仪+激光雷达”进行双传感器融合控制的方式,开展了旋翼悬浮式喷杆自动调平控制算法的仿真试验、台架试验和田间试验。试验结果表明:采用双传感器融合的模糊PID控制算法优于单传感器的角度PID控制算法,可较好地避免出现失稳状态;在田间试验中,当喷杆进入稳定状态后,整根喷杆各点离地高度均值在1.4~1.5 m之间,标准差不大于0.1027 m,具有较好的水平度;所采集的10个不同时刻喷杆各点高度均值的变异系数为1.40%,说明喷杆悬浮高度的稳定性较好。该研究验证了旋翼悬浮式喷杆作业方法的可行性。 展开更多
关键词 旋翼悬浮式喷杆 喷杆喷雾机 自动调平 PID控制 模糊控制
在线阅读 下载PDF
跨模态对比学习的医学影像报告自动生成方法
4
作者 陈淮玺 吴运兵 +2 位作者 刘建成 曾坤 陈开志 《小型微型计算机系统》 北大核心 2025年第10期2440-2449,共10页
医学影像报告自动生成领域因图像与文本在不同语义空间中的分布差异,导致模态之间映射困难,从而出现误判、漏判、以及报告描述缺乏专业性与流畅性等问题.为此,本文提出一种基于跨模态对比学习的自动生成方法.首先,通过检索和比较医学图... 医学影像报告自动生成领域因图像与文本在不同语义空间中的分布差异,导致模态之间映射困难,从而出现误判、漏判、以及报告描述缺乏专业性与流畅性等问题.为此,本文提出一种基于跨模态对比学习的自动生成方法.首先,通过检索和比较医学图像与其相关病史信息,获取图像差异,然后结合患者病史语义特征生成初步报告.接着,将初步报告输入跨模态语义同步记忆单元,记忆单元中存储输入图像与真实报告特征信息,计算报告与记忆单元样本点之间对比损失,不仅缩小生成报告与正样本之间距离,还扩大与负样本间距离,以优化视觉-文本特征提取器,最终生成优化后与图像信息高度一致的报告.实验结果表明,与DeltaNet模型相比,在IU X-Ray和MIMIC-CXR两个基准数据集上,BLEU-4和CIDEr指标分别提升1.3%和11.5%,表明本文方法可以有效提升报告准确性与可读性. 展开更多
关键词 医学影像报告生成 跨模态 对比学习 语义对齐
在线阅读 下载PDF
受限分布映射和伪异常校准引导下的时序异常检测 被引量:1
5
作者 陈泽健 李佐勇 +1 位作者 胡蓉 樊好义 《计算机工程与应用》 北大核心 2025年第5期134-146,共13页
时间序列异常检测旨在识别与正常行为显著不同的稀有模式或偏差。现有的研究侧重于设计更先进的网络架构或优化目标来尽可能准确地捕获数据的正常模式。然而,异常污染下的训练数据和异常信息的缺失会致使传统方法学习到的正态决策边界... 时间序列异常检测旨在识别与正常行为显著不同的稀有模式或偏差。现有的研究侧重于设计更先进的网络架构或优化目标来尽可能准确地捕获数据的正常模式。然而,异常污染下的训练数据和异常信息的缺失会致使传统方法学习到的正态决策边界产生偏差,从而导致次优级的检测性能。提出一种受限分布映射和伪异常校准引导下的无监督异常检测方法。具体地,利用时间卷积网络提取输入数据特征。为了学习更精确的正态决策边界,从两个方面优化正态表征学习过程:第一,提出一种受限分布映射方法,通过特征归一化将训练数据的未知分布映射至高斯分布,并最小化正常数据与超球中心的单类距离,使数据在特征空间中更加紧凑;第二,提出一种伪异常校准机制,利用数据扰动操作从原始数据生成多种类型的伪异常数据,并通过区分正常数据和伪异常数据向模型注入异常知识,矫正决策边界。同时,通过最大化伪异常数据与超球中心的单类距离,扩大正常与异常数据之间的类可分离性。在测试阶段,通过测量输入数据与超球中心的单类距离来检测异常。在5个真实数据集上进行的大量实验表明,该方法实现了相比目前主流方法的更优性能,并且在不同程度的异常污染训练数据下具备更高的鲁棒性。 展开更多
关键词 时间序列 异常检测 受限分布映射 伪异常校准
在线阅读 下载PDF
轮廓波变换的面部姿态检索技术及实验分析 被引量:1
6
作者 曾霞霞 《实验室研究与探索》 CAS 北大核心 2018年第1期16-18,62,共4页
基于经典的面部姿态识别技术进行了人脸识别算法改进。根据LIOP和LBP的优势和问题,提出领域差异向量的方法(YP)实现聚类算法改进,采用了16个领域点的码本,为了不增加计算量,又将图像划分了36个子块;基于传统的PCA算法,提出WPCA实现降维... 基于经典的面部姿态识别技术进行了人脸识别算法改进。根据LIOP和LBP的优势和问题,提出领域差异向量的方法(YP)实现聚类算法改进,采用了16个领域点的码本,为了不增加计算量,又将图像划分了36个子块;基于传统的PCA算法,提出WPCA实现降维,采用了在PCA的基础上再乘以权重的办法,提出了余弦相似度的判别方法;基于PP和retina模型方法,提出了PR方法和预处理流程。通过中科院的CAS的人脸数据平台进行了算法对比实验:该改进方法在遮挡、背景、年龄、表情以及距离5种测试集中,在鉴别能力,提取时间方面都有了显著改进;与传统算法相比也有了明显的改进,比LBP、PP算法提高了20%以上,有一定的异质人脸识别功能。 展开更多
关键词 人脸识别技术 面部姿态 领域差异向量 鉴别能力
在线阅读 下载PDF
基于群组协同过滤的中药组方辅助推荐模型
7
作者 范智勇 李佐勇 +2 位作者 曹新容 卢维楷 吴君阳 《计算机应用与软件》 北大核心 2025年第6期325-334,372,共11页
传统中药组方过程中,医生须掌握复杂的病证关系、药性功用和配伍方法等,方剂疗效受主观经验影响较大。因此,提出一种基于群组协同过滤的中药组方辅助推荐模型。加入群组共现因子和加权偏好估计,从方剂隐式信息中提取症状与中药关联关系... 传统中药组方过程中,医生须掌握复杂的病证关系、药性功用和配伍方法等,方剂疗效受主观经验影响较大。因此,提出一种基于群组协同过滤的中药组方辅助推荐模型。加入群组共现因子和加权偏好估计,从方剂隐式信息中提取症状与中药关联关系及症状间的协同关系,聚合成员偏好生成症状群组嵌入表示;将该嵌入作为模型输入,学习症状群组与中药之间的偏好关系,排序得到推荐中药组方。在真实数据集上的实验结果表明,该模型在准确率、召回率和F1分数上均优于对比方法。 展开更多
关键词 中药组方推荐 协同过滤 群组推荐
在线阅读 下载PDF
基于变径槽轮的无人机条施装置设计与试验
8
作者 王国宾 张同升 +5 位作者 兰玉彬 薛新宇 丁素明 明锐 孔令标 宋灿灿 《农业工程学报》 北大核心 2025年第7期13-21,共9页
针对目前无人机撒施产生的颗粒物料散乱,以及使用槽轮排料存在的物料残留料槽且难清理的问题,该研究设计了一种基于变径槽轮的颗粒肥料条施装置。首先将传统槽轮拆分为料槽与中心轴,并以凸轮轴为固定件代替中心轴,利用凸轮轴旋转使料槽... 针对目前无人机撒施产生的颗粒物料散乱,以及使用槽轮排料存在的物料残留料槽且难清理的问题,该研究设计了一种基于变径槽轮的颗粒肥料条施装置。首先将传统槽轮拆分为料槽与中心轴,并以凸轮轴为固定件代替中心轴,利用凸轮轴旋转使料槽容量产生周期变化。设计了可调整作业间距的导流装置,采用分层布局将整体装置进行集中,不仅实现了成行施肥且避免了结构冗杂。装置整体通过电力驱动,实现对槽轮转速、风力大小和作业间距的调控。采用离散元仿真软件EDEM建立条施装置排肥部分的仿真模型,分析其结构设计及排肥轮转速变化对颗粒肥运动的影响,优化排肥器的结构设计。结果表明,装置的不同管道间的排量均匀性好,变异系数均值最高为1.30%,变径槽轮能够更好更快地排出料槽内的物料,明显改善物料残留问题;台架试验测试装置在槽轮转速为120 r/min时排量最高为453 g/s。田间试验结果表明,导流管夹角影响行距及成条性指数,成条指数最小值为29.1%,整体成条效果好。该装置具有较好的肥料成条作业效果,可为无人机条施技术的研究提供参考。 展开更多
关键词 农用无人机 条施装置 变径槽轮 EDEM
在线阅读 下载PDF
网络多信道多源信息融合技术的改进研究(英文) 被引量:1
9
作者 李麟 张福泉 《机床与液压》 北大核心 2018年第6期152-157,176,共7页
由于D-S融合算法采用的证据合成规则无法有效处理证据冲突问题,并且BP神经网络融合算法在样本波动情况下需要再次训练完成融合,容易出现局部最小值问题。因此,融合D-S融合算法和BP神经网络融合算法,提出基于上下文权值的多信道多源信息... 由于D-S融合算法采用的证据合成规则无法有效处理证据冲突问题,并且BP神经网络融合算法在样本波动情况下需要再次训练完成融合,容易出现局部最小值问题。因此,融合D-S融合算法和BP神经网络融合算法,提出基于上下文权值的多信道多源信息复合融合算法,其先基于检测数据的上下文,采用D-S融合算法和BP神经网络融合算法,对对应上下文内的数据进行融合处理,获取的融合结果被设置相应的权值,再将多个并行融合结果进行加权汇总,得到最终的融合结果,并同设置的阀值实施对比,获取最终的判决结果。实验结果说明,所提算法可有效处理证据冲突的融合问题,具有较高的准确性,融合效果佳。 展开更多
关键词 网络 多信道 多源 信息 融合 改进
在线阅读 下载PDF
基于改进Faster RCNN的安全帽佩戴检测研究 被引量:76
10
作者 徐守坤 王雅如 +3 位作者 顾玉宛 李宁 庄丽华 石林 《计算机应用研究》 CSCD 北大核心 2020年第3期901-905,共5页
针对已有安全帽佩戴检测算法对部分遮挡、尺寸不一和小目标存在检测难度大、准确率低的问题,提出了基于改进的Faster RCNN和多部件结合的安全帽佩戴检测方法。在原始Faster RCNN上运用多尺度训练和增加锚点数量增强网络检测不同尺寸目... 针对已有安全帽佩戴检测算法对部分遮挡、尺寸不一和小目标存在检测难度大、准确率低的问题,提出了基于改进的Faster RCNN和多部件结合的安全帽佩戴检测方法。在原始Faster RCNN上运用多尺度训练和增加锚点数量增强网络检测不同尺寸目标的鲁棒性,并引入防止正负样本不均衡的在线困难样本挖掘策略,然后对检测出的佩戴安全帽工人和安全帽等采用多部件结合方法剔除误检目标。实验表明,相比于原始Faster RCNN,检测准确率提高了7%,对环境的适应性更强。 展开更多
关键词 安全帽佩戴检测 FASTER RCNN 多尺度训练 在线困难样本挖掘 多部件结合
在线阅读 下载PDF
基于改进双粒子群算法的舰船电力系统网络故障重构 被引量:23
11
作者 张兰勇 孟坤 +1 位作者 刘胜 李佐勇 《电力系统保护与控制》 EI CSCD 北大核心 2019年第9期90-96,共7页
舰船电力系统环形网络故障重构本质上是带约束的多目标非线性组合优化问题。为了解决舰船电力系统发生故障时的供电恢复问题,提出了一种改进双粒子群优化算法进行求解。此算法分为主、辅两个粒子群,主粒子群改进了种群初始化、自适应调... 舰船电力系统环形网络故障重构本质上是带约束的多目标非线性组合优化问题。为了解决舰船电力系统发生故障时的供电恢复问题,提出了一种改进双粒子群优化算法进行求解。此算法分为主、辅两个粒子群,主粒子群改进了种群初始化、自适应调整惯性权重和学习因子,提高了主粒子群算法的全局寻优能力。同时,辅助粒子群还采用改进的混沌局部搜索策略,增强了种群多样性及局部寻优能力,有效地解决了粒子群算法中容易陷入局部极值的问题。通过系统仿真,分别将几种不同的优化算法进行比较。结果表明该算法具有很高的搜索效率和寻优能力,能有效地提高故障恢复的速度与精度,在处理舰船电力系统网络故障重构方面具有较好的效果。 展开更多
关键词 舰船电力系统 故障重构 改进双粒子群算法 混沌局部搜索
在线阅读 下载PDF
基于AlexNet的小样本水面漂浮物识别 被引量:23
12
作者 李宁 王雨萱 +1 位作者 徐守坤 石林 《计算机应用与软件》 北大核心 2019年第2期245-251,共7页
针对水面漂浮物识别中图像数据量少、噪声影响多,导致识别精度低的问题,采用一种基于深度学习的小样本水面漂浮物识别方法进行水面常见污染物塑料袋与塑料瓶的识别。采用现有大型数据集中的普通塑料袋与塑料瓶图像构建并训练卷积神经网... 针对水面漂浮物识别中图像数据量少、噪声影响多,导致识别精度低的问题,采用一种基于深度学习的小样本水面漂浮物识别方法进行水面常见污染物塑料袋与塑料瓶的识别。采用现有大型数据集中的普通塑料袋与塑料瓶图像构建并训练卷积神经网络模型AlexNet;采用梯度下降法对模型进行微调,并用融合的光照矫正法处理待识别图像;将网络识别结果与传统的HOG特征提取方法进行比较。实验结果表明,该方法相较于传统的提取特征方法,对于水面漂浮物的识别率提高近15%。 展开更多
关键词 漂浮物图像 小样本 深度学习 AlexNet 光照矫正
在线阅读 下载PDF
基于匹配滤波和自动阈值的眼底血管分割方法 被引量:12
13
作者 曹新容 薛岚燕 +1 位作者 林嘉雯 余轮 《电子测量与仪器学报》 CSCD 北大核心 2017年第1期51-57,共7页
提出一种快速、简便、高效的眼底血管分割方法。分析眼底图像的灰度值分布和对比度变化,利用匹配滤波克服背景干扰,消除噪声影响,达到灰度均衡,实现眼底图像的亮度归一化。估计眼底图像中背景像素所占比例,利用直方图自动选择阈值,完成... 提出一种快速、简便、高效的眼底血管分割方法。分析眼底图像的灰度值分布和对比度变化,利用匹配滤波克服背景干扰,消除噪声影响,达到灰度均衡,实现眼底图像的亮度归一化。估计眼底图像中背景像素所占比例,利用直方图自动选择阈值,完成对眼底图像中血管的有效分割。在公开的眼底图像数据库上进行测试,该方法对眼底血管分割具有较好的性能指标。实验表明,提出的基于匹配滤波和阈值优化的眼底血管分割方法,准确率高、复杂度低,对眼科疾病的计算机辅助诊断有一定的实用价值。 展开更多
关键词 匹配滤波 血管分割 对比度 阈值
在线阅读 下载PDF
基于结构和文本特征的网页分类技术研究 被引量:6
14
作者 顾敏 郭庆 +4 位作者 曹野 朱峰 顾彦慧 周俊生 曲维光 《中国科学技术大学学报》 CAS CSCD 北大核心 2017年第4期290-296,共7页
Web网页中含有丰富的信息资源,通过网页分类可以更好地对其内容进行抽取和管理,方便用户阅读.针对网页复杂的结构信息和丰富的文本内容,提出了一种基于网页文本和结构的网页分类方法,利用众创相关网页的结构特点和文本信息,选择联合特... Web网页中含有丰富的信息资源,通过网页分类可以更好地对其内容进行抽取和管理,方便用户阅读.针对网页复杂的结构信息和丰富的文本内容,提出了一种基于网页文本和结构的网页分类方法,利用众创相关网页的结构特点和文本信息,选择联合特征和原子特征相结合的方法进行分类.实验表明,这种方法有一定的可行性,且比单一使用文本信息进行分类的方法具有更高的正确率和召回率. 展开更多
关键词 网页分类 朴素贝叶斯 原子特征 联合特征
在线阅读 下载PDF
模糊失真图像无参考质量评价综述 被引量:12
15
作者 陈健 李诗云 +2 位作者 林丽 王猛 李佐勇 《自动化学报》 EI CAS CSCD 北大核心 2022年第3期689-711,共23页
图像的模糊问题影响人们对信息的感知、获取及图像的后续处理.无参考模糊图像质量评价是该问题的主要研究方向之一.本文分析了近20年来无参考模糊图像质量评价相关技术的发展.首先,本文结合主要数据集对图像模糊失真进行分类说明;其次,... 图像的模糊问题影响人们对信息的感知、获取及图像的后续处理.无参考模糊图像质量评价是该问题的主要研究方向之一.本文分析了近20年来无参考模糊图像质量评价相关技术的发展.首先,本文结合主要数据集对图像模糊失真进行分类说明;其次,对主要的无参考模糊图像质量评价方法进行分类介绍与详细分析;随后,介绍了用来比较无参考模糊图像质量评价方法性能优劣的主要评价指标;接着,选择典型数据集及评价指标,并采用常见的无参考模糊图像质量评价方法进行性能比较;最后,对无参考模糊图像质量评价的相关技术及发展趋势进行总结与展望. 展开更多
关键词 图像质量评价 无参考图像质量评价 模糊图像 数据集
在线阅读 下载PDF
在线用户评论细粒度属性抽取 被引量:31
16
作者 周清清 章成志 《情报学报》 CSSCI CSCD 北大核心 2017年第5期484-493,共10页
随着在线评论信息数量的快速增长与应用的不断扩展,评论挖掘研究得到学术界的持续关注。当前的评论挖掘任务对属性的全面性、细粒度等要求越来越高,而多数现有研究方法主要关注评价对象主要属性的抽取。尽可能地发现评价对象的全部用户... 随着在线评论信息数量的快速增长与应用的不断扩展,评论挖掘研究得到学术界的持续关注。当前的评论挖掘任务对属性的全面性、细粒度等要求越来越高,而多数现有研究方法主要关注评价对象主要属性的抽取。尽可能地发现评价对象的全部用户关注属性、并以细粒度方式表述属性,是一项有意义的工作。本文提出一种细粒度属性抽取方法,旨在全面、快速地抽取产品属性。本文首先利用高频名词构建候选属性词;然后通过深度学习构建候选属性词向量,在此基础上完成候选属性的聚类,得到聚类后的候选属性词集;最后对候选属性词集进行噪音过滤,得到细粒度产品属性集。在饮食、手机、图书等三个领域评论语料上的实验结果表明,相对于基于种子词的方法、基于结合人工的LDA方法及基于情感词的方法,本文方法能够更加全面地发现评价对象属性,并且能够给出细粒度的属性。 展开更多
关键词 属性抽取 属性聚类 深度学习 近邻传播聚类 细粒度属性
在线阅读 下载PDF
结合表示学习和迁移学习的跨领域情感分类 被引量:9
17
作者 廖祥文 吴晓静 +2 位作者 桂林 黄锦辉 陈国龙 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第1期37-46,共10页
针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先,利用低维稠密的词向量对文本进行初始化,通过分... 针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息,且在迁移过程中存在负面迁移的问题,提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先,利用低维稠密的词向量对文本进行初始化,通过分层注意力网络,对文本中重要单词与句子的情感信息进行建模,从而学习源领域与目标领域的文档级分布式表示。随后,采用类噪声估计方法,对源领域中的迁移数据进行检测,剔除负面迁移样例,挑选高质量样例来扩充目标领域的训练集。最后,训练支持向量机对目标领域文本进行情感分类。在大规模公开数据集上进行的两个实验结果表明,与基准方法相比,所提方法的均方根误差分别降低1.5%和1.0%,说明该方法可以有效地提高跨领域情感分类性能。 展开更多
关键词 文本表示学习 迁移学习 类噪声估计 跨领域 情感分类
在线阅读 下载PDF
基于word2vec和LDA的文本主题 被引量:7
18
作者 徐守坤 周佳 +1 位作者 李宁 石林 《计算机工程与设计》 北大核心 2018年第9期2764-2769,共6页
将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初... 将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初始主题词汇之间的相似度和向量邻接关系按照权重不同重新分配,改进Gibbs抽样,对LDA进行改进,提高主题挖掘的准确性和稳定性。实验结果表明,当训练语料分布合理时,经过LDA和word2vec的有效结合,主题词抽取效果有所提高,验证了该方法的可行性。 展开更多
关键词 自然语言处理 LDA模型 主题挖掘 word2vec模型 GIBBS抽样
在线阅读 下载PDF
青光眼视神经头参数与视网膜神经纤维层的相关性分析 被引量:8
19
作者 徐军 陈强 牛四杰 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第6期977-983,共7页
青光眼是一种以视神经萎缩和视野缺损为共同特征的视网膜疾病,是导致人类失明的第二大视网膜疾病.青光眼的早期症状不明显,因此对早期青光眼的筛选和诊断将会阻止青光眼的进一步发展.文中提出一种评估青光眼发病机制的算法,首先利用随... 青光眼是一种以视神经萎缩和视野缺损为共同特征的视网膜疾病,是导致人类失明的第二大视网膜疾病.青光眼的早期症状不明显,因此对早期青光眼的筛选和诊断将会阻止青光眼的进一步发展.文中提出一种评估青光眼发病机制的算法,首先利用随机森林分割视网膜神经纤维层,然后利用块搜索算法分割视盘与视杯,最后分析两者相关性.实验结果表明,视网膜神经纤维层与垂直杯盘比,视杯面积以及沿盘面积比的相关性大小为0.64,0.62和0.54,验证了在诊断青光眼方面计算视网膜神经纤维层厚度与杯盘比大小是密切相关和互补的,对研究青光眼的发展趋势具有重要意义. 展开更多
关键词 频域光学相干断层技术 青光眼 视网膜神经纤维层 杯盘比 随机森林 支持向量机 相关性分析
在线阅读 下载PDF
云计算中保护数据隐私的快速多关键词语义排序搜索方案 被引量:20
20
作者 杨旸 刘佳 +1 位作者 蔡圣暐 杨书略 《计算机学报》 EI CSCD 北大核心 2018年第6期1346-1359,共14页
可搜索加密技术主要解决在云服务器不完全可信的情况下,支持用户在密文上进行搜索.该文提出了一种快速的多关键词语义排序搜索方案.首先,该文首次将域加权评分的概念引入文档的评分当中,对标题、摘要等不同域中的关键词赋予不同的权重... 可搜索加密技术主要解决在云服务器不完全可信的情况下,支持用户在密文上进行搜索.该文提出了一种快速的多关键词语义排序搜索方案.首先,该文首次将域加权评分的概念引入文档的评分当中,对标题、摘要等不同域中的关键词赋予不同的权重加以区分.其次,对检索关键词进行语义拓展,计算语义相似度,将语义相似度、域加权评分和相关度分数三者结合,构造了更加准确的文档索引.然后,针对现有的MRSE(Multi-keyword Ranked Search over Encrypted cloud data)方案效率不高的缺陷,将创建的文档向量分块,生成维数较小的标记向量.通过对文档标记向量和查询标记向量的匹配,有效地过滤了大量的无关文档,减少了计算文档相关度分数和排序的时间,提高了搜索的效率.最后,在加密文档向量时,将文档向量分段,每一段与对应维度的矩阵相乘,使得构建索引的时间减少,进一步提高了方案的效率.理论分析和实验结果表明:该方案实现了快速的多关键词语义模糊排序搜索,在保障数据隐私安全的同时,有效地提高了检索效率,减少了创建索引的时间,并返回更加满足用户需求的排序结果. 展开更多
关键词 云计算 可搜索加密 语义相似度 域加权评分 快速KNN(K-Nearest Neighbor)算法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部