期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于视觉空间定向理论的虚拟现实空间重构 被引量:20
1
作者 夏振平 胡伏原 +1 位作者 程成 顾敏明 《液晶与显示》 CAS CSCD 北大核心 2019年第2期215-219,共5页
立体视觉中,虚拟的中央眼是立体空间定向的依据。中央眼存在个体差异,然而现有虚拟现实技术在立体影像呈现过程中尚未考虑到中央眼的个体差异。模拟的射击实验结果表明,人眼视觉系统对立体空间中,物体之间相对方向的判断极其敏感,实际... 立体视觉中,虚拟的中央眼是立体空间定向的依据。中央眼存在个体差异,然而现有虚拟现实技术在立体影像呈现过程中尚未考虑到中央眼的个体差异。模拟的射击实验结果表明,人眼视觉系统对立体空间中,物体之间相对方向的判断极其敏感,实际中央眼位置与理想情况之间的微小偏移会带来显著性的感知差异。虚拟现实技术模拟真实场景的拟真性和交互性可以通过考虑个体中央眼位置的方式进行提升。本文通过对人眼双目定向理论的分析,提出了基于中央眼位置的虚拟空间重构方法,采用对立体相机系统反方向平移的方法补偿由于中央眼偏移带来的偏差。所提出的方法有望为虚拟现实技术拟真性和交互性的提升提供理论依据。 展开更多
关键词 虚拟现实 中央眼 空间定向 空间重构
在线阅读 下载PDF
一种面向智能家居设备控制的多模态人机智能交互方法 被引量:14
2
作者 邵帮丽 朱寅 +4 位作者 朱润 潘晨曦 王坚 奚雪峰 杨颢 《林业工程学报》 CSCD 北大核心 2021年第4期190-196,共7页
传统家居设备人机交互主要采用接触式控制方式,限制了用户双手的活动空间,难以满足日益繁多的智能设备控制便利性需求。而语音控制这种非接触的控制形式虽然解放了用户双手,能够提供自然的控制方式,但这种基于单模态的控制方式仍然存在... 传统家居设备人机交互主要采用接触式控制方式,限制了用户双手的活动空间,难以满足日益繁多的智能设备控制便利性需求。而语音控制这种非接触的控制形式虽然解放了用户双手,能够提供自然的控制方式,但这种基于单模态的控制方式仍然存在识别准确率不高等问题。融合视觉、声音等多模态信息的方法,能够形成模态信息之间的互补性,已在多个领域得到成功应用。受此启发,针对上述家居设备人机交互控制两个方面的问题,提出一种融合语音识别与手势识别的多模态人机智能交互方法,实现高效准确的非接触式智能家居人机交互。首先,采用基于Keras搭建的CNN模型以及ResNet50两种网络模型得到两种手势控制命令识别结果;其次,通过语音识别及处理,形成文本控制命令识别结果;最后,对上述3种控制命令结果通过投票法进行多模态融合,选取概率最高的结果作为最终控制命令输出。其中,采用常用手势符号作为系统预定义手势标签,降低记忆的要求,方便用户使用。同时,针对家居控制手势图片数据集不足的情况,还构建了一个包含28 105张图片的手势数据集。实验结果表明,多模态交互方式能够弥补家居设备单一控制交互的缺陷,并且提高了控制指令的准确性,准确率达96.33%。 展开更多
关键词 智能家居 手势识别 语音识别 人机交互 模态融合
在线阅读 下载PDF
大模型时代下的汉语自然语言处理研究与探索 被引量:6
3
作者 黄施洋 奚雪峰 崔志明 《计算机工程与应用》 北大核心 2025年第1期80-97,共18页
自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然... 自然语言处理是实现人机交互的关键步骤,而汉语自然语言处理(Chinese natural language processing,CNLP)是其中的重要组成部分。随着大模型技术的发展,CNLP进入了一个新的阶段,这些汉语大模型具备更强的泛化能力和更快的任务适应性。然而,相较于英语大模型,汉语大模型在逻辑推理和文本理解能力方面仍存在不足。介绍了图神经网络在特定CNLP任务中的优势,进行了量子机器学习在CNLP发展潜力的调查。总结了大模型的基本原理和技术架构,详细整理了大模型评测任务的典型数据集和模型评价指标,评估比较了当前主流的大模型在CNLP任务中的效果。分析了当前CNLP存在的挑战,并对CNLP任务的未来研究方向进行了展望,希望能帮助解决当前CNLP存在的挑战,同时为新方法的提出提供了一定的参考。 展开更多
关键词 汉语自然语言处理 图神经网络 量子机器学习 汉语大模型
在线阅读 下载PDF
基于并联残差膨胀卷积网络的短文本实体关系联合抽取
4
作者 曾伟 奚雪峰 崔志明 《现代电子技术》 北大核心 2025年第2期169-178,共10页
关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题... 关系抽取旨在从文本中提取出实体对之间存在的语义关系,但现有的关系抽取方法均存在关系冗余和重叠的不足,尤其是对于短文本,会因上下文信息不足而出现语义信息不足和噪声大等问题。此外,一般流水线式的关系抽取模型还存在误差传递问题。为此,文中提出一种基于并联残差膨胀卷积网络的短文本实体关系联合抽取方法。该方法利用BERT生成语义特征信息,采用并联残差膨胀卷积网络来捕获语义信息,从而提升上下文信息的捕获能力并缓解噪声。联合抽取框架通过抽取潜在关系来过滤无关关系,然后再抽取实体以预测三元组,从而解决关系冗余和重叠问题,并提高计算效率。实验结果表明,与现有的主流模型相比,所提模型在三个公共数据集NYT、WebNLG和DuIE上的F1值分别为90.9%、91.3%和73.5%,相较于基线模型均有提升,验证了该模型的有效性。 展开更多
关键词 实体关系抽取 短文本 残差膨胀卷积网络 语义特征 联合抽取 BERT编码器
在线阅读 下载PDF
基于位置增强和对抗训练的中文短文本实体消歧
5
作者 曾伟 奚雪峰 崔志明 《印刷与数字媒体技术研究》 北大核心 2025年第5期48-57,共10页
实体消歧作为自然语言处理领域的关键问题之一,对于文本理解和信息检索具有重要意义。因短文本语境信息有限、表达不规范以及语法结构不完整,短文本实体消歧方法准确率较低。为此,本研究提出了一种基于位置增强和对抗训练的中文短文本... 实体消歧作为自然语言处理领域的关键问题之一,对于文本理解和信息检索具有重要意义。因短文本语境信息有限、表达不规范以及语法结构不完整,短文本实体消歧方法准确率较低。为此,本研究提出了一种基于位置增强和对抗训练的中文短文本实体消歧方法。首先,在文本编码层引入位置增强机制,以加强实体消歧过程中对实体在文本中位置的考量,从而提高消歧精度。然后,通过双路网络处理获得的文本表示,利用PCNN模型获取句子依赖特征,利用GCN模型获取语义特征,融合二者的语义信息完成消歧任务。在此基础上,采用对抗训练技术,在编码后的文本表示中添加扰动,使模型能够充分学习文本中微妙的语义特征,以增强模型的泛化能力和鲁棒性。实验结果表明,本研究方法在CCKS2019数据集上达到了75.94%的精确率,验证了其在解决中文短文本实体消歧任务中的有效性和可行性。 展开更多
关键词 短文本 实体消歧 位置增强 卷积网络
在线阅读 下载PDF
图神经网络在命名实体识别中的应用研究 被引量:3
6
作者 束文豪 奚雪峰 +1 位作者 崔志明 顾晨凯 《计算机工程与应用》 CSCD 北大核心 2023年第19期52-65,共14页
命名实体识别是自然语言处理的预处理任务之一,目的是从非结构化文本中识别出所需的实体及类型,应用于众多下游任务,例如构建知识图谱、事件抽取及自动问答等。近几年,随着自然语言处理领域对图神经网络的广泛应用,一些基于图神经网络... 命名实体识别是自然语言处理的预处理任务之一,目的是从非结构化文本中识别出所需的实体及类型,应用于众多下游任务,例如构建知识图谱、事件抽取及自动问答等。近几年,随着自然语言处理领域对图神经网络的广泛应用,一些基于图神经网络的命名实体识别方法取得了较好的结果。对图神经网络在命名实体识别中的应用进行了系统性的调研,描述了命名实体识别的发展进程,介绍了图神经网络及三种变体模型,详细分析了如何利用图神经网络的特点在命名实体识别任务上的应用研究,最后提出了未来可能研究的方向和思路。 展开更多
关键词 命名实体识别 图神经网络 自然语言处理 深度学习
在线阅读 下载PDF
嵌入式静态知识图谱补全研究进展 被引量:3
7
作者 吴玉洁 奚雪峰 崔志明 《计算机工程与应用》 CSCD 北大核心 2024年第12期34-47,共14页
知识图谱是一种应用广泛且语义丰富的数据表示形式,日益成为知识工程领域的重要技术。但是由于现实世界中的知识图谱往往存在不完整和含糊的信息,阻碍了知识图谱应用性能。知识图谱补全技术旨在通过预测缺失的实体或关系来丰富知识图谱... 知识图谱是一种应用广泛且语义丰富的数据表示形式,日益成为知识工程领域的重要技术。但是由于现实世界中的知识图谱往往存在不完整和含糊的信息,阻碍了知识图谱应用性能。知识图谱补全技术旨在通过预测缺失的实体或关系来丰富知识图谱的内容,是近年来研究的热点,特别是在知识图谱补全任务中采用嵌入式方法取得了显著进展。回顾近年来嵌入式静态知识图谱补全方法,从空间平移、张量分解、神经网络模型、预训练语言模型等角度开展分类探讨。这些方法通过将实体关系嵌入到连续向量空间中,实现了更好的语义表示和推理能力;同时,在捕捉实体间复杂关系、利用图结构信息等方面具有潜在优势。 展开更多
关键词 知识图谱嵌入 知识图谱补全 预训练语言模型
在线阅读 下载PDF
面向数据可视化的自然语言接口研究综述 被引量:1
8
作者 高帅 奚雪峰 +2 位作者 郑倩 崔志明 盛胜利 《计算机工程与应用》 CSCD 北大核心 2024年第15期24-41,共18页
数据可视化领域长期以来的目标是寻找直接从自然语言生成可视化的解决方案,而自然语言接口(NLI)的研究为该领域提供了新的解决办法。该接口接受自然语言形式的查询和表格数据集作为输入,并输出与之对应的可视化渲染。在作为一种辅助输... 数据可视化领域长期以来的目标是寻找直接从自然语言生成可视化的解决方案,而自然语言接口(NLI)的研究为该领域提供了新的解决办法。该接口接受自然语言形式的查询和表格数据集作为输入,并输出与之对应的可视化渲染。在作为一种辅助输入方式的同时,传统用户需将分析意图转化为一系列逻辑操作并与之进行交互(如编程指令或图形化界面操作方式等),与利用面向数据可视化的自然语言接口(DV-NLI)相结合,能够使用户专注于可视化任务,而无需担心如何操作可视化工具。近年来,随着大语言模型(LLM)GPT-3、GPT-4的兴起,将LLM与可视化相结合已成为研究热点。对现有的DV-NLI进行了全面的回顾,并进行了新的研究补充。按照其实现方法,将DV-NLI分为符号化NLP方法、深度学习模型方法、大语言模型方法三类,对每个分类下的相关技术进行分析论述。最后,总结并展望DV-NLI的未来工作。 展开更多
关键词 数据可视化 自然语言接口 机器学习 神经网络模型 大语言模型
在线阅读 下载PDF
面向知识图谱的会话式机器阅读理解研究综述 被引量:1
9
作者 胡娟 奚雪峰 崔志明 《计算机工程与应用》 CSCD 北大核心 2024年第3期17-28,共12页
对话式机器阅读理解随着数据集的发展而发展,目的在于让机器在理解文章内容的基础上能够进行多轮对话。但现有的模型方法无法从对话历史中捕获到与当前问题最相关的历史信息,模型的推理能力较差,很难获取实体间的隐含信息。知识图谱应... 对话式机器阅读理解随着数据集的发展而发展,目的在于让机器在理解文章内容的基础上能够进行多轮对话。但现有的模型方法无法从对话历史中捕获到与当前问题最相关的历史信息,模型的推理能力较差,很难获取实体间的隐含信息。知识图谱应用于推理问答是当前的一大研究热点。知识图谱技术可以推断出实体间的隐含关系,应用于推理问答则能够提升模型的推理问答能力,提高预测的准确率。近年来,知识图谱推理技术的广泛应用,极大地推动了知识图谱推理问答的发展。对基于知识图谱的会话式机器阅读理解从三方面进行总结:介绍了会话式机器阅读理解领域的数据集以及当前的一些典型的模型方法,并对模型的性能和优缺点作了简要的分析与比较;介绍了知识图谱的定义、架构以及四大核心技术,并简要介绍了三大类知识图谱推理问答的模型方法;最后总结工作,并根据会话式机器阅读理解的数据集特点和知识图谱推理问答模型的缺点,对未来的研究重点进行展望。 展开更多
关键词 机器阅读理解 多轮对话 知识图谱 知识图谱推理问答
在线阅读 下载PDF
汉语篇章微观话题结构建模与语料库构建 被引量:9
10
作者 奚雪峰 褚晓敏 +1 位作者 孙庆英 周国栋 《计算机研究与发展》 EI CSCD 北大核心 2017年第8期1833-1852,共20页
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论... 篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论和宾州篇章树库体系的优势,结合汉语复句句群理论以及汉语自身特点,提出了一种基于主述位理论的汉语篇章微观话题结构表示方式,并借助微观话题链构建了汉语篇章话题结构表示体系.随后,在此基础上,采用自顶向下、后向搜索的标注策略和人机结合的语料库标注方式,构建了基于篇章微观话题表示体系的汉语篇章话题结构语料库(Chinese discourse topic corpus,CDTC).CDTC共包含500个文档,对其进行了详细统计分析并展示了语料库的标注情况.与宾州篇章树库体系、广义话题结构理论的对比表明,所提篇章微观话题结构表示体系在理论上具有一定的优越性,并且符合汉语特点;一致性检验表明CDTC能够充分体现汉语篇章话题分析问题本身的难度,并能够为相关研究提供语料资源支持. 展开更多
关键词 篇章话题结构 主位-述位理论 主位推进 话题链 语料库构建
在线阅读 下载PDF
增强型深度确定策略梯度算法 被引量:9
11
作者 陈建平 何超 +3 位作者 刘全 吴宏杰 胡伏原 傅启明 《通信学报》 EI CSCD 北大核心 2018年第11期106-115,共10页
针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该算法在深度确定策略梯度算法的基础上,重新构建两个新的样本池——多样性样本池和高误差样本池。在算法执行过程中,训练样本分别从多样... 针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该算法在深度确定策略梯度算法的基础上,重新构建两个新的样本池——多样性样本池和高误差样本池。在算法执行过程中,训练样本分别从多样性样本池和高误差样本池按比例选取,以兼顾样本多样性以及样本价值信息,提高样本的利用效率和算法的收敛性能。此外,进一步从理论上证明了利用自模拟度量方法对样本进行相似性度量的合理性,建立值函数与样本相似性之间的关系。将E-DDPG算法以及DDPG算法用于经典的Pendulum问题和MountainCar问题,实验结果表明,E-DDPG具有更好的收敛稳定性,同时具有更快的收敛速率。 展开更多
关键词 深度强化学习 样本排序 自模拟度量 时间差分误差
在线阅读 下载PDF
深度卷积神经网络图像实例分割方法研究进展 被引量:16
12
作者 胡伏原 万新军 +3 位作者 沈鸣飞 徐江浪 姚睿 陶重犇 《计算机科学》 CSCD 北大核心 2022年第5期10-24,共15页
图像实例分割是图像处理和计算机视觉技术中关于图像理解的重要环节,随着深度学习和深层卷积神经网络日趋成熟,基于深度卷积神经网络的图像实例分割方法取得了跨越性进展。实例分割任务实际上是目标检测和语义分割两项任务的结合,可以... 图像实例分割是图像处理和计算机视觉技术中关于图像理解的重要环节,随着深度学习和深层卷积神经网络日趋成熟,基于深度卷积神经网络的图像实例分割方法取得了跨越性进展。实例分割任务实际上是目标检测和语义分割两项任务的结合,可以在像素层面完成识别图像中目标轮廓的任务。实例分割不仅可以定位图像中目标的位置,从像素层面上分割所有目标,还可以标注出图像中同一类别的不同个体,既是对图像的像素级分割,又是实例级理解。首先,阐述了图像实例分割产生的原因和深度卷积神经网络的作用。然后,根据图像实例分割方法的过程和特征,分别从两阶段和单阶段的角度介绍了图像实例分割的研究进展,详细阐述了两类方法的优势和不足,进而总结了各类实例分割方法对区域、特征提取和掩膜的设计思路。此外,归纳了图像实例分割方法的性能评价标准和常用的公开数据集,并在此基础上对比和评估了主流的图像实例分割模型的分割精度。最后,指出了当前图像实例分割存在的问题及解决思路,并对其未来发展进行了总结和展望。 展开更多
关键词 实例分割 深度卷积神经网络 目标检测 语义分割 两阶段 单阶段
在线阅读 下载PDF
基于Spark的大数据聚类研究及系统实现 被引量:24
13
作者 王磊 邹恩岑 +2 位作者 曾诚 奚雪峰 陆悠 《数据采集与处理》 CSCD 北大核心 2018年第6期1077-1085,共9页
传统聚类算法由于单机内存和运算能力的限制已经不能满足当前大数据处理的要求,因而迫切需要寻找新的解决方法。针对单机内存运算问题,结合聚类算法的迭代计算特点,提出并实现了一种基于Spark平台的聚类系统。针对稀疏集和密集集两种不... 传统聚类算法由于单机内存和运算能力的限制已经不能满足当前大数据处理的要求,因而迫切需要寻找新的解决方法。针对单机内存运算问题,结合聚类算法的迭代计算特点,提出并实现了一种基于Spark平台的聚类系统。针对稀疏集和密集集两种不同类型的数据集,系统首先采用不同策略实现数据预处理;其次分析比较了不同聚类算法在Spark平台下的聚类性能,并给出最佳方案;最后利用数据持久化技术提高了计算速度。实验结果表明,所提系统能够有效满足海量数据聚类分析的任务要求。 展开更多
关键词 SPARK 聚类 大数据
在线阅读 下载PDF
基于冷暖白光LED的线性调光混合照明 被引量:6
14
作者 夏振平 付保川 程成 《发光学报》 EI CAS CSCD 北大核心 2018年第5期730-736,共7页
为了提供高品质、更安全和智能的照明光源,基于冷暖白光LED建立了线性调光混合照明系统及其优化调光调色方法。混合照明光源以色温和明度等级分别设定光色度和光强度,更加符合人性化需求。在系统智能优化配光过程中,设定色温转换为CIE u... 为了提供高品质、更安全和智能的照明光源,基于冷暖白光LED建立了线性调光混合照明系统及其优化调光调色方法。混合照明光源以色温和明度等级分别设定光色度和光强度,更加符合人性化需求。在系统智能优化配光过程中,设定色温转换为CIE u'v'均匀色品坐标,明度转换为亮度,使优化计算更加精确。系统采用的线性调光避免了闪烁潜在的安全风险,同时配合优化算法解决了线性调光色度漂移大的问题。实验结果表明,系统混合光的色度稳定性可以保持在1阶CIE u'v'圆内,相应色度设定下的整个光强度调节范围内无可察觉的色差。理论研究和实验结果表明该混光照明系统简单可行,具有较高的实用价值。 展开更多
关键词 白光LED 混合照明 线性调光 色差 CIE u′v′圆
在线阅读 下载PDF
面向图像自动语句标注的注意力反馈模型 被引量:5
15
作者 吕凡 胡伏原 +2 位作者 张艳宁 夏振平 盛胜利 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第7期1122-1129,共8页
图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的... 图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的基础上引入注意力反馈机制,利用关注信息的图像特征指导文本生成,同时借助生成文本中的关注信息进一步修正图像中的关注区域,该过程不断强化图像和文本中的关键信息匹配、优化生成的语句.针对常用数据集Flickr8k, Flickr30k 和MSCOCO 的实验结果表明,该模型在一定程度上解决了注意力分散和语句顺序错乱问题,比其他基于注意力机制方法标注的关注区域更加准确,生成语句更加通顺. 展开更多
关键词 图像自动语句标注 注意力机制 注意力反馈
在线阅读 下载PDF
面向意图性的篇章话题结构分析研究与展望 被引量:4
16
作者 奚雪峰 孙庆英 周国栋 《计算机学报》 EI CSCD 北大核心 2019年第12期2769-2794,共26页
篇章话题结构分析主要针对篇章的意图性,是篇章语义分析的基础,其主要任务是从整体层次上分析出篇章结构及其构成单元之间的语义关系,并利用上下文理解篇章.篇章分析既需要研究篇章的基本构成单元,更需要研究基本构成单元之间的篇章关系... 篇章话题结构分析主要针对篇章的意图性,是篇章语义分析的基础,其主要任务是从整体层次上分析出篇章结构及其构成单元之间的语义关系,并利用上下文理解篇章.篇章分析既需要研究篇章的基本构成单元,更需要研究基本构成单元之间的篇章关系.然而当前自然语言处理的研究重心大都集中在词法和句法领域,而忽略了对篇章内在规律的研究,缺乏对篇章话题结构展开有效分析的系统理论方法,这就极大阻碍了基于篇章语义分析的相关应用.本文首先从篇章衔接性和连贯性两个基本特征入手,讨论了篇章话题结构分析的国内外研究现状,从理论体系探索、语料库构建和计算模型三方面展开详细综述,分析对比了各类理论、资源及其模型的特点.其中,理论部分代表性的工作包括语域加衔接理论,Hobbs模型,修辞结构理论,PDTB体系,意图结构理论,宏观结构理论等;资源部分主要工作有修辞结构篇章树库、宾州篇章树库、MUC语料、ACE评测语料、ARRAU、OntoNotes和篇章图库等;在计算模型方面,主要围绕上述理论和技术资源展开相关研究;随后,特别讨论了汉语篇章话题结构的最新研究进展.基于上述讨论,本文分析探索了基于主述位理论的篇章微观话题结构表示体系,并描述了相应语料库资源的构建及其一致性检验;篇章微观话题结构形式化表示为一个三元组,其主要特征是一种链式结构,链结点为篇章基本话题(子句),其内部的主位或述位为连接端,连接端之间通过微观话题联接建立起连接关系,其实质是一种语义关联,体现篇章之间的衔接关系.最后,本文还对篇章话题结构研究的未来发展方向进行了总结展望. 展开更多
关键词 篇章话题结构 篇章理论 语料库标注 计算模型 篇章意图性 篇章语义分析
在线阅读 下载PDF
多层次结构生成对抗网络的文本生成图像方法 被引量:15
17
作者 孙钰 李林燕 +2 位作者 叶子寒 胡伏原 奚雪峰 《计算机应用》 CSCD 北大核心 2019年第11期3204-3209,共6页
近年来,生成对抗网络(GAN)在从文本描述到图像的生成中已经取得了显著成功,但仍然存在图像边缘模糊、局部纹理不清晰以及生成样本方差小等问题。针对上述不足,在叠加生成对抗网络模型(StackGAN++)基础上,提出了一种多层次结构生成对抗网... 近年来,生成对抗网络(GAN)在从文本描述到图像的生成中已经取得了显著成功,但仍然存在图像边缘模糊、局部纹理不清晰以及生成样本方差小等问题。针对上述不足,在叠加生成对抗网络模型(StackGAN++)基础上,提出了一种多层次结构生成对抗网络(MLGAN)模型,该网络模型由多个生成器和判别器以层次结构并列组成。首先,引入层次结构编码方法和词向量约束来改变网络中各层次生成器的条件向量,使图像的边缘细节和局部纹理更加清晰生动;然后,联合训练生成器和判别器,借助多个层次的生成图像分布共同逼近真实图像分布,使生成样本方差变大,增加生成样本的多样性;最后,从不同层次的生成器生成对应文本的不同尺度图像。实验结果表明,在CUB和Oxford-102数据集上MLGAN模型的Inception score分别达到了4.22和3.88,与StackGAN++相比,分别提高了4.45%和3.74%。MLGAN模型在解决生成图像的边缘模糊和局部纹理不清晰方面有了一定提升,其生成的图像更接近真实图像。 展开更多
关键词 生成对抗网络 文本生成图像 多层次结构生成对抗网络 多层次图像分布 层次结构编码
在线阅读 下载PDF
一种改进FCN的肝脏肿瘤CT图像分割方法 被引量:14
18
作者 段杰 崔志明 +3 位作者 沈艺 冯威 吴宏杰 冯雨晴 《图学学报》 CSCD 北大核心 2020年第1期100-107,共8页
精准的医学图像分割是辅助疾病诊断和手术规划的必要步骤。由于腹部器官边界模糊、对比度不高,肝脏肿瘤的自动分割一直是一个难题。针对传统全卷积神经网络(FCN)实现端到端分割精度不佳等问题,提出了一种卷积型多尺度融合FCN的CT图像肝... 精准的医学图像分割是辅助疾病诊断和手术规划的必要步骤。由于腹部器官边界模糊、对比度不高,肝脏肿瘤的自动分割一直是一个难题。针对传统全卷积神经网络(FCN)实现端到端分割精度不佳等问题,提出了一种卷积型多尺度融合FCN的CT图像肝脏肿瘤分割方法。首先,通过提高对比度、增强和去噪的方式对原始的CT图像数据集进行预处理;然后使用处理后的数据集对所设计好的FCN网络进行训练;最终得出能够精确分割肝脏肿瘤的网络模型。实验效果采用多种评价指标进行分割结果的评估,并且与多种常见的分割网络进行对比。实验结果表明本文方法可以精准分割CT图像中各种形状和大小的肝脏肿瘤,分割效果良好,能够为临床的诊断提供可靠的依据。 展开更多
关键词 全卷积神经网络 肝脏肿瘤分割 深度学习 图像分割 卷积多尺度融合
在线阅读 下载PDF
一种改进的Mask RCNN特征融合实例分割方法 被引量:19
19
作者 温尧乐 李林燕 +1 位作者 尚欣茹 胡伏原 《计算机应用与软件》 北大核心 2019年第10期130-133,共4页
实例分割需要兼顾像素级的分类准确性和目标实例级的高级语义特性,非常具有挑战性。由于特征金字塔网络低层特征到高层特征的融合路径太长,导致低层特征在整个特征层次中的作用较弱。在特征金字塔网络的基础上,引入一条自下而上的路径... 实例分割需要兼顾像素级的分类准确性和目标实例级的高级语义特性,非常具有挑战性。由于特征金字塔网络低层特征到高层特征的融合路径太长,导致低层特征在整个特征层次中的作用较弱。在特征金字塔网络的基础上,引入一条自下而上的路径来增强整个特征层次,缩短较低层特征与顶部特征之间的融合路径,增强低层特征在整个特征层次中的作用;在卷积神经网络中引入空洞卷积算法扩大卷积感受域,进一步提升掩膜预测准确度。在MicrosoftCOCO数据集测试结果表明,该方法有效提高了实例分割的准确度。 展开更多
关键词 实例分割 特征融合 卷积神经网络 空洞卷积
在线阅读 下载PDF
基于多重指数移动平均评估的DDPG算法 被引量:1
20
作者 范晶晶 陈建平 +2 位作者 傅启明 陆悠 吴宏杰 《计算机工程与设计》 北大核心 2021年第11期3084-3090,共7页
针对深度确定性策略梯度算法中双网络结构的不稳定及单评论家评估不准确的问题,提出基于多重指数移动平均评估的DDPG算法。介绍EMA-Q网络和目标Q网络合作得出目标更新值,对多个评论家给出的Q值求平均,降低单评论家评估的不准确性。样本... 针对深度确定性策略梯度算法中双网络结构的不稳定及单评论家评估不准确的问题,提出基于多重指数移动平均评估的DDPG算法。介绍EMA-Q网络和目标Q网络合作得出目标更新值,对多个评论家给出的Q值求平均,降低单评论家评估的不准确性。样本池部分引入双重经验回放方法,采用两个样本池分别存储不同的经验,提高算法的收敛性能。将所提算法及原始DDPG算法分别实验于经典的Pendulum问题和Mountain Car问题中。实验结果表明,与传统的DDPG算法相比,所提算法准确性更好,稳定性更高,收敛速度明显提升。 展开更多
关键词 深度学习 强化学习 指数移动平均 平均评估 双重经验回放
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部