期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
文本到视频生成:研究现状、进展和挑战 被引量:3
1
作者 邓梓焌 何相腾 彭宇新 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第5期1632-1644,共13页
文本到视频生成旨在根据用户给定的文本描述生成语义一致、内容真实、时序连贯且符合逻辑的视频。该文首先介绍了文本到视频生成领域的研究现状,详细介绍了3类主流的文本到视频生成方法:基于循环网络与生成对抗网络(GAN)的生成方法,基于... 文本到视频生成旨在根据用户给定的文本描述生成语义一致、内容真实、时序连贯且符合逻辑的视频。该文首先介绍了文本到视频生成领域的研究现状,详细介绍了3类主流的文本到视频生成方法:基于循环网络与生成对抗网络(GAN)的生成方法,基于Transformer的生成方法和基于扩散模型的生成方法。这3类生成方法在视频生成任务上各有优劣:基于循环网络与生成对抗网络的生成方法能生成较高分辨率和时长的视频,但难以生成复杂的开放域视频;基于Transformer的生成方法有能力生成复杂的开放域视频,但受限于Transformer模型单向偏置、累计误差等问题,难以生成高保真视频;扩散模型具有很好的泛化性,但受制于推理速度和高昂的内存消耗,难以生成高清的长视频。然后,该文介绍了文本到视频生成领域的评测基准和指标,并分析比较了现有主流方法的性能。最后,展望了未来可能的研究方向。 展开更多
关键词 文本到视频生成 扩散模型 生成对抗网络
在线阅读 下载PDF
跨模态目标重识别研究综述
2
作者 崔振宇 周嘉欢 彭宇新 《计算机科学》 CSCD 北大核心 2024年第1期13-25,共13页
目标重识别(ReID)技术旨在匹配不同区域摄像头在不同时间拍摄到的同一目标,其核心是通过目标间的细粒度差异实现不同目标的有效区分。因此,目标重识别技术被广泛应用于安防布控、刑侦监控等领域并发挥了重要作用。传统的目标重识别技术... 目标重识别(ReID)技术旨在匹配不同区域摄像头在不同时间拍摄到的同一目标,其核心是通过目标间的细粒度差异实现不同目标的有效区分。因此,目标重识别技术被广泛应用于安防布控、刑侦监控等领域并发挥了重要作用。传统的目标重识别技术通常适用于光照条件良好情况下的可见光模态数据,但在处理黑夜低光照条件下的目标重识别任务时,其性能通常受到严重限制。红外摄像机因其卓越的夜视性能,通常被应用于在低光照条件下采集目标红外图像。因此,跨模态目标重识别技术旨在通过可见光图像匹配红外图像,实现全天候不间断的目标重识别。近年来,跨模态目标重识别技术取得了很大进展,然而,对于现有模型的归纳总结及深入分析仍然欠缺。为此,对跨模态目标重识别领域的相关研究和新颖方法进行了深入调研和总结,讨论了现有方法在实际场景中面临的挑战,并从模型分类和模型评价两个方面对现有方法进行归纳与分析。首先,围绕跨模态目标重识别问题的研究难点,将跨模态目标重识别分为生成式方法和非生成式方法两大类;然后,对当前跨模态重识别领域中广泛使用的评测数据集以及相关评价指标进行了综述与总结;最后,讨论了跨模态重识别领域仍然存在的挑战并对未来发展趋势进行了展望。 展开更多
关键词 计算机视觉 目标重识别 跨模态 细粒度特征 表征学习
在线阅读 下载PDF
基于生成式人工智能的图像视频生成方法综述及展望 被引量:1
3
作者 张璐瑶 杨帅 +2 位作者 汪文靖 高翔 刘家瑛 《计算机辅助设计与图形学学报》 北大核心 2025年第3期361-384,共24页
视觉生成在艺术、娱乐等创意领域,以及医学影像和数字出版等关键领域起到越来越重要的作用,生成式人工智能在视觉生成方面的发展有望彻底改变人们与视觉数据的交互方式.文中首先介绍深度学习时代下经典的生成模型框架,根据视觉生成输入... 视觉生成在艺术、娱乐等创意领域,以及医学影像和数字出版等关键领域起到越来越重要的作用,生成式人工智能在视觉生成方面的发展有望彻底改变人们与视觉数据的交互方式.文中首先介绍深度学习时代下经典的生成模型框架,根据视觉生成输入条件的不同,重点梳理了近年来几类重要的图像生成模型和方法,包括无条件图像生成、类别生成图像、文字生成图像和图像转换方法,并介绍了它们在图像编辑方面的应用;然后根据训练数据要求的不同,详细总结近年来以扩散模型为代表的视频生成和编辑模型及相应的优缺点;再介绍目前经典的图像生成和视频生成数据集和常用的评价标准;最后总结现阶段视觉生成面临的数据获取、推理效率、长视频生成、视频可控生成、安全等方面的挑战,展望未来的研究方向. 展开更多
关键词 生成式人工智能 扩散模型 图像生成 视频生成
在线阅读 下载PDF
新时代科学家需要具备怎样的精神--论王选的成功因素 被引量:7
4
作者 丛中笑 《人民论坛》 CSSCI 北大核心 2020年第9期70-73,共4页
当前我国正在大力弘扬新时代科学家精神,通过多种方式和渠道大力表彰、宣传科技界的民族英雄和国家脊梁,进而为建设世界科技强国汇聚磅礴力量。作为新中国培养的科学大师,王选的科学家精神带有典范意义,值得深入挖掘总结。王选的人生经... 当前我国正在大力弘扬新时代科学家精神,通过多种方式和渠道大力表彰、宣传科技界的民族英雄和国家脊梁,进而为建设世界科技强国汇聚磅礴力量。作为新中国培养的科学大师,王选的科学家精神带有典范意义,值得深入挖掘总结。王选的人生经历和科研历程是探寻王选成功的内在关键因素,从中可以总结出独特的"王选精神",而这又可以与新时代科学家精神产生共鸣,对我国杰出科技人才的精神世界塑造意义重大。 展开更多
关键词 新时代科学家精神 王选 成功因素
在线阅读 下载PDF
王选的青年科技人才培养创新模式 被引量:3
5
作者 丛中笑 《学术前沿》 CSSCI 北大核心 2019年第19期92-99,共8页
北京大学王选院士是一位著名科学家,他带领科研团队研制的汉字信息处理与激光照排系统,引发了我国报业和印刷出版业的技术革命。王选也是一位教育家,他以提携后学为己任,在教学科研和产学研结合的实践中,积极探索,甘为人梯,培养了一批... 北京大学王选院士是一位著名科学家,他带领科研团队研制的汉字信息处理与激光照排系统,引发了我国报业和印刷出版业的技术革命。王选也是一位教育家,他以提携后学为己任,在教学科研和产学研结合的实践中,积极探索,甘为人梯,培养了一批优秀青年科技人才,形成了一套独特的人才培养创新模式。本文从识才、育才、用才、惜才等方面,系统研究和总结了王选的师德风范、教育思想和生动实践,对实施创新驱动发展战略和人才强国战略,培养德才兼备的创新型人才具有切实可行的示范作用和重要的现实意义。 展开更多
关键词 王选 创新模式 人才强国战略 汉字激光照排系统
在线阅读 下载PDF
端到端智能视频压缩技术及其在无人机中的应用
6
作者 叶枫 董凡可 贾川民 《数据采集与处理》 北大核心 2025年第2期303-319,共17页
多媒体视觉表示与传输领域正在面临深刻变革,端到端优化的智能视频编解码技术是激发这一变革的驱动力。以无人机(Unmanned aerial vehicle,UAV)视频为代表的新兴视频内容压缩编码技术进一步促进了核心技术发展和应用场景创新。聚焦于端... 多媒体视觉表示与传输领域正在面临深刻变革,端到端优化的智能视频编解码技术是激发这一变革的驱动力。以无人机(Unmanned aerial vehicle,UAV)视频为代表的新兴视频内容压缩编码技术进一步促进了核心技术发展和应用场景创新。聚焦于端到端智能视频编解码技术及其在无人机视频编码的初探,提出了一种基于分层双向参考结构的视频编码方法,解决模型在运动表示效率和预测编码精度方面的不足。有针对性地设计提出了参数共享的运动编解码器、双向缩放运动表示方法以及可信运动建模技术,显著提升无人机视频压缩的率失真压缩性能,优于传统视频编码标准H.266/VVC。为智能视频编码关键技术发展和应用提供了新思路,未来有望在无人机视觉感知等相关领域发挥重要作用。 展开更多
关键词 端到端视频编码 编码标准 分层双向预测 无人机视频
在线阅读 下载PDF
基于HRED模型的中文多轮对话任务方法研究 被引量:7
7
作者 王孟宇 俞鼎耀 +2 位作者 严睿 胡文鹏 赵东岩 《中文信息学报》 CSCD 北大核心 2020年第8期78-85,共8页
多轮对话任务是自然语言处理中最具有实用价值的技术之一,该任务要求系统在产生通顺回答语句的同时能够照顾到上下文信息。近年来,出现了一大批以HRED(hierarchical recurrent encoder-decoder)模型为基础的多轮对话模型,其运用多层级... 多轮对话任务是自然语言处理中最具有实用价值的技术之一,该任务要求系统在产生通顺回答语句的同时能够照顾到上下文信息。近年来,出现了一大批以HRED(hierarchical recurrent encoder-decoder)模型为基础的多轮对话模型,其运用多层级的循环神经网络来编码上下文信息,并在Movie-DiC等英文对话数据集上取得了不错的结果。在2018年京东举办的中文多轮对话大赛中,京东向参赛选手公布了一批高质量的真实客服对话语料。该文在此数据上进行实验,针对HRED模型的缺点以及在中文语料下的表现进行改进,提出基于注意力和跨步融合机制与HRED模型结合的方案,实验结果表明,该方案取得了较大的性能提升。 展开更多
关键词 多轮对话 生成式模型 自然语言处理
在线阅读 下载PDF
摩尔纹图案自动去除技术综述 被引量:3
8
作者 亓文法 刘宇鑫 郭宗明 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期728-747,共20页
如今,数码相机和智能手机在人们的生活中扮演着越来越重要的角色,已经成为人们感知世界、记录信息和沟通交流的主要工具.当使用这些设备拍摄电子屏幕时,显示设备和摄像头传感器网格之间往往会发生混叠,通常导致图片中存在不规则分布的... 如今,数码相机和智能手机在人们的生活中扮演着越来越重要的角色,已经成为人们感知世界、记录信息和沟通交流的主要工具.当使用这些设备拍摄电子屏幕时,显示设备和摄像头传感器网格之间往往会发生混叠,通常导致图片中存在不规则分布的摩尔纹干扰图案,从而严重影响了拍摄图像的视觉质量效果.因此,摩尔纹图案去除方法研究对于拍摄图像的后期处理具有重要意义.为此,详细梳理了摩尔纹去除研究的发展脉络,并根据不同的适用场景和技术实现将现有方法分为2类:基于先验知识的摩尔纹去除方法和基于深度学习的摩尔纹去除方法.鉴于深度学习网络中训练数据集的收集和对齐方式不同,该类方法又分为基于卷积神经网络(CNN)的摩尔纹去除方法和基于生成式对抗网络(GAN)的摩尔纹去除方法.在此基础上,选择相同的公开数据集,对主流的深度学习方法进行算法实现和性能对比分析,并分别总结了各类方法的优缺点.最后,对未来的研究方向进行展望. 展开更多
关键词 摩尔纹图案 图像恢复 多尺度 深度学习 卷积神经网络 生成式对抗网络
在线阅读 下载PDF
基于感知和记忆的视频动态质量评价
9
作者 林丽群 暨书逸 +3 位作者 何嘉晨 赵铁松 陈炜玲 郭宗明 《电子学报》 EI CAS CSCD 北大核心 2024年第11期3727-3740,共14页
由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特... 由于网络环境的多变性,视频播放过程中容易出现卡顿、比特率波动等情况,严重影响了终端用户的体验质量.为优化网络资源分配并提升用户观看体验,准确评估视频质量至关重要.现有的视频质量评价方法主要针对短视频,普遍关注人眼视觉感知特性,较少考虑人类记忆特性对视觉信息的存储和表达能力,以及视觉感知和记忆特性之间的相互作用.而用户观看长视频的时候,其质量评价需要动态评价,除了考虑感知要素外,还要引入记忆要素.为了更好地衡量长视频的质量评价,本文引入深度网络模型,深入探讨了视频感知和记忆特性对用户观看体验的影响,并基于两者特性提出长视频的动态质量评价模型.首先,本文设计主观实验,探究在不同视频播放模式下,视觉感知特性和人类记忆特性对用户体验质量的影响,构建了基于用户感知和记忆的视频质量数据库(Video Quality Database with Perception And Memory,PAM-VQD);其次,基于PAM-VQD数据库,采用深度学习的方法,结合视觉注意力机制,提取视频的深层感知特征,以精准评估感知对用户体验质量的影响;最后,将前端网络输出的感知质量分数、播放状态以及自卡顿间隔作为三个特征输入长短期记忆网络,以建立视觉感知和记忆特性之间的时间依赖关系.实验结果表明,所提出的质量评估模型在不同视频播放模式下均能准确预测用户体验质量,且泛化性能良好. 展开更多
关键词 视觉感知特性 记忆效应 体验质量 深度学习 注意力机制
在线阅读 下载PDF
一种高精度图像套准系统的设计与实现
10
作者 武博文 刘志红 樊浩力 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第2期145-152,共8页
在数字印后工艺生产中,介质传送误差常导致套准困难,通常需要对印刷品进行精确定位。目前,常用的定位方法是在印刷品空白处加入套印标识物,通过检测标识物进行定位。然而,这种方法在图像幅面占据整个印刷品幅面时无法使用。为了解决这... 在数字印后工艺生产中,介质传送误差常导致套准困难,通常需要对印刷品进行精确定位。目前,常用的定位方法是在印刷品空白处加入套印标识物,通过检测标识物进行定位。然而,这种方法在图像幅面占据整个印刷品幅面时无法使用。为了解决这一问题,本研究设计并实现了一套高精度智能图像套准系统,在保证图像采集与印刷的实时性与效率的同时,通过利用预先设计好的模板,在实时采集的图像中寻找匹配程度最高的区域,从而在印刷品中未加入套印标识的情况下,仍可实现印刷套准。印刷生产环境中实验结果表明,本方法的准确性和效率等均可满足实际工业生产的需求,具有较高的泛用性与实际的生产应用价值。 展开更多
关键词 数字印刷 数字印后增效 图像套准 无标记检测技术
在线阅读 下载PDF
技术驱动下数字出版及其专业建设 被引量:4
11
作者 高良才 贾爱霞 《中国出版》 CSSCI 北大核心 2022年第17期16-19,共4页
数字出版脱胎于传统出版,但数字出版的概念又不能仅仅局限于书报刊等传统出版物的出版,它的内涵在于知识和信息(即内容)基于互联网的数字化创作、生产、运营、传播、消费和监管。数字出版作为出版业重要板块及发展方向,其专业建设是建... 数字出版脱胎于传统出版,但数字出版的概念又不能仅仅局限于书报刊等传统出版物的出版,它的内涵在于知识和信息(即内容)基于互联网的数字化创作、生产、运营、传播、消费和监管。数字出版作为出版业重要板块及发展方向,其专业建设是建强出版学科、建设出版强国的内在要求。 展开更多
关键词 数字出版 传统出版物 出版强国 技术驱动 互联网 出版业 知识和信息 出版学科
在线阅读 下载PDF
基于像素聚类的空间变化表面材质建模
12
作者 冯洁 李博 周秉锋 《图学学报》 CSCD 北大核心 2021年第1期94-100,共7页
针对空间变化表面材质的反射属性提出了一种基于图像的轻量化建模方法。仅需利用消费级手机,在环境光和点光源下分别对平面材质样本拍摄一幅图像,即可计算重建其表面的双向反射分布函数(svBRDFs)参数图、法向量图、切向量图等材质属性... 针对空间变化表面材质的反射属性提出了一种基于图像的轻量化建模方法。仅需利用消费级手机,在环境光和点光源下分别对平面材质样本拍摄一幅图像,即可计算重建其表面的双向反射分布函数(svBRDFs)参数图、法向量图、切向量图等材质属性。其中对BRDF参数的拟合采用了一种基于像素聚类的策略,即假定具有相似外观和结构特征的像素属于同种材质、共用一组参数,从而大幅降低参数拟合的难度。在此基础上,通过一种新的迭代多步优化方案对全局和空间变化的参数进行拟合,产生高分辨率的BRDF参数纹理图。该方法不依赖特殊设备,也无需采集海量数据,就能够为包括金属材质、各向异性材质等在内的多种类表面材质产生高质量的BRDF参数图,以及高真实感的基于物理的绘制结果,因此更易于实现和应用。 展开更多
关键词 表面材质建模 空间变化材质 基于图像的绘制 双向反射分布函数 像素聚类
在线阅读 下载PDF
基于融合条目词嵌入和注意力机制的自动ICD编码 被引量:9
13
作者 张虹科 付振新 +3 位作者 任前平 徐辉 赵东岩 严睿 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期1-8,共8页
构建一种基于融合条目词嵌入和注意力机制的深度学习模型,可以充分利用电子病案中的多种非结构化文本数据,对病案首页的主要诊断进行自动ICD编码。该模型首先对含有病案条目的文本进行融合条目的词嵌入,并通过关键词注意力来丰富词级别... 构建一种基于融合条目词嵌入和注意力机制的深度学习模型,可以充分利用电子病案中的多种非结构化文本数据,对病案首页的主要诊断进行自动ICD编码。该模型首先对含有病案条目的文本进行融合条目的词嵌入,并通过关键词注意力来丰富词级别的类别表示;然后利用词语注意力来突出重点词语的作用,增强文本表示;最后通过全连接神经网络分类器进行分类,输出ICD编码。通过在中文电子病案数据集上的消融实验,验证了融合条目词嵌入、关键词注意力和词语注意力的有效性;与多个基准模型相比,所建模型在对81种疾病的分类中取得最好的分类效果,可以有效地提高自动ICD编码的质量。 展开更多
关键词 自动ICD编码 融合条目词嵌入 关键词注意力 词语注意力 病案首页 主要诊断
在线阅读 下载PDF
基于时空建模的动态图卷积神经网络 被引量:9
14
作者 李荆 刘钰 邹磊 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第4期605-613,共9页
为了使图表示学习得到的嵌入向量对节点和边不断变化的动态图具有很好的信息表征能力,提出一种动态图卷积神经网络模型(DyGCN),将动态图上的表示学习建模为时间和空间信息的聚合。该模型将从图卷积神经网络(GCN)的空间卷积提取图上的结... 为了使图表示学习得到的嵌入向量对节点和边不断变化的动态图具有很好的信息表征能力,提出一种动态图卷积神经网络模型(DyGCN),将动态图上的表示学习建模为时间和空间信息的聚合。该模型将从图卷积神经网络(GCN)的空间卷积提取图上的结构信息与从时间卷积神经网络(TCN)的因果卷积提取时序上的历史信息相结合,同时在空间卷积层加入自适应的模型更新机制,使得模型参数随着图结构的变化能够自适应地更新。在金融领域数据集上针对金融欺诈检测进行的边分类实验表明,该模型比现有方法有很大的性能提升。 展开更多
关键词 动态图 图卷积神经网络(GCN) 图表示学习 时空卷积
在线阅读 下载PDF
镜像图灵测试:古诗的机器识别 被引量:4
15
作者 薛扬 梁循 +1 位作者 赵东岩 杜玮 《计算机学报》 EI CAS CSCD 北大核心 2021年第7期1398-1413,共16页
古诗伴随着中华文化的历史进程不断发展,有着数千年的灿烂历史,古诗将丰富的情感、有内涵的灵魂和生动的形式完美结合,表现出了中华民族语言的力量.“自然语言处理是人工智能皇冠上的明珠”,用机器生成语言是机器智慧的核心体现,对机器... 古诗伴随着中华文化的历史进程不断发展,有着数千年的灿烂历史,古诗将丰富的情感、有内涵的灵魂和生动的形式完美结合,表现出了中华民族语言的力量.“自然语言处理是人工智能皇冠上的明珠”,用机器生成语言是机器智慧的核心体现,对机器的语言进行测试是图灵测试的重要内容,用机器生成的中国古代诗词已经可以初步通过图灵测试,在普通人面前得以瞒天过海.本文提出了“镜像图灵测试”框架,其主要设计思想是将图灵测试中的测试者由人更换为计算机,要求测试者在图灵测试的同等条件下对被测试的人和计算机进行识别,若测试计算机不能完成对被测试者的识别,则认为被测试的机器通过了镜像图灵测试.本文以机器生成的古诗和诗人创作的古诗为测试对象,以经过LDA主题模型调节的融合自注意力机制和切片LSTM网络的模型为测试机,设计了镜像图灵测试实验.实验将古诗分为写景、抒情以及爱国诗三类,为每类诗歌构建了8组数据集,共8万句古诗,采用了4种模型对24组数据集进行测试,利用测试机判别诗歌来自诗人还是机器,识别结果可达80%左右,实验结果显示,镜像图灵测试机可以对机器生成的诗歌进行识别,即机器生成的通过了图灵测试的诗歌并没有通过镜像图灵测试,说明了诗歌作为人类语言文明的结晶,是人脑情感最突出的反应,是诗人全身心的投入后的灵魂映射,在一定意义上是图灵可测的,即如果存在图灵可测的不完备性,那么诗歌这个人类语言的精华所在,就是突破这个图灵不完备性的关隘.本文提出的镜像图灵测试框架为后续图灵测试的研究提供了新的思路与方向. 展开更多
关键词 镜像图灵测试 诗歌生成 文本分类 切片神经网络 注意力机制
在线阅读 下载PDF
基于TI-Rank的弹幕关键词提取方法 被引量:3
16
作者 何梓源 张仰森 +1 位作者 吴云芳 亓文法 《计算机工程与设计》 北大核心 2022年第2期580-586,共7页
为提供准确且更贴近日常用语的关键词,针对视频弹幕内容提出一种基于TI-RANK(TTF-ICDF-DWTextRank)的词频词义相结合的关键词提取模型。将标题内容进行分类得到标题的关键信息,将该信息用于词频提取构建TTF算法;进一步考虑词频与篇章数... 为提供准确且更贴近日常用语的关键词,针对视频弹幕内容提出一种基于TI-RANK(TTF-ICDF-DWTextRank)的词频词义相结合的关键词提取模型。将标题内容进行分类得到标题的关键信息,将该信息用于词频提取构建TTF算法;进一步考虑词频与篇章数对提取效果的影响,通过分段函数构建ICDF算法;引入语义维度信息并利用中文拼音作为编辑距离的计算单元构建DWTextRank模型。实验结果表明,TI-RANK模型提取关键词的F1值达到0.8以上,相较传统TF-IDF和TextRank算法提高了约20%。为更合理评价关键词提取的准确率,按照关键词重要程度降序排列定义三级梯度评价标准,该标准能够更好体现出排序靠前关键词的正确性对准确率的影响。 展开更多
关键词 词频-逆文档频率 文本关键词抽取 词频词义关键词提取 三级梯度评价标准 视频弹幕
在线阅读 下载PDF
一种新的矢量中文字库自动压缩方法 被引量:2
17
作者 高宜琛 连宙辉 +1 位作者 唐英敏 肖建国 《图学学报》 CSCD 北大核心 2021年第3期426-431,共6页
针对中文矢量字库体积较大,在嵌入式设备上使用不便的问题,提出了一种新的矢量中文字库自动压缩方法。基于部件拼接和复用的思想,首先使用一种传统图形学方法将字库中的字形拆分成不同部件,之后计算每个字形的部件复用关系,最后使用模... 针对中文矢量字库体积较大,在嵌入式设备上使用不便的问题,提出了一种新的矢量中文字库自动压缩方法。基于部件拼接和复用的思想,首先使用一种传统图形学方法将字库中的字形拆分成不同部件,之后计算每个字形的部件复用关系,最后使用模拟退火算法迭代优化拼接字形,生成压缩字库。实验结果表明,该方法能够在维持原始字库风格和字形不变的条件下,生成体积仅为原始字库20%左右的压缩字库,从而提升了矢量中文字库在存储空间相对受限的嵌入式设备上的可用性。 展开更多
关键词 矢量中文字库压缩 部件提取 部件复用 智能优化 模拟退火
在线阅读 下载PDF
网络传输公平性测量与算法设计:视频应用案例 被引量:2
18
作者 王子逸 胡晓宇 +4 位作者 王歆 张行功 曹振 郑凯 崔勇 《计算机研究与发展》 EI CSCD 北大核心 2023年第4期810-827,共18页
算网融合以计算为中心、网络为根基,通过网络连接异构计算节点,实现算网资源的高效分配与调度.关于竞争流之间资源共享的公平性问题是算网融合的重要研究方向.作为算网融合的典型场景,视频应用正变得越来越重要,但人们对于它们是否以及... 算网融合以计算为中心、网络为根基,通过网络连接异构计算节点,实现算网资源的高效分配与调度.关于竞争流之间资源共享的公平性问题是算网融合的重要研究方向.作为算网融合的典型场景,视频应用正变得越来越重要,但人们对于它们是否以及在多大程度上遵守公平性原则知之甚少.在高度多样化的网络环境和缺乏自动化测量工具的情况下,公平性测量研究面临着巨大的挑战.通过测量典型视频应用Zoom的竞争行为来研究这个问题发现,资源竞争行为是复杂多变的,Zoom在不同的场景下有着不同的资源抢占行为.为了深入理解这些竞争行为,开发了自动化工具并进行测量以了解其用户体验(QoE)指标,包括端到端视频/音频时延、视频帧率和视频质量等.Zoom使用抢占带宽的策略来保证自身应用的用户体验.为了追求更好的用户体验,Zoom往往会自私地发送过多的冗余数据包来应对异常的网络情况,其中一些是不必要的.为此,设计一种能够在用户体验和公平性目标之间取得平衡的传输算法是非常重要的.提出了算法QLibra,并通过实验证明它可以有效保障上层应用的用户体验并且对竞争流无害. 展开更多
关键词 算网融合 公平性测量 算法设计 网络传输 视频应用
在线阅读 下载PDF
CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法 被引量:5
19
作者 谢海华 李奥林 +4 位作者 李亚博 陈志优 程静 吕肖庆 汤帜 《中文信息学报》 CSCD 北大核心 2021年第5期38-45,共8页
由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错... 由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错性能。CPLM-CSC采用基于单字级别预训练语言模型来进行错别字检测,并采用掩字语言模型来进行错别字纠正。为了提高纠正性能,CPLM-CSC采用音近、形近字判断等多种筛选纠正结果的方法,并针对一些典型且特殊的错误,例如"的地得"误用,采取了专门的数据增强方法。CPLM-CSC在SIGHAN 2015的评测数据集上进行了测试,取得了0.654的F1值,其性能优于其他模型。 展开更多
关键词 中文错别字纠正 预训练语言模型 单字级别模型
在线阅读 下载PDF
结合统计特征和图模型的半监督式中文关键短语抽取方法 被引量:3
20
作者 谢海华 陈雪飞 +2 位作者 都仪敏 吕肖庆 汤帜 《中文信息学报》 CSCD 北大核心 2022年第4期57-65,共9页
关键短语抽取,即从文档中抽取能够表达文档主题和内容的关键短语集合,对于信息检索和文档分类等文本处理任务具有重要意义。然而,现有文献缺乏针对中文特点的关键短语抽取算法的研究。为此,该文提出了一种半监督式中文关键短语抽取模型... 关键短语抽取,即从文档中抽取能够表达文档主题和内容的关键短语集合,对于信息检索和文档分类等文本处理任务具有重要意义。然而,现有文献缺乏针对中文特点的关键短语抽取算法的研究。为此,该文提出了一种半监督式中文关键短语抽取模型,该模型采用预训练语言模型来表征短语及文章,以减少算法对大量标注训练数据的依赖;进而提出图模型描述候选短语间的相似性空间并迭代计算各短语的重要度;同时结合了多项统计特征来进一步提高短语评估的准确率。对比实验表明,该文提出的方法在中文关键短语抽取方面比基线方法具有明显的提升效果。 展开更多
关键词 中文关键短语抽取 半监督式方法 图模型 统计特征
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部