期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于多尺度融合的道岔点云分割方法
1
作者 宋奕霄 赵鑫欣 +2 位作者 王胜春 严至成 李清勇 《北京交通大学学报》 北大核心 2025年第3期23-32,共10页
针对当前道岔区轨道状态检查方法存在的人工依赖程度高、检测效率低下以及二维视觉检测具有缺失深度信息的局限性等问题,提出基于多尺度融合策略的道岔点云分割方法(Point-Bidirectional Encoder Representations from Transformers-Tur... 针对当前道岔区轨道状态检查方法存在的人工依赖程度高、检测效率低下以及二维视觉检测具有缺失深度信息的局限性等问题,提出基于多尺度融合策略的道岔点云分割方法(Point-Bidirectional Encoder Representations from Transformers-Turnout,Point-BERT-T).首先,在道岔局部点云编码过程中采用不同大小的球半径进行分组,并融合不同半径球体空间内点的特征,形成具有空间层次性的混合特征表达,融合后的特征包含道岔的不同尺度信息,能够优化对铁路基础设施的高效识别和分割,提升铁路道岔的三维点云数据识别能力和下游病害及形变检测能力;其次,在数据预处理阶段采用随机旋转平移和非均匀切分策略,有效模拟实际扫描采集过程中存在的随机性数据,增强模型在不同数据采集条件下的鲁棒性;最后,为验证本文方法的有效性,将改进方法与已有方法进行对比实验.研究结果表明:较现有方法Point-BERT,提出的Point-BERT-T方法在道岔点云分割性能上提高了1.9%,在分割难度较高的心轨和翼轨上的分割交并比(Intersection over Union,IoU)分别提升了4.7%和5.6%,在三维铁路道岔点云数据的语义分割任务中,有效实现了准确且鲁棒的分割. 展开更多
关键词 铁路巡检 道岔 深度学习 点云分割
在线阅读 下载PDF
面向中文场景文本编辑的不确定性感知生成网络
2
作者 高宇童 张颖 +4 位作者 刘湘赣 刘怡典 姜山 郭子毅 宋非凡 《北京师范大学学报(自然科学版)》 北大核心 2025年第3期285-292,共8页
通过研究,提出了一种基于不确定性建模的中文场景文本编辑(Chinese scene text editing,CSTE)方法,并发现了1种有效的技术解决方案.该方法通过不确定性引导的调整机制优化预测噪声,提升噪声估计准确性,从而增强生成文本的清晰度和结构... 通过研究,提出了一种基于不确定性建模的中文场景文本编辑(Chinese scene text editing,CSTE)方法,并发现了1种有效的技术解决方案.该方法通过不确定性引导的调整机制优化预测噪声,提升噪声估计准确性,从而增强生成文本的清晰度和结构完整性.同时,通过过滤文本和图像特征中的无关信息,提高了跨模态对齐能力,实现了文本与背景纹理的融合. 展开更多
关键词 中文场景文本编辑 不确定性感知机制 跨模态对齐 冗余消除 噪声矫正
在线阅读 下载PDF
面向动态交通场景理解的多模态鲁棒学习综述
3
作者 李浥东 臧钊 +3 位作者 章子凯 张旭 荣啸 李子毅 《北京交通大学学报》 2025年第5期52-65,共14页
动态交通场景因目标动态交互、环境剧烈变化及多传感器异构数据等复杂要素,对智能系统的感知鲁棒性与决策可靠性提出极高要求.多模态学习通过融合视觉、射频、声学等异构数据可实现信息互补,成为突破动态场景理解瓶颈的核心技术.本文针... 动态交通场景因目标动态交互、环境剧烈变化及多传感器异构数据等复杂要素,对智能系统的感知鲁棒性与决策可靠性提出极高要求.多模态学习通过融合视觉、射频、声学等异构数据可实现信息互补,成为突破动态场景理解瓶颈的核心技术.本文针对面向动态交通场景的多模态鲁棒学习技术进行系统研究.首先,界定多模态动态交通场景的定义与内涵,分析光学、射频、声学等多源数据的类型及动态性特征;其次,阐述多模态学习基础,重点剖析数据层面、模型架构及训练策略的鲁棒增强关键技术;最后,深入探讨当前多模态学习面临的核心挑战及未来研究方向.研究结果表明:目前动态交通场景的多模态鲁棒学习仍存在数据缺陷、模型局限及评估基准缺失等关键问题有待解决,并且未来可能沿着技术创新、技术融合与产业协同等方面进行发展.本文旨在为动态交通场景下多模态鲁棒学习的理论研究与工程实践提供系统性参考,推动智能交通系统从“有限场景可用”向“全工况可靠”演进,为智能交通技术大规模实践应用提供关键技术支撑. 展开更多
关键词 交通信息工程 动态交通场景 多模态数据 多模态学习 鲁棒学习
在线阅读 下载PDF
基于关系感知和标签消歧的细粒度面部表情识别算法 被引量:1
4
作者 刘雅芝 许喆铭 +2 位作者 郎丛妍 王涛 李浥东 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3336-3346,共11页
细粒度表情识别任务因其包含更丰富真实的人类情感而备受关注.现有面部表情识别算法通过提取局部关键区域等方式学习更优的图像表征.然而,这些方法忽略了图像数据集内在的结构关系,且没有充分利用标签间的语义关联度以及图像和标签间的... 细粒度表情识别任务因其包含更丰富真实的人类情感而备受关注.现有面部表情识别算法通过提取局部关键区域等方式学习更优的图像表征.然而,这些方法忽略了图像数据集内在的结构关系,且没有充分利用标签间的语义关联度以及图像和标签间的相关性,导致所学特征带来的性能提升有限.其次,现有细粒度表情识别方法并未有效利用和挖掘粗细粒度的层级关系,因而限制了模型的识别性能.此外,现有细粒度表情识别算法忽略了由于标注主观性和情感复杂性导致的标签歧义性问题,极大影响了模型的识别性能.针对上述问题,本文提出一种基于关系感知和标签消歧的细粒度面部表情识别算法(fine-grained facial expression recognition algorithm based on Relationship-Awareness and Label Disambiguation,RALD).该算法通过构建层级感知的图像特征增强网络,充分挖掘图像之间、层级标签之间以及图像和标签之间的依赖关系,以获得更具辨别性的图像特征.针对标签歧义性问题,算法设计了基于近邻样本的标签分布学习模块,通过整合邻域信息进行标签消歧,进一步提升模型识别性能.在细粒度表情识别数据集FG-Emotions上算法的准确度达到97.34%,在粗粒度表情识别数据集RAF-DB上比现有主流表情分类方法提高了0.80%~4.55%. 展开更多
关键词 细粒度面部表情识别 注意力机制 关系感知 特征优化 标签分布学习
在线阅读 下载PDF
高速铁路钢轨廓形动态测量方法研究 被引量:2
5
作者 赵鑫欣 李海浪 +3 位作者 王胜春 王昊 王宁 李清勇 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第6期91-100,共10页
对钢轨廓形的快速准确测量是实现高速铁路线路自动化分析的首要前提。在实际应用中,环境异物飞溅和强反射光等噪声会严重污染钢轨图像,导致钢轨追踪失败和测量精度下降。为此,提出一种钢轨图像激光条纹分割与廓形提取相结合的方法。首先... 对钢轨廓形的快速准确测量是实现高速铁路线路自动化分析的首要前提。在实际应用中,环境异物飞溅和强反射光等噪声会严重污染钢轨图像,导致钢轨追踪失败和测量精度下降。为此,提出一种钢轨图像激光条纹分割与廓形提取相结合的方法。首先,基于连续采集图像的时空上下文信息,定位钢轨感兴趣区域;然后,利用数据密度比缩放的聚类方法,过滤钢轨感兴趣区域中图像噪声并分割钢轨光带;最后,沿光带截面的法线方向实现钢轨廓形提取及测量。选取典型高铁线路试验数据,将该方法与基于密度聚类和共享近邻密度聚类方法的聚类评价指标F1进行对比,并将它连同灰度重心法和Steger方法的钢轨廓形提取结果与MiniProf钢轨廓形测量仪的实际测量结果进行精度对比分析。结果表明:相比传统聚类和廓形提取方法,该方法平均F_(1)值为0.98,廓形测量误差均值为0.08 mm,可使不同形状和大小的钢轨数据聚为同一类,且钢轨廓形动态测量精度满足《高速铁路钢轨打磨管理办法》中0.15 mm的要求,有效克服复杂高铁环境噪声,单幅图像处理时间仅为2.2 ms,适用于最高检测速度350 km·h^(-1)下线路自动化分析的时效性和准确性。 展开更多
关键词 高速铁路 钢轨廓形 动态测量 密度比缩放 激光条纹中心
在线阅读 下载PDF
基于可解释嵌入学习的推荐系统
6
作者 李雅静 卢香葵 +1 位作者 刘林 邬俊 《南京大学学报(自然科学版)》 2025年第4期660-671,共12页
隐因子模型旨在从历史行为数据中学习用户和商品的“隐式”嵌入,是构建现代推荐系统的核心技术.然而,“隐式”嵌入缺乏可解释性,极大地限制了推荐系统的可信度.鉴于此,提出一种基于提示集成的嵌入可解释评论感知评分回归方法(Prompt Ens... 隐因子模型旨在从历史行为数据中学习用户和商品的“隐式”嵌入,是构建现代推荐系统的核心技术.然而,“隐式”嵌入缺乏可解释性,极大地限制了推荐系统的可信度.鉴于此,提出一种基于提示集成的嵌入可解释评论感知评分回归方法(Prompt Ensemble-based Explainable Embedding for Review-aware Rating Regression,PE3R3).该方法联合利用文本评论和数值评分数据,旨在学习具有明确语义的“显式”嵌入,从而增强推荐结果的可解释性.首先,PE3R3借助预训练语言模型及多样化提示模板,从评论文本中提炼出具有显式语义的元码本;然后,以数值评分为监督信号,通过残差量化机制将用户和商品表征为多个元码的线性组合,从而获得富有语义的“显式”嵌入,使推荐结果具备可解释性. PE3R3具有“即插即用”的特点,可以与现有评分回归模型无缝集成.实验结果表明,结合PE3R3模型的预测精度实现了5%的平均性能提升和16%的最大性能提升;在可解释性方面,定量分析和定性分析均表明,PE3R3的引入显著提升了推荐结果的可解释性. 展开更多
关键词 可解释推荐 隐因子模型 提示学习 评论感知评分回归 向量量化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部