期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于相机类对比学习的完全无监督行人重识别
1
作者 田青 周子枭 《数据采集与处理》 北大核心 2025年第1期207-216,共10页
最近的无监督行人重识别研究使用聚类和记忆字典中的伪标签来训练模型。但是,这些研究忽略了行人重识别的数据集是通过不同相机采集的,即相机之间的分布差异较大,较大的相机方差会导致模型精度降低。因此,提出了相机类对比学习,包括类... 最近的无监督行人重识别研究使用聚类和记忆字典中的伪标签来训练模型。但是,这些研究忽略了行人重识别的数据集是通过不同相机采集的,即相机之间的分布差异较大,较大的相机方差会导致模型精度降低。因此,提出了相机类对比学习,包括类对比损失和相机对比损失,其中类对比损失可以实现对内存字典的一致性更新,并减少噪声标签对模型的影响;而相机对比损失通过为每个相机中的每个类构建相机类中心,拉近同属一个类的相机类中心距离,并使不同类的相机类中心距离相距更远,从而减少相机方差。通过相机类对比学习,减少了相机方差和噪声标签对模型的影响,从而提高了行人重识别的性能。在4个公开数据集上,相机类对比学习都表现出优异的结果,有效地缓解了相机方差对模型的影响。 展开更多
关键词 行人重识别 类对比损失 相机对比损失 内存字典 相机方差
在线阅读 下载PDF
基于统计方法的中文姓名识别 被引量:48
2
作者 刘秉伟 黄萱菁 +1 位作者 郭以昆 吴立德 《中文信息学报》 CSCD 北大核心 2000年第3期16-24,36,共10页
本文介绍一个中文姓名的自动识别系统 ,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据 ,以提高系统识别性能。我们从 1 994年人民日报中随机抽取 1 0 0篇文章作为测试样本 ,实验结果表明 ,准确率和召回率可同时达到 90 ... 本文介绍一个中文姓名的自动识别系统 ,该系统使用从姓名样本库和真实文本语料库中得到的大量统计数据 ,以提高系统识别性能。我们从 1 994年人民日报中随机抽取 1 0 0篇文章作为测试样本 ,实验结果表明 ,准确率和召回率可同时达到 90 %以上。 展开更多
关键词 自动分词 未登录词 中文姓名识别 统计方法
在线阅读 下载PDF
基于词频统计的个性化信息过滤技术 被引量:12
3
作者 张国印 陈先 皮鹏 《哈尔滨工程大学学报》 EI CAS CSCD 2003年第1期63-67,共5页
对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典... 对Internet信息进行过滤,筛选出与用户兴趣最相符的文档,是智能搜索引擎要解决的一个重要问题.本文在介绍搜索引擎基本原理的基础上,提出了一种文档学习和用户个性词典构建的实现方法,其中包括内码转换、分词、摘词处理、用户个性词典的构建及词条权值调整等环节.然后提出了一种基于词频统计的个性化文档过滤算法,该算法对传统的向量空间模型法做了改进,使之能够更好地计算文档与用户个性词典之间的相关度,根据用户的兴趣爱好对文档进行相关度的过滤、排序,并给出了实验数据.实验结果表明该方法较好地解决了智能搜索引擎中Internet信息过滤、排序的问题. 展开更多
关键词 搜索引擎 文档过滤 向量空间模型法 词频统计 个性词典
在线阅读 下载PDF
面向跨视图行人重识别的多级判别性字典学习算法 被引量:5
4
作者 汤红忠 陈天宇 +1 位作者 邓仕俊 张小刚 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2020年第9期1430-1441,共12页
现有的行人重识别算法主要聚焦于如何提取更有效的分类特征和如何学习更鲁棒的距离度量函数.在现实场景中,不同视图下的同一行人图像的分辨率往往不一致,且同一视图下受视角和光照变化等因素的影响存在提取的分类特征判别性弱且鲁棒性... 现有的行人重识别算法主要聚焦于如何提取更有效的分类特征和如何学习更鲁棒的距离度量函数.在现实场景中,不同视图下的同一行人图像的分辨率往往不一致,且同一视图下受视角和光照变化等因素的影响存在提取的分类特征判别性弱且鲁棒性不强的问题.针对这一问题,利用不同视图的特征表示中编码系数的潜在关联,提出了一种多级判别性字典学习算法,并将其应用于跨视图行人重识别.首先,在图像水平区域和图像级别的字典学习算法中分别引入了一个特征映射矩阵,该矩阵可以描述不同视图下同一行人图像编码系数之间的内在关系,可以极大地提高编码系数的灵活性.其次,在图像块级别,结合图像的局部流形结构,在字典学习目标函数中增加了字典原子的局部几何结构约束,通过自适应学习图拉普拉斯矩阵,确保编码系数保持了与样本相似的几何结构,可以获得更具判别性的字典对.最后,文中算法在2个被广泛使用的行人重识别数据集VIPeR和CHUK01 Campus上进行验证,2个数据集在rank-1上的识别率分别为68.40%和80.14%,实验结果表明,文中算法不仅可以降低不同视图下分辨率差异明显的影响,而且大大提高了学习字典对的表示能力和鉴别能力,与其他算法相比获得了更好的行人重识别精度. 展开更多
关键词 行人重识别 多级判别性字典学习 局部几何结构 映射矩阵
在线阅读 下载PDF
融合词典特征的Bi-LSTM-WCRF中文人名识别 被引量:7
5
作者 成于思 施云涛 《中文信息学报》 CSCD 北大核心 2020年第4期69-76,共8页
受限于标注语料的领域和规模以及类别不均衡,中文人名识别性能偏低。相比人名识别训练语料,人名词典获取较为容易,利用词典提升人名识别性能有待进一步研究。该文提取人名词典特征,融入到双向长短期记忆(Bi-LSTM)网络模型中,在损失函数... 受限于标注语料的领域和规模以及类别不均衡,中文人名识别性能偏低。相比人名识别训练语料,人名词典获取较为容易,利用词典提升人名识别性能有待进一步研究。该文提取人名词典特征,融入到双向长短期记忆(Bi-LSTM)网络模型中,在损失函数中提高人名标签权重,设计加权条件随机场(WCRF)。从人名词典中获取姓和名相关的特征信息,Bi-LSTM网络捕获句子中上下文信息,WCRF提高人名识别的召回率。在《人民日报》语料和工程法律领域语料上进行实验,结果表明:在领域测试语料上,与基于隐马尔可夫模型的方法相比,人名识别的F1值提高18.34%,与传统Bi-LSTM-CRF模型相比,召回率提高15.53%,F1提高8.83%。WCRF还可以应用到其他类别不均衡的序列标注或分类问题中。 展开更多
关键词 人名识别 双向长短期记忆网络 加权条件随机场 词典特征
在线阅读 下载PDF
基于熵模型的英汉人名对齐 被引量:1
6
作者 刘颖 曹项 《中文信息学报》 CSCD 北大核心 2016年第3期52-59,共8页
该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名... 该文使用熵模型来对中英文双语语料进行人名对齐。熵模型综合利用双语人名词典、双语姓氏词典、词汇对齐概率、中英文人名的共现特征、基于最小编辑距离的音译相似度和基于语音匹配的音译相似度。实验结果表明,基于熵模型的中英文人名对齐在大规模语料库的实验中达到了较好的人名对齐正确率和召回率。我们分析了人名对齐存在的主要错误,并针对主要错误给出了可能的解决方案。 展开更多
关键词 人名对齐 熵模型 音译相似度 最小编辑距离 词典
在线阅读 下载PDF
基于用户评论的农业新技术推荐模型设计与应用展望
7
作者 刘伟 刘世洪 +1 位作者 王翠 宋林鹏 《农业展望》 2023年第8期100-105,共6页
近年来,推荐系统的应用取得了飞速进步。大数据、人工智能技术的出现为农业信息化的加速发展提供了广阔的空间和前景。为提升农业领域内推荐技术的应用,满足农业用户的信息获取需求,对传统协同过滤推荐算法进行了一定的改进,重点体现在... 近年来,推荐系统的应用取得了飞速进步。大数据、人工智能技术的出现为农业信息化的加速发展提供了广阔的空间和前景。为提升农业领域内推荐技术的应用,满足农业用户的信息获取需求,对传统协同过滤推荐算法进行了一定的改进,重点体现在融合了K-means算法以及BIRCH算法进行聚类分析,通过搭建HowNet极性词典解决传统协同过滤方法过度依赖用户具体评分的问题,并提出了一种个性化推荐模型,利用相关数据源,进行模型验证。实验结果表明,该模型运行稳定,可以达到精准推荐农业技术信息的目的。 展开更多
关键词 协同过滤算法 聚类分析 HowNet极性词典 个性化推荐模型
在线阅读 下载PDF
英汉机器翻译系统的建造—用于英语词典翻译出版的专用系统 被引量:7
8
作者 郑保山 刘群 张祥 《中文信息学报》 CSCD 北大核心 1999年第5期51-56,共6页
本文从人工翻译和机器翻译的经验出发,引入数据仓库和数据挖掘技术建造语料库,提出一个采用模板技术的译语精确生成和机助人译结合的动态机器翻译系统,专门用于英语词典的翻译出版,促使机器翻译走向实用化,初步研究取得了较好效果。
关键词 机器翻译 数据仓库 数据挖掘 译文模板 机助人译 英语词典
在线阅读 下载PDF
基于特征权重与情感偏好的可解释推荐 被引量:3
9
作者 戴兴 刘永坚 +1 位作者 解庆 刘平峰 《计算机工程与设计》 北大核心 2022年第8期2130-2136,共7页
针对协同过滤算法在为用户商品相关性建模时未考虑用户/商品对特征属性的不同关注度及不可解释性问题,提出基于特征权重与情感偏好的可解释推荐算法。利用评论中抽取的特征及对应情感设计用户商品的表征,根据TF-IDF算法确定其重要性,将... 针对协同过滤算法在为用户商品相关性建模时未考虑用户/商品对特征属性的不同关注度及不可解释性问题,提出基于特征权重与情感偏好的可解释推荐算法。利用评论中抽取的特征及对应情感设计用户商品的表征,根据TF-IDF算法确定其重要性,将其加入相关性建模中;在评分预测时引入贝叶斯个性化排序减小评分误差;在生成推荐的同时,提供特征短语级别的解释。实验结果表明,对比现有模型,该模型均方根误差平均降低了3.62%,最大降低了4.93%。 展开更多
关键词 可解释推荐 情感词典 特征权重 贝叶斯个性化排序 矩阵分解
在线阅读 下载PDF
基于跨视角判别词典嵌入的行人再识别 被引量:6
10
作者 陆萍 董虎胜 +1 位作者 钟珊 龚声蓉 《计算机研究与发展》 EI CSCD 北大核心 2019年第11期2424-2437,共14页
行人再识别是指在具有不重叠视域的摄像机监控网络中根据行人外观进行身份关联的任务.由于在视频监控系统中具有广泛的应用前景,受到了计算机视觉与机器学习领域的广泛关注.当前的行人再识别研究主要关注从行人图像中提取判别性的特征... 行人再识别是指在具有不重叠视域的摄像机监控网络中根据行人外观进行身份关联的任务.由于在视频监控系统中具有广泛的应用前景,受到了计算机视觉与机器学习领域的广泛关注.当前的行人再识别研究主要关注从行人图像中提取判别性的特征描述子或学习距离度量.然而不同摄像机视角下行人的外观常常存在很大差异,同一摄像机下还会有行人外观相近的情况,这使得特征描述子或距离度量的表达能力受到了很大的影响.为了增强它们的表达能力并提升行人再识别的准确率,提出了一种基于跨视角判别性词典嵌入的行人再识别算法.在该算法中不仅学习了跨视角的词典还同时联合学习了一个距离度量矩阵,从而将两者的优势结合起来.该算法模型有效地挖掘了不同视角下词典表达的内在联系与距离约束,从而能够使用学习到的表达能力更强的特征在嵌入子空间中进行行人再识别.为了避免不均衡训练样本带来的度量矩阵偏差问题,在度量矩阵的学习中还引入了自适应的权重分配策略.在模型优化上,采用了高效的交替优化方法来求解词典与距离度量等模型参数.在VIPeR,GRID,3DPeS等数据集上的实验结果表明本文算法取得了非常优秀的行人再识别性能. 展开更多
关键词 行人再识别 特征表达 词典学习 距离度量 权重分配
在线阅读 下载PDF
工具书款目索引自动排序程序设计——以GB18030-2005语境下人名索引为例
11
作者 朱玉强 范翠丽 何珂 《图书馆论坛》 CSSCI 北大核心 2021年第3期122-127,共6页
以人名为标目的款目索引为例,在GB18030-2005语境下设计程序自动排序款目索引并生成工具书辞条目录。研究结果表明,所编制程序方法得当,功能确切,易于扩展以应对更复杂的排序逻辑,有效节省工具书编撰人员、出版社编辑等相关从业人员工... 以人名为标目的款目索引为例,在GB18030-2005语境下设计程序自动排序款目索引并生成工具书辞条目录。研究结果表明,所编制程序方法得当,功能确切,易于扩展以应对更复杂的排序逻辑,有效节省工具书编撰人员、出版社编辑等相关从业人员工作负荷。 展开更多
关键词 工具书 款目索引 辞书条目 人名索引 文本排序
在线阅读 下载PDF
局部联合结构化稀疏表示的单样本人脸识别 被引量:6
12
作者 王念兵 吴秦 +1 位作者 许洁 张淮 《计算机工程与应用》 CSCD 北大核心 2018年第1期204-209,228,共7页
针对单样本问题,基于相同类别的人脸变化信息应有相似的稀疏编码这一事实,提出结构化稀疏变化字典学习方法,以得到较好的共享类内变化字典。同时鉴于同一人脸的所有区域应有相同的类标签,通过训练样本与变化字典按坐标分块联合表示查询... 针对单样本问题,基于相同类别的人脸变化信息应有相似的稀疏编码这一事实,提出结构化稀疏变化字典学习方法,以得到较好的共享类内变化字典。同时鉴于同一人脸的所有区域应有相同的类标签,通过训练样本与变化字典按坐标分块联合表示查询人脸区域,然后给稀疏系数引入导致结构化稀疏效果的约束条件,实现对应类别字典的自动选择,从而更好地表示查询人脸。提出的人脸表示方法可以在局部识别方法的优势上整合全局信息,使得在AR、Extended Yale B、CMU-PIE人脸库上的表现超过其他单样本识别相关的方法,取得了较好的识别效果。 展开更多
关键词 单样本 结构化稀疏 类内变化字典 联合表示
在线阅读 下载PDF
域通用和域分离字典对学习的行人重识别算法
13
作者 颜悦 严双林 颜昌沁 《计算机工程与应用》 CSCD 北大核心 2022年第15期141-152,共12页
为克服不同相机视角之间的域偏移问题,提出一种基于域通用和域分离字典对学习的跨视角行人重识别算法。具体地,基于来自同一相机视角下的行人共享相同的域,并且同一视角中每个行人图像所携带的域信息在短时间内具有一致性,将同一视角下... 为克服不同相机视角之间的域偏移问题,提出一种基于域通用和域分离字典对学习的跨视角行人重识别算法。具体地,基于来自同一相机视角下的行人共享相同的域,并且同一视角中每个行人图像所携带的域信息在短时间内具有一致性,将同一视角下的行人图像分解为特定视角的域信息分量和域分离的行人外观特征分量,提出一个判别字典学习模型以创建用于描述域信息分量的域通用字典和描述行人外观分量的域分离字典。由于来自同一相机视角下的图像具有域相似性,因此通过低秩正则化来细化用于表示域信息的字典。为了进一步提高学习字典的判别能力,在算法中约束相同视角、相同身份的多幅图像的编码系数具有很强的相似性。此外,采用一种新颖的扩展正则化方法来解决不同行人相似外貌特征和同一行人不同外貌特征的视觉外观歧义问题。在四个具有挑战性的数据集上进行实验,结果表明域通用和域分离字典对学习的算法相对于一些现有最新算法更具有效性和优越性。 展开更多
关键词 行人重识别 域通用字典 扩展正则化 域信息
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部