期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于相关视觉关键词的图像自动标注方法研究 被引量:3
1
作者 柯逍 李绍滋 曹冬林 《计算机研究与发展》 EI CSCD 北大核心 2012年第4期846-855,共10页
图像自动标注是计算机视觉与模式识别等领域中的重要问题.针对现有模型未对文本关键词的视觉描述形式进行建模,导致标注结果中大量出现与图像视觉内容无关的标注词等问题,提出了基于相关视觉关键词的图像自动标注模型VKRAM.该模型将标... 图像自动标注是计算机视觉与模式识别等领域中的重要问题.针对现有模型未对文本关键词的视觉描述形式进行建模,导致标注结果中大量出现与图像视觉内容无关的标注词等问题,提出了基于相关视觉关键词的图像自动标注模型VKRAM.该模型将标注词分为非抽象标注词与抽象标注词.首先建立非抽象标注词的视觉关键词种子,并提出了一个新方法抽取非抽象标注词对应的视觉关键词集合;接着根据抽象关键词的特点,运用提出的基于减区域的算法抽取抽象关键词对应的视觉关键词种子与视觉关键词集合;然后提出一个自适应参数方法与快速求解算法用于确定不同视觉关键词的相似度阈值;最后将上述方法相结合并用于图像自动标注中.该模型能从一定程度上解决标注结果中出现的大量无关标注词问题.实验结果表明,该模型在大多数指标上相比以往模型均有所提高. 展开更多
关键词 图像自动标注 视觉关键 自适应阈值 相关模型 抽象标注词 非抽象标注词
在线阅读 下载PDF
基于最大熵模型的词位标注汉语分词 被引量:8
2
作者 于江德 王希杰 樊孝忠 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期70-74,共5页
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要... 近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好. 展开更多
关键词 汉语分 标注 最大熵模型 标注 特征模板
在线阅读 下载PDF
词位标注汉语分词中特征模板定量研究 被引量:4
3
作者 于江德 王希杰 樊孝忠 《计算机工程与设计》 CSCD 北大核心 2012年第3期1239-1244,共6页
基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU... 基于字的词位标注的方法能极大地提高汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,词位标注汉语分词中特征模板的设定至关重要,为了更加准确地设定特征模板,从多个角度进行了定量分析,并在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,得到如下结论:同等条件下,训练出的模型大小与扩展出的特征数成正比;不同的单字特征模板在同一语料中扩展出的特征数基本相同,单字特征模板对分词性能的贡献要比双字特征模板小得多;增加B特征模板之后,训练时间大大增加,模型大小基本不变,对分词性能都是正增长。 展开更多
关键词 汉语分 标注 特征模板 定量分析 条件随机场
在线阅读 下载PDF
基于联合媒体相关模型的图像自动标注改进算法 被引量:1
4
作者 贾克斌 安震 《北京工业大学学报》 CAS CSCD 北大核心 2014年第4期514-520,共7页
为了充分利用标注词间的相关性,提高图像标注精度,解决图像检索中的语义鸿沟问题,提出了一种基于联合媒体相关模型的图像自动标注改进算法.该算法将标注词和图像的联合概率求解过程转换成在标注词条件下图像出现的概率和标注词的先验概... 为了充分利用标注词间的相关性,提高图像标注精度,解决图像检索中的语义鸿沟问题,提出了一种基于联合媒体相关模型的图像自动标注改进算法.该算法将标注词和图像的联合概率求解过程转换成在标注词条件下图像出现的概率和标注词的先验概率的求解过程,减少了高频候选标注词对概率统计模型的影响,同时引入语义相似语言模型,利用上下文关联词矢量表示每个标注词,通过估计1幅图像的1组相关性最大的标注词来实现对图像的标注.与基于联合媒体相关图像自动标注算法相比,在标注过程中,本算法不再假设模型中各标注词之间是相互独立的,充分考虑标注词上下文的相关性信息,提高了图像标注精度;对标准的Corel图像集实验结果表明,基于联合媒体相关模型的图像自动标注改进算法是有效的. 展开更多
关键词 联合媒体相关模型 语言模型 标注词上下文信息
在线阅读 下载PDF
基于异构描述子的新型高斯混合模型图像自动标注方法 被引量:2
5
作者 陈利琴 金聪 《电子测量技术》 2015年第11期60-65,共6页
过去几十年以来,各种图像标注算法相继提出。这些方法要么需要很大的计算量,要么标注效果不理想。论文提出了一种基于异构描述子的新型高斯混合模型图像语义自动标注方法。本文的高斯混合模型是采用异构空间来构建的,不同于其他的高斯... 过去几十年以来,各种图像标注算法相继提出。这些方法要么需要很大的计算量,要么标注效果不理想。论文提出了一种基于异构描述子的新型高斯混合模型图像语义自动标注方法。本文的高斯混合模型是采用异构空间来构建的,不同于其他的高斯混合模型。对于每个标注词,在多个特征空间下分别用高斯模型来描述,形成对应子空间的"标注词分描述子"。由于各个分描述子描述不同标注词的能力有很大差别,因此通过机器学习的方法来融合这些分描述子,形成更加有效的"标注词描述子",从而提高标注的准确率。论文提出的"标注词描述子"可以有效地建立图像高层语义概念与底层视觉特征之间的对应关系,准确地描述标注词的语义内容,从而提高图像的标注性能。通过在COREL数据集上的测试表明了方法的有效性。 展开更多
关键词 异构描述子 高斯模型 标注词描述子 图像语义标注
在线阅读 下载PDF
基于链式条件随机场的中文分词改进方法 被引量:10
6
作者 徐浩煜 任智慧 +1 位作者 施俊 周晗 《计算机应用与软件》 CSCD 2016年第12期211-213,233,共4页
基于链式条件随机场模型的序列标注中文分词方法随着中文分词评测Bakeoff的展开得到广泛应用。词位标注集和特征模板集对该模型的学习至关重要,但当前的研究大多采用单一的标注集和特征模板集进行实验,缺乏标注集和特征模板集结合的尝试... 基于链式条件随机场模型的序列标注中文分词方法随着中文分词评测Bakeoff的展开得到广泛应用。词位标注集和特征模板集对该模型的学习至关重要,但当前的研究大多采用单一的标注集和特征模板集进行实验,缺乏标注集和特征模板集结合的尝试,使得中文分词中未登录词识别率不高,从而影响互联网领域语料的分词效果。首次采用六词位标注集结合TMPT-10和TMPT-10`特征模板,并与常见标注集和特征模板集的组合在Bakeoff语料上进行实验对比,结果表明,改进的方法 6tag-tmpt10取得更好的未登录词召回率,在互联网领域中文分词能取得很好的效果;同时在F值上也与其他最好结果相当。 展开更多
关键词 中文分 标注 条件随机场 特征模板
在线阅读 下载PDF
汉语分词中上文和下文重要性比较 被引量:2
7
作者 于江德 王希杰 樊孝忠 《计算机工程与应用》 CSCD 北大核心 2011年第4期117-120,共4页
上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,当前字的词位标注需要借助于该字的... 上下文是统计语言学中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,当前字的词位标注需要借助于该字的上下文来确定。为克服仅凭主观经验给出猜测结果的不足,采用四词位标注集,使用条件随机场模型研究了词位标注汉语分词中上文和下文对分词性能的贡献情况,在国际汉语分词评测Bakeoff2005的PKU和MSRA两种语料上进行了封闭测试,采用分别表征上文和下文的特征模板集进行了对比实验,结果表明,下文对分词性能的贡献比上文的贡献高出13个百分点以上。 展开更多
关键词 汉语分 上下文 条件随机场 标注 特征模板
在线阅读 下载PDF
基于Bi-LSTM-6Tags的智能中文分词方法 被引量:6
8
作者 王玮 《计算机应用》 CSCD 北大核心 2018年第A02期107-110,共4页
针对当前基于深度学习模型中文分词算法中存在的语义理解不全和词位信息不足的问题,提出了基于双向长短期记忆(Bi-LSTM)神经网络模型的六词位标注集中文分词方法。首先,利用双向长短期记忆神经网络模型自动发现文本特征;然后,通过六词... 针对当前基于深度学习模型中文分词算法中存在的语义理解不全和词位信息不足的问题,提出了基于双向长短期记忆(Bi-LSTM)神经网络模型的六词位标注集中文分词方法。首先,利用双向长短期记忆神经网络模型自动发现文本特征;然后,通过六词位标注集从文本深层语义上高效准确完成中文分词任务;最后,通过第二国际汉语分词评测(SIGHAN)提供的Backoff2005语料集进行实验验证,在相同实验条件下,该方法与条件随机场(CRF)方法、单向长短期记忆神经网络方法、双向长短期记忆神经网络四词位方法进行比较,分别可以提高分词准确率3%、4%、1%,从而证明该中文分词方法是合理和有效的。 展开更多
关键词 双向LSTM 标注 中文分
在线阅读 下载PDF
XML图书搜索中基于用户社会关系的查询推荐方法 被引量:2
9
作者 黄涵娟 李新叶 田航 《计算机应用与软件》 CSCD 2015年第2期33-36,共4页
基于关键词的图书搜索系统由于用户输入查询词的模糊性和简单性往往需要利用查询推荐技术对查询词进行扩展。目前的图书查询推荐方法不能辨别出不同用户在不同时期的图书请求意图和兴趣。提出一种基于用户社会关系的查询推荐方法,首先... 基于关键词的图书搜索系统由于用户输入查询词的模糊性和简单性往往需要利用查询推荐技术对查询词进行扩展。目前的图书查询推荐方法不能辨别出不同用户在不同时期的图书请求意图和兴趣。提出一种基于用户社会关系的查询推荐方法,首先通过分析用户个人资料信息建立用户社会关系对象集合;其次获取用户社会关系对象对图书的标记词,计算输入查询词与标记词之间的共现率并建立用户社会关系标记词推荐集合,选取与查询词共现率最高的标注词进行查询词扩展。在实际图书数据集上的实验表明,该方法大大提高了查询结果的NDCG@10值,提高用户的满意度,表明该方法具有可行性。 展开更多
关键词 XML图书搜索 查询推荐用户社会关系 兴趣对象标注词 共现率
在线阅读 下载PDF
基于多粒度划分的图像语义检索方法 被引量:1
10
作者 徐久成 董婉 王煜尧 《小型微型计算机系统》 CSCD 北大核心 2017年第5期1091-1097,共7页
为了提高在图像数据库中图像检索的准确性和检索速度,提出一种基于多粒度划分的图像语义检索方法.首先,根据图像数据库和语义标注词构建图像信息表;其次,使用改进的多粒度规则提取方法提取图像信息表的规则集,根据规则集对应的对象集将... 为了提高在图像数据库中图像检索的准确性和检索速度,提出一种基于多粒度划分的图像语义检索方法.首先,根据图像数据库和语义标注词构建图像信息表;其次,使用改进的多粒度规则提取方法提取图像信息表的规则集,根据规则集对应的对象集将图像数据库划分为不同的图像粒集,建立图像语义特征索引;然后,提出了基于内涵重要度的图像相似性度量公式和基于知识粒的图像语义检索算法;最后,用Corel图像库中的图像作为测试图像库进行仿真实验,结果表明该方法有效地提高了图像的检索效率. 展开更多
关键词 标注词 多粒度划分 规则获取 知识粒 内涵重要度
在线阅读 下载PDF
Improved hidden Markov model for speech recognition and POS tagging 被引量:4
11
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2012年第2期511-516,共6页
In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language proc... In order to overcome defects of the classical hidden Markov model (HMM), Markov family model (MFM), a new statistical model was proposed. Markov family model was applied to speech recognition and natural language processing. The speaker independently continuous speech recognition experiments and the part-of-speech tagging experiments show that Markov family model has higher performance than hidden Markov model. The precision is enhanced from 94.642% to 96.214% in the part-of-speech tagging experiments, and the work rate is reduced by 11.9% in the speech recognition experiments with respect to HMM baseline system. 展开更多
关键词 hidden Markov model Markov family model speech recognition part-of-speech tagging
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部