期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
统计与规则并举的汉语词性自动标注算法 被引量:15
1
作者 张民 李生 +1 位作者 赵铁军 张艳风 《软件学报》 EI CSCD 北大核心 1998年第2期134-138,共5页
本文提出并实现了一种基于定量统计分析优先的统计和规则并举的汉语词性自动标注算法.本算法引入置信区间的概念,优先采用高准确率的定量统计分析技术,然后利用规则标注剩余语料和校正部分统计标注错误.封闭和开放测试表明,在未考... 本文提出并实现了一种基于定量统计分析优先的统计和规则并举的汉语词性自动标注算法.本算法引入置信区间的概念,优先采用高准确率的定量统计分析技术,然后利用规则标注剩余语料和校正部分统计标注错误.封闭和开放测试表明,在未考虑生词和汉语词错误切分的情况下,本算法的准确率为98.9%和98.1%. 展开更多
关键词 汉语词性标注 自动标注算法 语言信息处理
在线阅读 下载PDF
置信度加权在线序列标注算法 被引量:3
2
作者 汤步洲 王晓龙 王轩 《自动化学报》 EI CSCD 北大核心 2011年第2期188-195,共8页
序列标注问题是自然语言处理领域的基本问题之一.序列标注任务是将连续输入的不定长序列,标注成连续等长的标签序列.在在线序列标注方法的基本框架下,针对序列标注任务的特征稀疏特性,采用置信度加权分类算法思想,提出了一种新的线性判... 序列标注问题是自然语言处理领域的基本问题之一.序列标注任务是将连续输入的不定长序列,标注成连续等长的标签序列.在在线序列标注方法的基本框架下,针对序列标注任务的特征稀疏特性,采用置信度加权分类算法思想,提出了一种新的线性判别式在线序列标注方法—置信度加权在线序列标注算法.该方法对每个特征权值参数引入一个概率置信度,取得了优于其他相关算法的性能.在中文分词,中文名实体识别以及英文组块分析等问题上,验证了本文方法的有效性. 展开更多
关键词 序列标注问题 自然语言处理 在线序列标注算法 置信度加权 概率置信度
在线阅读 下载PDF
基于PLSA模型的Web页面语义标注算法研究 被引量:5
3
作者 王云英 《情报杂志》 CSSCI 北大核心 2013年第1期141-144,共4页
高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对We... 高效的Web页面语义标注方法是提高Web信息资源利用效率和知识创新的关键。针对当前Web页面语义标注方法存在的问题和Web页面表现出的结构特征和文本特征及其主题分布规律,设计了基于PLSA主题模型的Web页面语义标注算法。该算法分别对Web页面的结构特征和文本特征构建独立的PLSA主题模型,采用自适应不对称学习算法对这些独立的PLSA主题模型进行集成和优化,最终形成新的综合性的PLSA主题模型进行未知Web页面的自动语义标注。实验结果表明,该算法能够显著提高Web页面语义标注的准确率和效率,可以有效地解决大规模Web页面语义标注问题。 展开更多
关键词 语义标注 PLSA模型 潜在语义主题 标注算法 WEB页面
在线阅读 下载PDF
一种启发式的汉语词性标注算法 被引量:1
4
作者 付国宏 王晓龙 姜守旭 《计算机工程与设计》 CSCD 北大核心 2000年第5期61-64,共4页
描述了一种启发式的汉语词性标注算法,并采用该算法实现了一个基于统计模型的汉语词性标注系统。该算法将反向动态规划和正向A*解码算法相结合。初步的开放测试表明,该系统的词性标注正确率为95.88%(小标记集)和97.95%(大标记集),性... 描述了一种启发式的汉语词性标注算法,并采用该算法实现了一个基于统计模型的汉语词性标注系统。该算法将反向动态规划和正向A*解码算法相结合。初步的开放测试表明,该系统的词性标注正确率为95.88%(小标记集)和97.95%(大标记集),性能优于Viterbi算法。 展开更多
关键词 概率模型 汉语词性标注算法 自然语言处理
在线阅读 下载PDF
面向3D CT影像处理的无监督推荐标注算法 被引量:4
5
作者 冯浩哲 张鹏 +4 位作者 徐欣楠 郝鹏翼 吴福理 吴健 陈为 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第2期183-189,共7页
在3D CT影像分析上应用深度学习技术时,通常需要采用交互标注工具标注一组训练数据.针对3D CT影像一般包含数量较多的切片,医学影像交互标注工作量非常巨大且标注成本非常高的问题,提出一种面向3DCT影像数据交互标注的无监督推荐标注算... 在3D CT影像分析上应用深度学习技术时,通常需要采用交互标注工具标注一组训练数据.针对3D CT影像一般包含数量较多的切片,医学影像交互标注工作量非常巨大且标注成本非常高的问题,提出一种面向3DCT影像数据交互标注的无监督推荐标注算法,通过构造稠密深度自动编码器DCDAE (densely-connected deep auto encoder)提取3D影像的高层特征,同时采用密度-谱聚类来筛选最具标注价值的影像,从而极大减少需要标注的数据量.算法提出了全自动的推荐标注流程,在提取图像特征时采用稠密连接结构改进DCDAE,减少了参数量并使得提取的特征更有区分度,同时对特征采用密度-谱聚类算法进行孤立点鉴别,并依据相关性矩阵自适应调整聚类个数;在肺结节语义分割任务上采用LIDC-IDRI数据集对算法进行了实验. 展开更多
关键词 医学影像分析 深度自动编码器 聚类算法 推荐标注算法 交互标注
在线阅读 下载PDF
RTI时间管理的一种新型动态尺度标注算法 被引量:2
6
作者 杜星玥 卢昱 +1 位作者 陈立云 党若雯 《计算机应用研究》 CSCD 北大核心 2012年第6期2188-2191,共4页
时间管理算法是决定RTI时间管理服务性能的关键。为解决时间管理中常用的Frederick算法计算GALT(greatest available logical time)时可能出现死锁以及仿真系统消息延迟等问题,定义了联邦成员尺度的概念,并结合时间前瞻量的动态调整思想... 时间管理算法是决定RTI时间管理服务性能的关键。为解决时间管理中常用的Frederick算法计算GALT(greatest available logical time)时可能出现死锁以及仿真系统消息延迟等问题,定义了联邦成员尺度的概念,并结合时间前瞻量的动态调整思想,提出了动态尺度标注算法,并对其进行了分析。分析表明该算法不但减少了消息的延迟时间,还解决了时间管理中的死锁问题。通过在制导弹药飞行视景仿真系统上测试,表明算法改善了仿真效果,提高了仿真系统性能。 展开更多
关键词 运行支持环境(RTI) 时间管理 时间管理算法 动态尺度标注算法
在线阅读 下载PDF
一种新的划分下钢结构节点图自动标注算法
7
作者 刘宝芹 施法中 +1 位作者 唐卫清 黄永红 《计算机工程与应用》 CSCD 北大核心 2002年第12期231-233,共3页
文章介绍一种钢结构中节点图自动标注算法。首先介绍相关的背景知识,然后介绍节点图自动标注的关键技术及难点,接着提出对关键技术及难点的解决方案,是一种以符合工程需求为首要条件的基于区域划分的方案,最后给出算法实现的条件及实现... 文章介绍一种钢结构中节点图自动标注算法。首先介绍相关的背景知识,然后介绍节点图自动标注的关键技术及难点,接着提出对关键技术及难点的解决方案,是一种以符合工程需求为首要条件的基于区域划分的方案,最后给出算法实现的条件及实现过程。 展开更多
关键词 区域划分 工程结构 钢结构 节点图自动标注算法
在线阅读 下载PDF
增强现实环境下产品信息标注布局算法研究 被引量:2
8
作者 王峻峰 于洪涛 +1 位作者 李世其 徐迟 《计算机应用与软件》 CSCD 2011年第12期92-95,104,共5页
针对增强现实条件下标注布局复杂多变的特点,提出在标注算法中加入预分布过程以提高算法效率,增强算法稳定性,并通过实验加以验证。分析增强现实中信息标注的问题类型,指出解决该类问题的思路,并阐述改进算法的实现过程,选择相关的参数... 针对增强现实条件下标注布局复杂多变的特点,提出在标注算法中加入预分布过程以提高算法效率,增强算法稳定性,并通过实验加以验证。分析增强现实中信息标注的问题类型,指出解决该类问题的思路,并阐述改进算法的实现过程,选择相关的参数,进行多次验证实验,并对结果进行分析,找出影响产品布局算法实现效率的因素,并使问题得到较好的解决。算法在解决信息标注问题上完全可行。 展开更多
关键词 增强现实 信息标注算法 预分布 效率 稳定性
在线阅读 下载PDF
基于自标注在线顺序极速学习机的图像识别方法 被引量:3
9
作者 魏涛 季新生 《计算机工程》 CAS CSCD 北大核心 2016年第6期208-212,217,共6页
针对图像识别领域目标域标注数据较少而未标注数据较多的情形,为能充分利用未标注数据以提高模型识别能力,提出一种自标注在线顺序极速学习机(SLOSELM)算法。基于源域中已标注数据构建极速学习机(ELM)模型以识别目标域中未标注数据,选... 针对图像识别领域目标域标注数据较少而未标注数据较多的情形,为能充分利用未标注数据以提高模型识别能力,提出一种自标注在线顺序极速学习机(SLOSELM)算法。基于源域中已标注数据构建极速学习机(ELM)模型以识别目标域中未标注数据,选取识别结果中置信度高的样本,并采用SLOSELM算法对ELM模型进行自适应调整,提高图像识别能力。在真实数据集上的实验结果表明,应用SLOSELM算法后ELM模型的图像平均识别能力提高约18%,相比Co-training算法识别时间更短。 展开更多
关键词 机器学习 极速学习机 迁移学习 标注算法 图像识别
在线阅读 下载PDF
马尔可夫随机场在语音识别中的应用
10
作者 傅国康 赵荣椿 刘志强 《数据采集与处理》 CSCD 1999年第4期433-437,共5页
为适应语音识别的需要,作者克服了传统隐马尔可夫模型(HMM)只考虑当前观测符号之前状态的缺点,吸收其采用“隐含”层的处理方式,将其纳入马尔可夫随机场(MRF)的框架,建立了一个基于MRF的语音识别模型,并较详细地阐明... 为适应语音识别的需要,作者克服了传统隐马尔可夫模型(HMM)只考虑当前观测符号之前状态的缺点,吸收其采用“隐含”层的处理方式,将其纳入马尔可夫随机场(MRF)的框架,建立了一个基于MRF的语音识别模型,并较详细地阐明了这个系统的训练和识别算法,重新定义了松弛标注算法中相应的支持函数。典型实验表明,MRF模型较传统的HMM 有较高的识别率。在优化初始参数的条件下,两种模型的识别在同样的时间范围内。在训练脱机的情况下,MRF模型有其明显的优势。 展开更多
关键词 马尔可夫随机场 语音识别 松驰标注算法
在线阅读 下载PDF
基于用户意图的搜索结果文本突显方法 被引量:4
11
作者 张辉 马少平 《上海交通大学学报》 EI CAS CSCD 北大核心 2020年第2期117-125,共9页
信息检索效率在很大程度上取决于用户看到的搜索引擎结果页面所提供的内容.目前,红色突显查询词是商业搜索引擎结果页面主要采用的文本展示方式,但由于查询词可能表达模糊或者包含噪音,与用户的查询意图往往不能完全一致.为了能够充分... 信息检索效率在很大程度上取决于用户看到的搜索引擎结果页面所提供的内容.目前,红色突显查询词是商业搜索引擎结果页面主要采用的文本展示方式,但由于查询词可能表达模糊或者包含噪音,与用户的查询意图往往不能完全一致.为了能够充分地反映用户的查询意图,同时突显对于满足用户查询意图最重要的词语,基于人工标注的结果提出一种新的关键词突显策略;综合结构化支持向量机、隐马尔科夫、最大间隔马尔科夫网络及条件随机场4种基础的序列标注机器学习模型,进一步提出一种新的联合序列学习模型并进行用户搜索实验.实验结果表明:该种模型优于4种基础模型,与人工标注的结果相比取得了93.30%的准确率;所提出的关键词突显策略明显优于传统的查询词突显策略,提高了用户的满意度及搜索效益. 展开更多
关键词 搜索引擎结果页面 用户意图 查询词突显 序列标注算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部