期刊文献+
共找到508篇文章
< 1 2 26 >
每页显示 20 50 100
多智能体驱动的虚拟学生模拟助力教师答疑能力提升
1
作者 孙建文 冯锦天 万仟 《华中师范大学学报(自然科学版)》 北大核心 2025年第5期721-729,共9页
随着大模型等生成式人工智能技术的快速发展,其在教育领域的应用不断拓展,为教师专业发展带来了新的机遇.答疑能力作为教师教学过程中的关键技能,在高度抽象化和逻辑化的数理学科教学中尤为重要.然而,当前教师教育中缺乏贴近真实、可反... 随着大模型等生成式人工智能技术的快速发展,其在教育领域的应用不断拓展,为教师专业发展带来了新的机遇.答疑能力作为教师教学过程中的关键技能,在高度抽象化和逻辑化的数理学科教学中尤为重要.然而,当前教师教育中缺乏贴近真实、可反复练习的答疑训练手段,限制了教师实践能力的提升.基于此背景,本文提出学生模拟引擎(student simulation engine,SSE),由大模型驱动的多智能体协作构成.该系统基于IDEAL问题解决理论,将学生的答题过程拆解为读题、思考、解题和检查四个子步骤,通过动态建模学生状态,并在各阶段引入类人错误,以实现不同能力水平学生的真实模拟.SSE包括控制模块与执行模块,前者负责推理学生状态与规划错误策略,后者逐阶段执行任务并生成自然对话.在公开数学数据集GSM8K上的实验表明,SSE能够生成具有人类学生特征的互动过程,并显著提升教师的答疑训练体验.本研究为教师答疑能力提升提供了新的训练场景,同时为大模型赋能教师教育提供了实践路径. 展开更多
关键词 教师教育 答疑能力 学生模拟 大模型 智能体
在线阅读 下载PDF
基于语义特征提取的隐式情感分析方法 被引量:1
2
作者 丛眸 彭涛 朱蓓蓓 《吉林大学学报(理学版)》 北大核心 2025年第1期107-113,共7页
针对目前隐式情感语句中情感词不明显或较少、表达方式委婉等问题,提出一种基于语义特征提取的隐式情感分析方法.该方法通过引入与隐式情感语句相关的事实信息作为辅助特征,并利用RoBERTa预训练模型对文本及其辅助特征进行深度语义交互... 针对目前隐式情感语句中情感词不明显或较少、表达方式委婉等问题,提出一种基于语义特征提取的隐式情感分析方法.该方法通过引入与隐式情感语句相关的事实信息作为辅助特征,并利用RoBERTa预训练模型对文本及其辅助特征进行深度语义交互,以获取全局特征;同时,采用双向门控循环单元(BiGRU)捕捉局部特征,最后结合注意力池化技术计算情感权重,从而更准确地识别和理解隐含的情感信息.在数据集Snopes和PolitiFact上进行仿真实验,实验结果表明,该方法在隐式情感分析方面性能优异,不仅在多个评价指标上超越了现有方法,且整体性能得到显著提升,为更广泛的情感分析应用场景提供了有效的解决方案,特别是在处理复杂和间接表达的情感内容时,具有重要的应用价值和意义. 展开更多
关键词 语义特征 隐式情感分析 双向门控循环单元 注意力池化
在线阅读 下载PDF
文本问答中基于双向叠加注意力的证据区间预测
3
作者 吐尔地·托合提 罗长虹 艾斯卡尔·艾木都拉 《计算机工程与科学》 北大核心 2025年第8期1470-1482,共13页
文本问答通常仅依靠文本与问题的单向匹配关系来定位证据区间并作答,在面临远端干扰及多处答案词等语义困难时难以捕捉精短证据区间。针对此问题,提出一种基于双向叠加注意力机制的证据区间预测模型ESP-BSA。首先,将问题与文本进行交叉... 文本问答通常仅依靠文本与问题的单向匹配关系来定位证据区间并作答,在面临远端干扰及多处答案词等语义困难时难以捕捉精短证据区间。针对此问题,提出一种基于双向叠加注意力机制的证据区间预测模型ESP-BSA。首先,将问题与文本进行交叉匹配来丰富隐式交互的文本语义;其次,根据证据分布互异性设计软证据标签对来表示前向和后向证据得分;最后,对序列中每个位置的证据得分双向叠加以获得更符合上下文语境要求的证据区间。实验结果表明,所提方法在Span-F1,Span-EM等评价指标上较基线模型有所提升,证实了其在复杂语境中能够有效提高证据区间预测精确度和问答准确性。 展开更多
关键词 文本问答 证据区间 注意力机制 双向叠加 软证据标签
在线阅读 下载PDF
融合多特征的藏语方言自动辨识方法
4
作者 尕藏才让 高定国 仁青东主 《计算机工程与科学》 北大核心 2025年第6期1114-1120,共7页
藏语方言众多,内部差异显著,因此藏语方言自动辨识研究在语言学、语音信息处理和刑事侦查与公共安全等领域均具有重要价值。目前,藏语方言辨识的常用方法依赖于各种声学特征和基于大数据的深度学习模型。然而,传统声学特征不能充分表示... 藏语方言众多,内部差异显著,因此藏语方言自动辨识研究在语言学、语音信息处理和刑事侦查与公共安全等领域均具有重要价值。目前,藏语方言辨识的常用方法依赖于各种声学特征和基于大数据的深度学习模型。然而,传统声学特征不能充分表示藏语各方言之间的细微差别,深度学习在小规模数据集上难以实现高精度的方言识别。为解决这一问题,提出了一种融合多种特征的藏语方言自动辨识方法。该方法结合梅尔频率倒谱系数(MFCC)、伽马通频率倒谱系数(GFCC)以及包含清浊音信息的短时能量(STE)值,形成一个多信息融合的方言辨识特征,采用双向长短期记忆(Bi-LSTM)网络对卫藏、安多和康巴等主要藏语方言进行了识别。实验结果表明,提出的多特征融合方法相对于采用单一特征的MFCC,GFCC和STE方法分别提高了10.73%、10.78%和59.48%的辩识准确率,最终达到94.89%的辨识准确率,有效地验证了所提方法的有效性和实用性。 展开更多
关键词 多特征融合 藏语方言 自动辨识
在线阅读 下载PDF
基于知识图谱中多维元路径的科技文档查询扩展
5
作者 徐建民 仝思梦 张国防 《计算机工程与科学》 北大核心 2025年第8期1493-1502,共10页
针对现有科技文档的查询扩展方法存在文档信息利用不充分、文档间关联关系未能有效利用等方面的局限性,提出一种基于知识图谱中多维元路径的科技文档查询扩展方法。首先,对伪相关反馈文档集进行处理得到候选扩展词集;其次,在对科技文档... 针对现有科技文档的查询扩展方法存在文档信息利用不充分、文档间关联关系未能有效利用等方面的局限性,提出一种基于知识图谱中多维元路径的科技文档查询扩展方法。首先,对伪相关反馈文档集进行处理得到候选扩展词集;其次,在对科技文档知识图谱进行分析的基础上,寻找合适的元路径表示用户查询与候选扩展词的关联关系,并基于节点间不同的元路径关联计算用户查询与候选扩展词之间的多维语义相关度;最后,融合多维语义相关度以及候选扩展词在伪相关反馈文档集中的权重选择最终扩展词,实现对用户查询的扩展。实验结果显示,与已有的查询扩展方法相比,基于知识图谱中多维元路径的科技文档查询扩展方法在mAP,DCG和NDCG上分别至少提升了9.21%,10%和11.7%。 展开更多
关键词 知识图谱 查询扩展 多维元路径 科技文档 信息检索
在线阅读 下载PDF
一种基于改进加权LDA模型的敏感词识别模型
6
作者 曾玲 林天余 +2 位作者 何秋霞 陈莹 胡娟娟 《兵工自动化》 北大核心 2025年第6期28-32,共5页
针对目前互联网中主题识别时存在数据复杂、预测精度低的缺陷,提出一种基于改进加权潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型的敏感词识别模型。建立特定领域敏感词语料库;为提高敏感信息主题的识别效率,对语料库进行粗... 针对目前互联网中主题识别时存在数据复杂、预测精度低的缺陷,提出一种基于改进加权潜在狄利克雷分配(latent Dirichlet allocation,LDA)模型的敏感词识别模型。建立特定领域敏感词语料库;为提高敏感信息主题的识别效率,对语料库进行粗粒度文本分类;通过加权模型,提高共现频率低但敏感特征明显的词的分布权重,从而可以发现更多具有低频隐式关系的词;以主流新闻网站爬取的数据为例,对所提模型进行验证。结果表明:该模型可识别和提取每个类别的文本更详细的敏感信息主题,该模型有效且准确。 展开更多
关键词 主题识别 敏感词 自然语言处理 潜在狄利克雷分配
在线阅读 下载PDF
低资源场景下的汉语—传统蒙古语跨语言摘要方法研究
7
作者 班琪 云静 邓磊 《计算机工程与科学》 北大核心 2025年第5期931-939,共9页
跨语言摘要任务旨在给定一种语言的源文档(如中文)生成目标语言(如传统蒙古文)的摘要。传统的多任务框架通常采用序列到序列的网络,应用多个专用于各特定任务的解码器。然而,在将文档从一种语言提炼为另一种具有不同形态和结构特性语言... 跨语言摘要任务旨在给定一种语言的源文档(如中文)生成目标语言(如传统蒙古文)的摘要。传统的多任务框架通常采用序列到序列的网络,应用多个专用于各特定任务的解码器。然而,在将文档从一种语言提炼为另一种具有不同形态和结构特性语言的摘要时,多任务框架无法有效捕捉和理解2种语言之间的关系和差异。特别是对于传统蒙古语,其形态变化繁杂、构词形式多样的特点,使得低资源下语言特征的学习和处理变得更加困难。为了解决这一问题,提出一种在多任务框架中引入一致性学习的跨语言摘要模型。通过计算源语言摘要和生成的目标语言摘要之间概率分布差异的距离度量进行一致性建模,在交叉熵损失和一致性损失的约束下优化跨语言摘要模型。此外,构建了一个中—蒙跨语言摘要数据集,在此数据集上获得了有竞争力的ROUGE分数,表明了所提模型在资源匮乏情况下的有效性。 展开更多
关键词 中—蒙跨语言摘要 一致性学习 低资源
在线阅读 下载PDF
基于ER Rule的多分类器汽车评论情感分类研究 被引量:1
8
作者 周谧 周雅婧 +1 位作者 贺洋 方必和 《运筹与管理》 CSSCI CSCD 北大核心 2024年第5期161-168,共8页
该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同... 该文针对汽车评论语料的情感二分类问题,提出一种基于证据推理规则的多分类器融合的情感分类方法。在情感特征构建方面,通过实验对比不同特征模型对分类结果的影响,并改进传统的TFIDF权重计算方法。同时,在此基础上使用ER Rule融合不同分类器进行文本情感极性分析,并考虑各分类器的权重和可靠度。最后,爬取汽车网站上的评论数据对上述方法进行测试,并用公开的中文酒店评论语料数据进行了验证,结果表明该方法能够有效集成不同分类器的优点,与传统机器学习分类算法相比,其结果在Recall,F1值和Accuracy三个指标上得到了提高,与目前流行的深度学习算法和集成学习算法相比,其结果总体占优。 展开更多
关键词 证据推理规则 多分类器融合 TFIDF权重 深度学习算法 集成学习算法
在线阅读 下载PDF
融合特征投影和负监督的文本分类
9
作者 冯兴杰 曹若轩 《计算机工程与科学》 CSCD 北大核心 2024年第10期1864-1874,共11页
用于分类的文本往往存在语义模糊、特征稀疏的问题,并且句中的某些词语含义会与文本真实标签所代表的语义不一致,这都会导致分类错误。针对上述问题,提出一种融合特征投影和负监督的多任务文本分类模型,主任务利用特征投影网络提取类别... 用于分类的文本往往存在语义模糊、特征稀疏的问题,并且句中的某些词语含义会与文本真实标签所代表的语义不一致,这都会导致分类错误。针对上述问题,提出一种融合特征投影和负监督的多任务文本分类模型,主任务利用特征投影网络提取类别特征明显的纯化向量并进行分类;辅助任务给予模型负监督,以扩大不同类别文本的向量差别,消除个别词语的负面影响。此外,使用RoBERTa和BiL-STM同时对正、负样本进行特征提取,捕捉丰富的语义信息。在THUCNews新闻标题分类和微粒贷语义相似度分析数据集上进行了实验,结果表明本文模型相比现有模型具有更好的效果。 展开更多
关键词 文本分类 特征投影 负监督 多任务模型 RoBERTa BiLSTM
在线阅读 下载PDF
基于多头注意力机制与长短期记忆网络的自然场景文本识别 被引量:2
10
作者 姚炜 冯宪伟 《传感技术学报》 CSCD 北大核心 2024年第12期2107-2112,共6页
随着计算机视觉和自然语言处理技术的不断发展,自然场景文本检测与识别技术已成为计算机视觉领域的研究热点之一。提出了一种基于多头注意力机制与长短期记忆网络(LSTM)的自然场景文本检测与识别方法。该方法通过结合目标检测算法和序... 随着计算机视觉和自然语言处理技术的不断发展,自然场景文本检测与识别技术已成为计算机视觉领域的研究热点之一。提出了一种基于多头注意力机制与长短期记忆网络(LSTM)的自然场景文本检测与识别方法。该方法通过结合目标检测算法和序列识别算法,利用多头注意力机制对图像中的文本区域进行精确的定位和特征提取,进而通过LSTM网络对提取的特征进行编码和解码,实现对自然场景中文本的准确识别。在文本检测阶段,采用基于深度学习的目标检测算法,结合多头注意力机制,通过并行计算多个独立的注意力头来捕获图像中不同尺度和方向上的文本信息,提高文本检测的准确性和鲁棒性。在文本识别阶段,利用LSTM网络对检测到的文本区域进行序列建模,通过编码和解码过程将图像中的文本信息转化为可读的字符序列。实验结果表明,所提出的方法在自然场景文本检测与识别任务上取得了优异的性能。与现有的方法相比,所提出的方法在准确性和鲁棒性方面均有所提升,尤其是在处理复杂背景和多样化文本时表现出更好的适应性。 展开更多
关键词 文本检测与识别 多头注意力机制 自然场景文本 长短期记忆网络
在线阅读 下载PDF
基于多尺度混合域注意力机制的笔迹鉴别方法 被引量:1
11
作者 熊武 曹从军 +2 位作者 宋雪芳 邵云龙 王旭升 《计算机应用》 CSCD 北大核心 2024年第7期2225-2232,共8页
针对笔迹鉴别任务中图像大面积是背景、笔迹信息稀疏、关键性信息难以捕捉,并且个人笔迹签名风格具有微小变化而刻意模仿的笔迹高度相似,以及公开的中文笔迹数据集的匮乏的问题,通过对注意力机制和孪生网络模型进行改进,提出一种基于多... 针对笔迹鉴别任务中图像大面积是背景、笔迹信息稀疏、关键性信息难以捕捉,并且个人笔迹签名风格具有微小变化而刻意模仿的笔迹高度相似,以及公开的中文笔迹数据集的匮乏的问题,通过对注意力机制和孪生网络模型进行改进,提出一种基于多尺度混合域注意力机制的笔迹鉴别方法(MMDANet)。首先,在有效通道注意力模块上并联一个最大池化层,并将二维条带池化模块的通道数扩展到三维,将改进的有效通道注意力模块和条带池化模块融合生成混合域模块(MDM),解决了笔迹图像大面积是背景、笔迹信息稀疏、细节特征难以提取的问题;其次,利用PANet特征金字塔进行多尺度提取特征,捕获真伪笔迹间的细微差异,采用孪生网络的对比损失与AM-Softmax损失加权融合进行训练,增加类别间的区分度,解决个人笔迹风格变化和真伪笔迹高度相似的问题;最后自制了总体样本数为8000的中文笔迹数据集(CHD)。所提方法在自制中文数据集CHD上的准确率达到了84.25%,且相较于次优的Two-stage SiamNet方法,所提方法在3个外文数据集Cedar、Bengla和Hindi上准确率分别提升了4.53%、1.02%和1.67%。实验结果表明,MMDANet可以更准确地捕获真伪笔迹的细微差异,完成复杂的笔迹鉴别任务。 展开更多
关键词 笔迹鉴别 孪生网络 注意力机制 多尺度 混合域
在线阅读 下载PDF
改进CRNN网络的直播弹幕文本识别 被引量:1
12
作者 张荣泽 王修晖 《计算机工程与应用》 CSCD 北大核心 2024年第15期143-149,共7页
在直播带货场景中,通过分析消费者发送的弹幕信息,能够在一定程度上反映出当前商品的实际评价是否与主播的描述一致,对直播行业中假冒伪劣产品的监管具有重要指导意义。针对弹幕文本识别的特殊性,提出了一种基于改进CRNN(convolutional ... 在直播带货场景中,通过分析消费者发送的弹幕信息,能够在一定程度上反映出当前商品的实际评价是否与主播的描述一致,对直播行业中假冒伪劣产品的监管具有重要指导意义。针对弹幕文本识别的特殊性,提出了一种基于改进CRNN(convolutional recurrent neural network)的实时弹幕识别网络,以解决CRNN算法对于复杂背景环境下的文本特征信息提取不全等问题。为此所设计的网络采用了编解码结构对特征提取模块进行强化设计,以解决弹幕像素区域小造成的特征提取过程中的特征丢失问题。使用Transformer模型对输入的帧画面构建长距离全局特征关系,以强化网络模型对弹幕信息的捕捉能力,并对提取的特征信息进行序列建模及转录得到具体的弹幕语义信息。实验结果表明,所设计的网络在测试集上检测精度高达0.926,平均精度值提高了0.101。 展开更多
关键词 文本识别 深度学习 循环卷积网络 Transformer模型
在线阅读 下载PDF
PosiGPT:基于预训练的中文积极情感评论模型
13
作者 卢晨耀 李敏波 《计算机应用与软件》 北大核心 2024年第9期33-40,共8页
近年来,越来越多的人因为工作和生活的压力处于抑郁状态,许多人没有得到足够的鼓励和正确的指导。基于这个背景,提出中文评论模型PosiGPT。基于生成式预训练模型,使用中文微博数据进行训练,可以检测抑郁状态的博文,并产生积极回复。除... 近年来,越来越多的人因为工作和生活的压力处于抑郁状态,许多人没有得到足够的鼓励和正确的指导。基于这个背景,提出中文评论模型PosiGPT。基于生成式预训练模型,使用中文微博数据进行训练,可以检测抑郁状态的博文,并产生积极回复。除了该模型外,还发布了PosiChat数据集,其包含源自新浪微博的抑郁文本及其积极评论。在PosiChat数据集上进行评估,结果表明模型生成的文本具有较强的流畅性和合理性,且在情感倾向上属于积极情感状态,初步达到了抑郁检测及积极回复的功能。 展开更多
关键词 文本生成 抑郁检测 积极情感评论 预训练
在线阅读 下载PDF
多域字符距离感知的场景文本图像超分辨率重建 被引量:5
14
作者 黄俊炀 陈宏辉 +2 位作者 王嘉宝 陈平平 林志坚 《电子学报》 EI CAS CSCD 北大核心 2024年第7期2262-2270,共9页
场景文本图像超分辨率(Scene Text Image Super-Resolution, STISR)旨在提高文本在低分辨率图像中的分辨率和可读性.但是在空间变形或低分辨率的文本图像中,由于缺乏文本区域细节,语义线索和视觉特征信息难以与字符位置匹配对齐,文本识... 场景文本图像超分辨率(Scene Text Image Super-Resolution, STISR)旨在提高文本在低分辨率图像中的分辨率和可读性.但是在空间变形或低分辨率的文本图像中,由于缺乏文本区域细节,语义线索和视觉特征信息难以与字符位置匹配对齐,文本识别效果不佳.针对该问题,本文提出多域字符距离感知的场景文本图像超高分辨率重建方法(Perceiving Multi-Domain Character distance super-resolution, PMDC),强化视觉语义特征,提高文本区域和纹理信息.首先,采用非对称卷积以及语义先验信息模块,提取文本图像的视觉和语义特征信息;其次,融合字符距离感知模块中的视觉和语义特征,得到增强位置编码感知字符间的间距变化和语义相似性;最后,结合引导线索和视觉特征对像素进行重组得到超分辨率文本图像.在公开数据集TextZoom上的实验结果,与最近TATT文本超分网络性能相比,在峰值信噪比指标上提高0.11 dB,有效提高文本清晰度和边缘纹理细节,同时提升1.5%的平均识别准确率,改进文本图像的可读性. 展开更多
关键词 计算机视觉 场景文本图像 超分辨率 注意力机制 特征信息关联
在线阅读 下载PDF
基于改进Swin-Transformer的柑橘病叶分类模型 被引量:1
15
作者 方俊泽 郭正 +2 位作者 李歌 邢素霞 王瑜 《中国农机化学报》 北大核心 2024年第1期252-258,共7页
针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LP... 针对柑橘病害人工检测效率低、成本高、准确度低等问题,结合人工智能技术对柑橘病叶进行分类识别。首先,建立模拟复杂环境下的柑橘病叶数据集。其次,提出一种改进的Swin-Trasnformer柑橘病叶分类模型,包含局部感知通道增强注意力模块(LPCE),以提升模型的感受野和特征表达能力,通过通道之间的相关性进行加权,使模型更容易提取关键特征。试验证明本文模型的分类识别准确率达到98.52%,精确率、召回率和F 1-score分别达到98.17%、98.24%、98.28%,均超过基线模型。该模型为柑橘病害的检测提供技术支撑。 展开更多
关键词 柑橘病叶 深度学习 分类识别 Swin-Transformer 注意力模块
在线阅读 下载PDF
手写体数字识别技术的研究 被引量:34
16
作者 柳回春 马树元 +1 位作者 吴平东 李晓梅 《计算机工程》 CAS CSCD 北大核心 2003年第4期24-25,61,共3页
手写体数字识别特征提取方面,有模板匹配,统计特征和结构特征,在分类器设计上有基于距离的分类器和神经网络分类器等。分析和评价了这些问题后,指出今后的研究方向应在特征综合、分类器集成以及新的分类器的研究上。
关键词 手写体数字识别 手写字符识别 信息处理 神经网络 特征提取 分类器 支持向量机
在线阅读 下载PDF
中文金融新闻中公司名的识别 被引量:54
17
作者 王宁 葛瑞芳 +2 位作者 苑春法 黄锦辉 李文捷 《中文信息学报》 CSCD 北大核心 2002年第2期1-6,共6页
在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别... 在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别公司名的知识库 ,并提出了一个基于两次扫描过程的识别策略。初步实验结果表明 ,在封闭测试中实验系统公司名识别的精确率可以达到 97 3% ,召回率可达 89 3% ;在开放测试中精确率可以达到 6 2 8% ,召回率可达 6 2 1%。 展开更多
关键词 公司名 金融领域 专名识别 信息抽取 金融新闻 中文识别 识别策略
在线阅读 下载PDF
基于统计方法的中文姓名识别 被引量:34
18
作者 黄德根 杨元生 +2 位作者 王省 张艳丽 钟万勰 《中文信息学报》 CSCD 北大核心 2001年第2期31-37,44,共8页
专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式... 专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试 ,主要采用基于统计方法 ,进行中文姓名识别。本文建立了有监督学习机制 ,提出了句子切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别达 95 .97%和 95 .5 2 % ,开式精确率和召回率分别达 92 .37%和 88.6 2 % 展开更多
关键词 双词同现频度 单词频度 学习机制 中文姓名识别 自动分词 统计模型 召回率 可信度
在线阅读 下载PDF
基于分解与动态规划策略的汉语未登录词识别 被引量:43
19
作者 吕雅娟 赵铁军 +2 位作者 杨沐昀 于浩 李生 《中文信息学报》 CSCD 北大核心 2001年第1期28-33,共6页
:未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名 ,中国地名和外国译名进行整体识别为目标 ,采用分解处理策略降低了整体处理难度 ,并使用动态规划方法实现了最佳路径的搜索 ,较好地解决了未登录词之间的冲突问题。通过... :未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名 ,中国地名和外国译名进行整体识别为目标 ,采用分解处理策略降低了整体处理难度 ,并使用动态规划方法实现了最佳路径的搜索 ,较好地解决了未登录词之间的冲突问题。通过对真实语料识别的测试 。 展开更多
关键词 未登录词识别 分解处理 动态规划 汉语自动分词 路径搜索 整体识别
在线阅读 下载PDF
基于SVM和纹理的笔迹鉴别方法 被引量:32
20
作者 刘宏 李锦涛 +1 位作者 崔国勤 唐胜 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2003年第12期1479-1484,共6页
针对与书写内容无关的笔迹 ,提出利用快速Gabor小波提取笔迹图像的整体纹理特征、用支持向量机(SVM)进行训练和识别的方法 SVM是解决两类问题的算法 ,而笔迹鉴别是一个多类问题 ,通过“一对多”的方法将多类问题转化为两类问题 在 87人... 针对与书写内容无关的笔迹 ,提出利用快速Gabor小波提取笔迹图像的整体纹理特征、用支持向量机(SVM)进行训练和识别的方法 SVM是解决两类问题的算法 ,而笔迹鉴别是一个多类问题 ,通过“一对多”的方法将多类问题转化为两类问题 在 87人笔迹库上的实验结果表明 。 展开更多
关键词 笔迹鉴别 SVM 纹理 生物识别 计算机 文字识别
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部