检索结果-维普期刊中文期刊服务平台

融合语义信息的汉老双语句子对齐方法被引量：2: 1; 作者谭琪辉周兰江张建安《中文信息学报》 CSCD 北大核心 2023年第1期79-87,共9页; 双语句子对齐能够为机器翻译、信息检索等跨语言领域任务提供高质量的平行语料,在低资源的老挝语自然语言处理研究中显得尤为重要。由于汉老双语文本中存在非单调对齐(交叉对齐和空对齐)的情况,容易影响汉老句子对齐的效果。此外,人名... 展开更多; 关键词汉老双语句子对齐语义信息双向门控循环单元注意力机制; 在线阅读下载PDF 职称材料

融合文本特征的汉老双语句子相似度计算方法被引量：2: 2; 作者谭琪辉周兰江刘畅《中文信息学报》 CSCD 北大核心 2021年第10期64-72,共9页; 双语句子相似度旨在计算不同语言句子间的语义相似程度,在信息检索、平行语料库构建、机器翻译等领域有重要作用。由于汉语、老挝语平行语料稀少,且老挝语在语义表达、句子结构上与汉语有明显差异,导致汉老双语句子相似度研究的难度较... 展开更多; 关键词双语句子相似度老挝语迁移学习文本特征; 在线阅读下载PDF 职称材料

融合词预测的半监督老挝语词性标注研究被引量：5: 3; 作者王兴金周兰江 +2 位作者张金鹏周枫郭剑毅《小型微型计算机系统》 CSCD 北大核心 2019年第12期2500-2505,共6页; 为有效对老挝语进行词性标注,提出一种融合词预测的半监督隐马尔科夫词性标注方法.首先,为解决未登录词标注问题,基于长短期记忆网络建立词预测模型,并改进维特比算法来将词预测模型融入隐马科夫模型中;其次,为提高隐马科夫模型标注的... 展开更多; 关键词词预测老挝语词性标注隐马科夫模型半监督学习; 在线阅读下载PDF 职称材料

基于互译特征词对匹配的老-汉双语句子相似度计算方法研究被引量：1: 4; 作者李思卓周兰江 +1 位作者周枫张建安《现代电子技术》北大核心 2019年第24期79-83,87,共6页; 句子相似度的计算在自然语言处理的各个领域有很广泛的应用,但跨语言的句子相似度计算方法却非常少。文中提出一种基于互译特征词对匹配,构建老-汉双语句子相似度计算方法,改进了传统的依赖于词形词序通过计算相同词个数和共有单词的位... 展开更多; 关键词老-汉双语词典相似度计算算法改进双语句对识别词汇互译实验验证; 在线阅读下载PDF 职称材料

融合细粒度词特征的老挝语词性标注研究: 5; 作者唐文周兰江张建安《小型微型计算机系统》 CSCD 北大核心 2022年第3期661-666,共6页; 目前流行的词性标注方法严重依赖语料规模及人工提取特征的质量;然而,老挝语资源稀缺,语料及特征选取面临很大挑战,且老挝语句子本身存在普遍过长的特点.因此,该文提出一种融合细粒度词特征的老挝语词性标注方法,构建了融合细粒度词特征... 展开更多; 关键词词性标注老挝语细粒度词特征注意力机制; 在线阅读下载PDF 职称材料

题名融合语义信息的汉老双语句子对齐方法被引量：2: 1; 作者谭琪辉周兰江张建安; 机构昆明理工大学信息工程与自动化学院智能信息处理重点实验室; 出处《中文信息学报》 CSCD 北大核心 2023年第1期79-87,共9页; 文摘双语句子对齐能够为机器翻译、信息检索等跨语言领域任务提供高质量的平行语料,在低资源的老挝语自然语言处理研究中显得尤为重要。由于汉老双语文本中存在非单调对齐(交叉对齐和空对齐)的情况,容易影响汉老句子对齐的效果。此外,人名、地名作为新闻要素,大多属于未登录词,也给汉老句子对齐研究增加了难度。该文提出了一种融合局部和全局语义信息的汉老双语句子对齐方法。首先,将汉老双语句长特征和人名地名特征融入Glove词向量,然后利用双向门控循环单元对特征词向量进行编码,以得到更细粒度的句子局部信息。其次,引入交互注意力机制,提取双语句子中的全局信息,保证对上下文语义特征的有效利用。最后,在多层感知机的基础上引入KM算法,该方法可以处理非单调对齐文本,提高模型的泛化能力。实验结果表明,该方法显著提高了汉老双语新闻语料的对齐性能。; 关键词汉老双语句子对齐语义信息双向门控循环单元注意力机制; Keywords Chinese-Lao bilingual sentence alignment semantic information BiGRU attention mechanism; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名融合文本特征的汉老双语句子相似度计算方法被引量：2: 2; 作者谭琪辉周兰江刘畅; 机构昆明理工大学信息工程与自动化学院智能信息处理重点实验室西南交通大学信息科学与技术学院; 出处《中文信息学报》 CSCD 北大核心 2021年第10期64-72,共9页; 基金国家自然科学基金(61662040); 文摘双语句子相似度旨在计算不同语言句子间的语义相似程度,在信息检索、平行语料库构建、机器翻译等领域有重要作用。由于汉语、老挝语平行语料稀少,且老挝语在语义表达、句子结构上与汉语有明显差异,导致汉老双语句子相似度研究的难度较大。该文提出了一种融合文本特征的汉老双语句子相似度计算方法,并构建了句子相似度模型。首先,在句子相似度模型中将汉语、老挝语的词性、数字共现等文本特征与GloVe预训练词向量融合,以此丰富句子特征,提升模型计算准确率。其次,由基于自注意力的双向长短时记忆网络组成多层孪生网络来提取长距离上下文特征和深层次语义信息,其中自注意力机制可以保证语义信息的有效利用。最后,采用迁移学习的方法将通用模型参数初始化,并使用不同的微调参策略增强模型的泛化能力。实验表明,该文提出的方法,其召回率、准确率和F;值分别达到了82.5%、85.78%和84.00%。; 关键词双语句子相似度老挝语迁移学习文本特征; Keywords bilingual sentence similarity Lao transfer learning text features; 分类号 TP391.1 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名融合词预测的半监督老挝语词性标注研究被引量：5: 3; 作者王兴金周兰江张金鹏周枫郭剑毅; 机构昆明理工大学信息工程与自动化学院云南财经大学信息管理中心; 出处《小型微型计算机系统》 CSCD 北大核心 2019年第12期2500-2505,共6页; 基金国家自然科学基金项目(61662040,61562049)资助; 文摘为有效对老挝语进行词性标注,提出一种融合词预测的半监督隐马尔科夫词性标注方法.首先,为解决未登录词标注问题,基于长短期记忆网络建立词预测模型,并改进维特比算法来将词预测模型融入隐马科夫模型中;其次,为提高隐马科夫模型标注的准确率与速度,使用规则与统计相结合的方法.制定了详细的老挝语法规则集,并将规则集与隐马科夫模型进行结合;再有,为扩展老挝语词性标注语料库规模,使用半监督学习方法,以得到正、反半监督隐马科夫模型;最后,为了解决隐马科夫模型未考虑后续词性对当前标注影响问题,使用正、反半监督隐马科夫模型进行词性标注,并优化了标注结果.实验结果证明,该方法可以有效标注老挝语词性,准确率达到92.55%.; 关键词词预测老挝语词性标注隐马科夫模型半监督学习; Keywords word prediction lao part of speech tagging hidden markov model semi-supervised learning; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于互译特征词对匹配的老-汉双语句子相似度计算方法研究被引量：1: 4; 作者李思卓周兰江周枫张建安; 机构昆明理工大学信息工程与自动化学院智能信息处理重点实验室解放军战略支援部队信息工程大学三院昆明大队; 出处《现代电子技术》北大核心 2019年第24期79-83,87,共6页; 基金国家自然科学基金：老挝语词法分析及老-汉双语平行语料抽取方法研究（61662040）国家自然科学基金：基于篇章特征的越南语新闻事件信息抽取关键技术研究(61562049)~~; 文摘句子相似度的计算在自然语言处理的各个领域有很广泛的应用,但跨语言的句子相似度计算方法却非常少。文中提出一种基于互译特征词对匹配,构建老-汉双语句子相似度计算方法,改进了传统的依赖于词形词序通过计算相同词个数和共有单词的位置信息的相似度计算方法,充分考虑了老挝语和汉语句子中的词汇互译信息、相似概率,避免了由于特征词位置导致的精度丢失。此方法用来最终识别相似度较高的老-汉双语平行句对,依据相似度对源句子和目标句子进行对齐,在老-汉双语平行语料库的建设中使用。实验结果表明,此方法在一定程度上提高了老-汉双语句子相似度计算的准确率。; 关键词老-汉双语词典相似度计算算法改进双语句对识别词汇互译实验验证; Keywords Laos-Chinese bilingual dictionary similarity calculation algorithm improvement bilingual sentence pair recognition lexical mutual translation experiment verification; 分类号 TN912.34-34 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名融合细粒度词特征的老挝语词性标注研究: 5; 作者唐文周兰江张建安; 机构昆明理工大学信息工程与自动化学院智能信息处理重点实验室; 出处《小型微型计算机系统》 CSCD 北大核心 2022年第3期661-666,共6页; 基金国家自然科学基金项目(61662040)资助。; 文摘目前流行的词性标注方法严重依赖语料规模及人工提取特征的质量;然而,老挝语资源稀缺,语料及特征选取面临很大挑战,且老挝语句子本身存在普遍过长的特点.因此,该文提出一种融合细粒度词特征的老挝语词性标注方法,构建了融合细粒度词特征的Att-BiLSTM-CRF模型.首先,以老挝音素和声调符号作为基本单元来进行老挝细粒度词特征的提取,使模型获取更加丰富的语料信息;然后,将细粒度词特征输入BiLSTM中获取句子级别特征;其次,使用自注意力机制防止老挝句子长远上下文信息丢失;最后,使用CRF提取相邻词性约束关系,从而获取最优词性标签.实验结果表明,在有限语料集下,该方法精确率、召回率和F1值分别为93.70%、93.87%、93.62%.; 关键词词性标注老挝语细粒度词特征注意力机制; Keywords part-of-speech tagging Lao fine-grained word features attention mechanism; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	融合语义信息的汉老双语句子对齐方法	谭琪辉周兰江张建安	《中文信息学报》 CSCD 北大核心	2023	2	在线阅读下载PDF 职称材料
2	融合文本特征的汉老双语句子相似度计算方法	谭琪辉周兰江刘畅	《中文信息学报》 CSCD 北大核心	2021	2	在线阅读下载PDF 职称材料
3	融合词预测的半监督老挝语词性标注研究	王兴金周兰江张金鹏周枫郭剑毅	《小型微型计算机系统》 CSCD 北大核心	2019	5	在线阅读下载PDF 职称材料
4	基于互译特征词对匹配的老-汉双语句子相似度计算方法研究	李思卓周兰江周枫张建安	《现代电子技术》北大核心	2019	1	在线阅读下载PDF 职称材料
5	融合细粒度词特征的老挝语词性标注研究	唐文周兰江张建安	《小型微型计算机系统》 CSCD 北大核心	2022	0	在线阅读下载PDF 职称材料