期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于词素切分的低资源语言文本分类 被引量:1
1
作者 沙尔旦尔·帕尔哈提 木塔力甫·沙塔尔 +1 位作者 阿力木江·亚森 阿布都热合曼·卡的尔 《计算机工程与设计》 北大核心 2025年第2期530-536,共7页
针对维-哈-柯等派生类低资源语言文本分类中特征空间维数巨增、特征提取效率低等问题,提出一种基于Bi-LSTM_CRF的词素切和基于Bi-LSTM_Attention的文本分类方法。对实验文本进行词素切分及词干提取以有效减少特征空间维数,采用BERT嵌入... 针对维-哈-柯等派生类低资源语言文本分类中特征空间维数巨增、特征提取效率低等问题,提出一种基于Bi-LSTM_CRF的词素切和基于Bi-LSTM_Attention的文本分类方法。对实验文本进行词素切分及词干提取以有效减少特征空间维数,采用BERT嵌入向量表示较好地保留文本语义信息。将Bi-LSTM与Attention机制结合构建文本分类模型,有效提取文本词干之间长距离依赖关系特征,以此提高维-哈-柯语文本分类的效果,分别得到了96.68%、96.72%和96.54%的分类准确率。实验结果表明,高效词素切分和嵌入向量表示方法能够提高维-哈-柯等低资源语言文本分类的效果。 展开更多
关键词 维-哈-柯语 词素切分 词干提取 词干嵌入向量 特征表示 神经网络 文本分类
在线阅读 下载PDF
以Barendregt的变量约定形式化编程语言研究
2
作者 阿力木江·亚森 艾合买提·阿不来提 +2 位作者 沙尔旦尔·帕尔哈提 阿布都克力木·阿布力孜 哈里旦木·阿布都克里木 《计算机工程与科学》 CSCD 北大核心 2024年第10期1807-1814,共8页
编程语言、类型系统和逻辑系统中常见的命名绑定,在实践中实现存在困难。在理论中以抽象思考发现并避免即将发生的变量捕获。在实践中变量捕获的检测需要定义笨拙的辅助操作,使形式化和证明变得复杂。现有几种命名绑定技术旨在表达式具... 编程语言、类型系统和逻辑系统中常见的命名绑定,在实践中实现存在困难。在理论中以抽象思考发现并避免即将发生的变量捕获。在实践中变量捕获的检测需要定义笨拙的辅助操作,使形式化和证明变得复杂。现有几种命名绑定技术旨在表达式具有良好的可读性,无变量捕获的代换操作和直观的证明。然而,这些技术的形式化与理论之间存在差别,两者的表达式和证明过程可能有很大的不同。提出一种命名绑定技术,其中在代换操作和推理规则中引入的表达式刷新函数使形式化遵守Barendregt的变量约定,形式系统的形式化与其理论几乎相同。以无类型λ-演算和具有简单数据类型的λ-演算的形式化展示了该技术的优点。 展开更多
关键词 变量命名 命名绑定 形式系统 Barendregt的变量约定 编程语言理论
在线阅读 下载PDF
多态性λ-演算的直观建模
3
作者 阿力木江·亚森 阿布都克力木·阿布力孜 +2 位作者 沙尔旦尔·帕尔哈提 哈里旦木·阿布都克里木 朱义鑫 《计算机应用与软件》 北大核心 2024年第12期1-8,共8页
命名绑定是在形式系统中的核心概念之一。至于简单性和直观性,现有的命名绑定技术有其优缺点。通过建模语言HyperLMNtal将一种基于超图重写的命名绑定技术应用于具有子类型和结构类型的多态性λ-演算(或System F<:)的类型检查和按值... 命名绑定是在形式系统中的核心概念之一。至于简单性和直观性,现有的命名绑定技术有其优缺点。通过建模语言HyperLMNtal将一种基于超图重写的命名绑定技术应用于具有子类型和结构类型的多态性λ-演算(或System F<:)的类型检查和按值调用的建模,并使用PoplMark挑战的基准测试进行测试。实验结果表明该技术适合于复杂形式系统的快速建模,因为它使程序员无需理论的重新形式化即可将理论转化为实践。 展开更多
关键词 多态性λ-演算 命名绑定 图形重写 建模
在线阅读 下载PDF
形态切分在维吾尔语机器翻译中的性能
4
作者 阿布都克力木·阿布力孜 史亚庆 +3 位作者 侯钰涛 张雨宁 阿力木江·亚森 哈里旦木·阿布都克里木 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期694-704,共11页
[目的]为研究形态切分效果与维吾尔语机器翻译性能的关系,对不同的形态切分方法及其与维吾尔语机器翻译性能的关系进行研究.[方法]从有监督学习和无监督学习的角度出发,对比了不同形态切分方法与字节对编码方法在维吾尔语机器翻译任务... [目的]为研究形态切分效果与维吾尔语机器翻译性能的关系,对不同的形态切分方法及其与维吾尔语机器翻译性能的关系进行研究.[方法]从有监督学习和无监督学习的角度出发,对比了不同形态切分方法与字节对编码方法在维吾尔语机器翻译任务中的性能表现,并将自监督学习应用到维吾尔语形态切分上.随后,利用不同切分方法处理后的语料进行机器翻译实验,以观察不同切分方法对翻译结果的影响.最后,对实验结果进行统计学检验,比较不同方法之间的性能差异.[结果]相较于无监督学习,基于有监督学习的形态切分方法能够取得更好的切分效果.本研究提出的方法在维吾尔语-汉语和维吾尔语-英语机器翻译任务上,与字节对编码方法相比多个评价指标之间不存在显著性差异.[结论]形态切分效果与机器翻译质量并不以绝对正相关的形式呈现,本研究提出的方法能够很好地兼顾形态切分效果和翻译质量,并显示出一定的优势. 展开更多
关键词 维吾尔语 机器翻译 形态切分 自监督学习
在线阅读 下载PDF
预训练语言模型的扩展模型研究综述 被引量:13
5
作者 阿布都克力木·阿布力孜 张雨宁 +2 位作者 阿力木江·亚森 郭文强 哈里旦木·阿布都克里木 《计算机科学》 CSCD 北大核心 2022年第S02期43-54,共12页
近些年,Transformer神经网络的提出,大大推动了预训练技术的发展。目前,基于深度学习的预训练模型已成为了自然语言处理领域的研究热点。自2018年底BERT在多个自然语言处理任务中达到了最优效果以来,一系列基于BERT改进的预训练模型相... 近些年,Transformer神经网络的提出,大大推动了预训练技术的发展。目前,基于深度学习的预训练模型已成为了自然语言处理领域的研究热点。自2018年底BERT在多个自然语言处理任务中达到了最优效果以来,一系列基于BERT改进的预训练模型相继被提出,也出现了针对各种场景而设计的预训练模型扩展模型。预训练模型从单语言扩展到跨语言、多模态、轻量化等任务,使得自然语言处理进入了一个全新的预训练时代。主要对轻量化预训练模型、融入知识的预训练模型、跨模态预训练语言模型、跨语言预训练语言模型的研究方法和研究结论进行梳理,并对预训练模型扩展模型面临的主要挑战进行总结,提出了4种扩展模型可能发展的研究趋势,为学习和理解预训练模型的初学者提供理论支持。 展开更多
关键词 自然语言处理 预训练 轻量化 知识融合 多模态 跨语言
在线阅读 下载PDF
λ-演算归约策略的简易建模
6
作者 阿力木江·亚森 阿布都克力木·阿布力孜 +1 位作者 朱义鑫 哈里旦木·阿布都克里木 《计算机工程与设计》 北大核心 2022年第9期2578-2583,共6页
在大多数基于图形的计算技术中,理论上的表达式与其图形表示并不相似,且它们的计算方式彼此不对应。出于理论研究需要一种与理论极为相似的计算技术。基于超图重写技术对无类型λ-演算的完全归约、按名称调用归约和按值调用归约进行建... 在大多数基于图形的计算技术中,理论上的表达式与其图形表示并不相似,且它们的计算方式彼此不对应。出于理论研究需要一种与理论极为相似的计算技术。基于超图重写技术对无类型λ-演算的完全归约、按名称调用归约和按值调用归约进行建模。利用超图重写技术得到的以超图表示的λ-表达式在形式上与理论上的λ-表达式相似,以超图重写规则实现的计算过程与理论上的计算过程相对应,使该技术成为编程语言理论研究和快速建模演示的有利工具。 展开更多
关键词 λ-演算 归化策略 超图重写 建模 编程语言
在线阅读 下载PDF
多字体印刷体维-哈-柯文关键词图像识别 被引量:1
7
作者 沙尔旦尔·帕尔哈提 阿布都热合曼·卡的尔 阿力木江·亚森 《计算机科学》 CSCD 北大核心 2022年第S02期615-620,共6页
针对印刷体维吾尔文字识别中字体单一、识别数据规模小、识别领域不区分以及哈萨克和柯尔克孜文字识别研究缺乏等问题,提出了基于卷积神经网络(CNN)的多字体印刷体维吾尔、哈萨克和柯尔克孜(以下简称维-哈-柯)文关键词识别方法。首先,... 针对印刷体维吾尔文字识别中字体单一、识别数据规模小、识别领域不区分以及哈萨克和柯尔克孜文字识别研究缺乏等问题,提出了基于卷积神经网络(CNN)的多字体印刷体维吾尔、哈萨克和柯尔克孜(以下简称维-哈-柯)文关键词识别方法。首先,针对维-哈-柯文关键词图像语料库缺乏的问题,基于图像合成技术构建包括32种字体的维-哈-柯文关键词图像数据集。然后,使用数据扩充技术对数据集的图像进行不同程度的加噪、旋转和失真操作,来进一步体现数据集的自然场景特征。最后,使用多层CNN网络在该数据集上训练图像识别模型,均得到了96.5%以上的识别准确率,并在包括3种常用字体的实际印刷体图像识别任务中得到了96%左右的准确率,该方法减少了预处理过程,并胜过了以往机器学习框架下的其他识别方法。实验结果表明,在CNN网络框架下基于合成图像和数据扩充技术的识别方法能够较好地实现多字体印刷体维-哈-柯文图像识别任务。 展开更多
关键词 维-哈-柯语 OCR 图像合成 卷积神经网络 关键词图像识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部