期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于Bi-LSTM的维吾尔语人称代词指代消解 被引量:3
1
作者 田生伟 秦越 +2 位作者 禹龙 吐尔根.依布拉音 冯冠军 《电子学报》 EI CAS CSCD 北大核心 2018年第7期1691-1699,共9页
针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LST... 针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LSTM的输入,挖掘维吾尔语隐含的上下文语义层面特征;其次对维吾尔语人称代词指代现象进行探索,提取针对人称代词指代研究的24个hand-crafted特征;然后利用多层感知器(multilayer perception,MLP)融合Bi-LSTM学习到的上下文语义层面特征与hand-crafted特征;最后使用融合的两类特征训练softmax分类器完成维吾尔语人称代词指代消解任务.实验结果表明,充分利用两类特征的优势,维吾尔语人称代词指代消解的F1值达到76.86%.实验验证了Bi-LSTM与单向LSTM、浅层机器学习算法的SVM和ANN相比更具备挖掘隐含上下文深层语义信息的能力,而hand-crafted层面特征的引入,则有效提高指代消解性能. 展开更多
关键词 指代消解 双向长短时记忆网络 词向量 深度学习 维吾尔语 自然语言处理
在线阅读 下载PDF
结合注意力机制的Bi-LSTM维吾尔语事件时序关系识别 被引量:11
2
作者 田生伟 胡伟 +3 位作者 禹龙 吐尔根.依布拉音 赵建国 李圃 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第3期393-399,共7页
针对维吾尔语事件时序关系识别问题,提出了一种结合注意力机制的双向长短时记忆模型.基于维吾尔语语言及事件时序关系的特点,抽取13项基于事件间内部结构信息的特征.将词向量作为双向长短时记忆模型的输入,挖掘给定事件句隐含的上下文... 针对维吾尔语事件时序关系识别问题,提出了一种结合注意力机制的双向长短时记忆模型.基于维吾尔语语言及事件时序关系的特点,抽取13项基于事件间内部结构信息的特征.将词向量作为双向长短时记忆模型的输入,挖掘给定事件句隐含的上下文语义信息.结合事件触发词建立注意力机制,获取该事件句的事件语义特征.将事件内部结构特征和语义特征相融合,作为softmax层的输入,进而完成事件时序关系的识别.实验结果表明,该方法在获取事件句隐含语义信息的同时也能获取对应的事件语义特征.融合事件内部结构特征后,识别准确率为89.42%,召回率为86.70%,衡量模型整体性能的F值为88.03%,从而证明了该方法在维吾尔语事件时序关系识别任务上的有效性. 展开更多
关键词 维吾尔语 时序关系 注意力机制 双向长短时记忆网络 词向量
在线阅读 下载PDF
评分可信度条件下的协同过滤模型
3
作者 杨兴耀 于炯 +2 位作者 吐尔根.依布拉音 英昌甜 闫歌 《微电子学与计算机》 CSCD 北大核心 2013年第10期25-28,共4页
通过对用户信任度进行量化,再从项目的角度进行调整,最终获得了较为准确的评分可信度度量.在此基础上,建立了评分可信度矩阵,并对提出的四种可信度相似性模型进行了优化.实验比较结果表明,基于不同的数据集,新提出的相似性模型在合理的... 通过对用户信任度进行量化,再从项目的角度进行调整,最终获得了较为准确的评分可信度度量.在此基础上,建立了评分可信度矩阵,并对提出的四种可信度相似性模型进行了优化.实验比较结果表明,基于不同的数据集,新提出的相似性模型在合理的时间开销下,相对于传统模型在项目预测准确性方面拥有出色的表现. 展开更多
关键词 推荐系统 协同过滤 可信度 相似性模型
在线阅读 下载PDF
混合策略的汉维辅助翻译系统的设计与实现 被引量:13
4
作者 解倩倩 艾山.吾买尔 +2 位作者 吐尔根.依布拉音 买合木提.买买提 卡哈尔江.阿比的热西提 《现代电子技术》 北大核心 2017年第20期5-9,共5页
采用统计与实例的混合策略和翻译记忆技术相结合的方法设计并实现汉维计算机辅助翻译系统。采用该方法的汉维方向BLUE值达0.292 4,0.299 9,0.292 2,维汉方向BLUE值达0.328 4,0.328 6,0.303 1;另外,在面对日益扩展的语料库的压力时采用... 采用统计与实例的混合策略和翻译记忆技术相结合的方法设计并实现汉维计算机辅助翻译系统。采用该方法的汉维方向BLUE值达0.292 4,0.299 9,0.292 2,维汉方向BLUE值达0.328 4,0.328 6,0.303 1;另外,在面对日益扩展的语料库的压力时采用优化的信息检索技术,并根据同一篇文章有同一个主题的特点采用上下文相关问答技术,均使翻译准确率和译者工作效率有了明显提高。 展开更多
关键词 计算机辅助翻译 混合策略 信息检索 上下文相关问答
在线阅读 下载PDF
基于神经网络的维汉翻译系统实现 被引量:6
5
作者 张胜刚 艾山.吾买尔 +2 位作者 吐尔根.依布拉音 买合木提.买买提 米尔夏提.力提甫 《现代电子技术》 北大核心 2018年第24期157-161,共5页
小语种的机器翻译由于开发成本和用户规模等原因一般在开源系统的基础上实现在线服务系统。目前,神经机器翻译提供的源代码以theano编写的居多,但是theano编写的机器翻译因翻译速度较慢而无法满足用户需求。在此以如何实现基于theano的... 小语种的机器翻译由于开发成本和用户规模等原因一般在开源系统的基础上实现在线服务系统。目前,神经机器翻译提供的源代码以theano编写的居多,但是theano编写的机器翻译因翻译速度较慢而无法满足用户需求。在此以如何实现基于theano的稳定维汉神经网络机器翻译系统为目标开展研究,翻译模型采用ALU神经元的多层双向网络框架,使用django实现了翻译服务接口,选用nginx+uwsgi实现了负载均衡以提高翻译速度。实验结果表明,相比于5个翻译引擎构成的系统,10个翻译引擎的系统翻译速度得到1.3~1.55倍的提高。该文的研究结果对于利用开源系统快速实现能够满足日访问量1 000万次以下的翻译系统具有重要参考价值。 展开更多
关键词 小语种 机器翻译 theano 神经网络 开源系统 负载均衡
在线阅读 下载PDF
基于LDA的英汉维文本聚类系统的设计与实现 被引量:2
6
作者 田亮 吐尔根.依布拉音 +1 位作者 艾山.吾买尔 卡哈尔江.阿比的热西提 《现代电子技术》 北大核心 2019年第3期122-126,共5页
以英汉维三种大规模文本聚类为目标,针对三种语言的特点实现基于LDA模型的静态文本聚类系统。因为存在博客、微博等网络媒体的文本不太规范及涉及的话题范围广泛等现象,对文本特征的提取及聚类算法的选择带来一定的难度。通过对样本文... 以英汉维三种大规模文本聚类为目标,针对三种语言的特点实现基于LDA模型的静态文本聚类系统。因为存在博客、微博等网络媒体的文本不太规范及涉及的话题范围广泛等现象,对文本特征的提取及聚类算法的选择带来一定的难度。通过对样本文本的分析,计算出适当的聚类数k,再调用LDA算法将文本聚为k类并给出每类文本的关键词。测试结果表明,该系统能将英汉维三种语言的文本相似度高的聚为一类,可显著提高聚类效果。 展开更多
关键词 文本聚类 LDA模型 多语言 文本特征提取 相似度聚类 权重
在线阅读 下载PDF
人物简历汉维机器翻译系统的设计与实现
7
作者 王路路 吉艾合麦提.如则麦麦提 +3 位作者 艾山.吾买尔 吐尔根.依布拉音 买合木提.买买提 卡哈尔江.阿比的热西提 《现代电子技术》 北大核心 2018年第24期101-105,共5页
为解决将汉语人物简历翻译成维吾尔语版本所面临的高成本、低效率等问题,设计并实现了一种基于模板与词典相结合的人物简历汉维机器翻译系统。通过分析汉语简历的句子结构特点,泛化命名实体并自动创建汉语的简历模板,然后利用正则表达... 为解决将汉语人物简历翻译成维吾尔语版本所面临的高成本、低效率等问题,设计并实现了一种基于模板与词典相结合的人物简历汉维机器翻译系统。通过分析汉语简历的句子结构特点,泛化命名实体并自动创建汉语的简历模板,然后利用正则表达式建立汉维模板库并结合基于规则与词典的方法翻译命名实体,以获取维吾尔语的人物简历。实验结果表明,该系统在单语的情况下使用有限的模板和词典,BLUE值可达到0.38,与需要大规模双语语料训练的机器翻译系统相比具有较好的实际应用价值。 展开更多
关键词 人物简历 汉维机器翻译 模板库 命名实体 正则表达式 句子结构
在线阅读 下载PDF
维哈柯文信息技术常用术语收集翻译研究 被引量:2
8
作者 木合亚提.尼亚孜别克 吐尔根.依布拉音 +1 位作者 哈力木提.买买提 米尔夏提.力提甫 《信息技术与标准化》 2011年第6期42-44,共3页
在参照信息技术术语词汇GB 5271系列标准的基础上,提出了信息技术常用术语的收集与筛选,维吾尔、哈萨克、柯尔克孜文信息技术术语的翻译规范原则,术语的维吾尔文、哈萨克文、柯尔克孜文翻译,以及编制维吾尔文、哈萨克文、柯尔克孜文信... 在参照信息技术术语词汇GB 5271系列标准的基础上,提出了信息技术常用术语的收集与筛选,维吾尔、哈萨克、柯尔克孜文信息技术术语的翻译规范原则,术语的维吾尔文、哈萨克文、柯尔克孜文翻译,以及编制维吾尔文、哈萨克文、柯尔克孜文信息技术常用术语标准方法。 展开更多
关键词 维哈柯文 信息技术 术语标准
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部