期刊文献+
共找到534篇文章
< 1 2 27 >
每页显示 20 50 100
词间空格在维吾尔族大学生不同文本呈现方向的汉语句子阅读中的促进作用
1
作者 王永胜 韩洋 +1 位作者 李馨 何立媛 《心理与行为研究》 北大核心 2025年第1期41-48,共8页
为探讨词间空格在维吾尔族大学生不同文本呈现方向汉语阅读中的作用,本研究使用眼动仪记录读者的阅读过程,操纵了文本呈现方向(从左向右和从右向左)、词切分线索(无空格和词间空格)和目标词的词频(高频和低频)。结果发现:维吾尔族大学... 为探讨词间空格在维吾尔族大学生不同文本呈现方向汉语阅读中的作用,本研究使用眼动仪记录读者的阅读过程,操纵了文本呈现方向(从左向右和从右向左)、词切分线索(无空格和词间空格)和目标词的词频(高频和低频)。结果发现:维吾尔族大学生阅读词间空格句子的效率显著高于阅读无空格的句子,从右向左阅读时词间空格条件下的总注视次数显著少于无空格条件;词间空格条件下目标词的注视时间显著短于无空格条件,但词切分线索与词频没有显著的交互作用。结果表明,词间空格作为词切分线索可以提升维吾尔族大学生的汉语阅读效率与词汇加工效率。 展开更多
关键词 词切分 维吾尔族大学生 汉语阅读 眼动
在线阅读 下载PDF
回鹘摩尼教男选民冠饰研究
2
作者 吕钊 李旻玥 《艺术设计研究》 北大核心 2025年第1期31-40,133,134,共12页
公元8世纪以后,回鹘摩尼教男性选民形象频繁出现在高昌故城的壁画和经书插画中,其冠饰造型特征鲜明,但学界对其形制和文化内涵却鲜有关照。本文旨在通过系统梳理和分析与回鹘摩尼教相关的文献与图像资料,深入探讨这些冠饰的造型特征及... 公元8世纪以后,回鹘摩尼教男性选民形象频繁出现在高昌故城的壁画和经书插画中,其冠饰造型特征鲜明,但学界对其形制和文化内涵却鲜有关照。本文旨在通过系统梳理和分析与回鹘摩尼教相关的文献与图像资料,深入探讨这些冠饰的造型特征及其宗教文化内涵。本研究将回鹘摩尼教男选民冠饰分为慕阇冠饰和其他男选民冠饰两种。研究表明:这两种冠饰均呈现为白色扇形,体现了摩尼教“尚白”的宗教文化。与一般男选民冠饰相比,慕阇冠饰特有的羽毛装饰和卷草纹样不仅彰显了其对羽毛的崇拜,还反映了摩尼教的等级制度与文化融合。 展开更多
关键词 回鹘 摩尼教 男性选民 冠饰
在线阅读 下载PDF
基于时间注意力胶囊网络的维吾尔语情感分类模型
3
作者 罗涵天 杨雅婷 +1 位作者 董瑞 马博 《中文信息学报》 北大核心 2025年第9期62-70,共9页
维吾尔语属于稀缺资源语言,如何在资源有限的情况下提升维吾尔语情感分类模型的性能,是目前仍待解决的问题。该文针对现有维吾尔语情感分析因为泛化能力不足所导致的分类效果不佳的问题,提出了基于时间卷积注意力胶囊网络的维吾尔语情... 维吾尔语属于稀缺资源语言,如何在资源有限的情况下提升维吾尔语情感分类模型的性能,是目前仍待解决的问题。该文针对现有维吾尔语情感分析因为泛化能力不足所导致的分类效果不佳的问题,提出了基于时间卷积注意力胶囊网络的维吾尔语情感分类模型(TA-Cap)。该文在维吾尔语情感分类数据集中进行了实验并且从多个评价指标(准确率,精确率,召回率,F_(1)值)进行评估。实验结果表明,该文提出的模型相比传统深度学习模型能够有效提升维吾尔语情感分类的各项指标。 展开更多
关键词 维吾尔语 情感分析 胶囊网络
在线阅读 下载PDF
西北典型区盐碱地治理政策的发展与演变特征
4
作者 宋若莹 张海燕 +3 位作者 周治全 李亚玲 刘晓洁 任平 《水土保持通报》 北大核心 2025年第5期294-304,共11页
[目的]分析新疆维吾尔自治区1986—2025年的盐碱地治理政策演变特征,以期为该区后续盐碱地治理利用工作提供科学指导。[方法]基于政策内容演变与关键节点判别法,对1986年至今公开发布的160份新疆盐碱地治理政策进行阶段划分,通过ROST Co... [目的]分析新疆维吾尔自治区1986—2025年的盐碱地治理政策演变特征,以期为该区后续盐碱地治理利用工作提供科学指导。[方法]基于政策内容演变与关键节点判别法,对1986年至今公开发布的160份新疆盐碱地治理政策进行阶段划分,通过ROST Content Mining System V6.0软件的词频分析和社会语义网络分析工具,对各阶段政策进行文本挖掘与量化分析。[结果]①新疆盐碱地治理政策历经起步规划(1986—2013年)、专项整治(2014—2021年)和综合利用(2022—2025年)3阶段。②各阶段特征鲜明,起步规划阶段以土壤改良和系统性规划为核心;专项整治阶段注重耕地质量提升与生态环境保护;综合利用阶段聚焦盐碱地综合利用与高标准农田建设。③随着时间的推移,政策向全面化、精细化方向发展,治理目标转向盐碱地多元利用与可持续发展,治理过程注重与生态环境保护的平衡协调,治理框架日趋完善,治理措施逐渐多样。[结论]基于政策内容的阶段划分与文本挖掘方法可以系统揭示新疆盐碱地治理政策的发展与演变特征,具有良好的适用性与可操作性。 展开更多
关键词 盐碱地治理 政策演变特征 词频分析 社会语义网络分析 新疆维吾尔自治区
在线阅读 下载PDF
敦煌研究院旧藏回鹘文诗体《大白莲社经》残片缀合研究
5
作者 阿不都日衣木·肉斯台木江 吐送江·依明 《敦煌研究》 北大核心 2025年第1期97-106,共10页
内容摘要:敦煌研究院旧藏文献中D0018号、D0019号、D0020号、D0021号和D0022号等文献,其内容涉及中国净土宗的回鹘文头韵诗歌。这些文献的形状、字体和纸质基本相同,个别页面分栏线上附有序号,如“bir”“iki”“üc”和“tort”。... 内容摘要:敦煌研究院旧藏文献中D0018号、D0019号、D0020号、D0021号和D0022号等文献,其内容涉及中国净土宗的回鹘文头韵诗歌。这些文献的形状、字体和纸质基本相同,个别页面分栏线上附有序号,如“bir”“iki”“üc”和“tort”。通过仔细观察、转写、解读和比对这批文献,初步推断它们均属《大白莲社经》回鹘诗体式译文。尽管这些诗歌是从汉文佛经转化而来的回鹘文,但是它们的节奏完整,逻辑严密,语言优美,思想深邃,可谓回鹘文头韵式诗歌的佳作。这些诗歌在回鹘文学与翻译领域以及古代民族交流交往研究中都发挥着重要作用。 展开更多
关键词 回鹘文 敦煌研究院 旧藏文献 《大白莲社经》
在线阅读 下载PDF
基于词素切分的低资源语言文本分类 被引量:1
6
作者 沙尔旦尔·帕尔哈提 木塔力甫·沙塔尔 +1 位作者 阿力木江·亚森 阿布都热合曼·卡的尔 《计算机工程与设计》 北大核心 2025年第2期530-536,共7页
针对维-哈-柯等派生类低资源语言文本分类中特征空间维数巨增、特征提取效率低等问题,提出一种基于Bi-LSTM_CRF的词素切和基于Bi-LSTM_Attention的文本分类方法。对实验文本进行词素切分及词干提取以有效减少特征空间维数,采用BERT嵌入... 针对维-哈-柯等派生类低资源语言文本分类中特征空间维数巨增、特征提取效率低等问题,提出一种基于Bi-LSTM_CRF的词素切和基于Bi-LSTM_Attention的文本分类方法。对实验文本进行词素切分及词干提取以有效减少特征空间维数,采用BERT嵌入向量表示较好地保留文本语义信息。将Bi-LSTM与Attention机制结合构建文本分类模型,有效提取文本词干之间长距离依赖关系特征,以此提高维-哈-柯语文本分类的效果,分别得到了96.68%、96.72%和96.54%的分类准确率。实验结果表明,高效词素切分和嵌入向量表示方法能够提高维-哈-柯等低资源语言文本分类的效果。 展开更多
关键词 维-哈-柯语 词素切分 词干提取 词干嵌入向量 特征表示 神经网络 文本分类
在线阅读 下载PDF
维吾尔语词法分析的有向图模型 被引量:22
7
作者 麦热哈巴·艾力 姜文斌 +2 位作者 王志洋 吐尔根·依布拉音 刘群 《软件学报》 EI CSCD 北大核心 2012年第12期3115-3129,共15页
维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词... 维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词的层次结构引入到词法分析研究中,提出了维吾尔语词法分析的有向图模型,该模型将维吾尔语词法分析描述为有向图结构,图中节点表示词干、词缀及其相应标注,其边表示节点之间的转移或生成概率并将此概率作为候选择优的依据.针对维吾尔语在形态变化过程中发生的音变现象,又提出基于词内字母对齐算法的自动还原模型,该模型将音变现象泛化到每个字母上的假设之下,将还原问题转变成类似于词性标注问题,再利用统计方法进行还原.在对新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上进行的实验中,取得了词干提取正确率为94.7%,词干与各词缀切分并标注的F值达到92.6%的好成绩. 展开更多
关键词 维吾尔语 词法分析 词语切分 词性标注 有向图
在线阅读 下载PDF
基于短语的汉维/维汉统计机器翻译 被引量:15
8
作者 董兴华 周俊林 +1 位作者 郭树盛 吐尔洪.吾司曼 《计算机工程》 CAS CSCD 北大核心 2011年第9期16-18,21,共4页
利用电话录音的汉维平行语料库和开源的Moses系统构建一个基于短语的统计机器翻译系统。针对汉维平行语料库规模较小和维吾尔语形态变化比较丰富的特点,通过对词级的语料库进行切分得到词素级的语料库,并分别进行词一级的实验和词素级... 利用电话录音的汉维平行语料库和开源的Moses系统构建一个基于短语的统计机器翻译系统。针对汉维平行语料库规模较小和维吾尔语形态变化比较丰富的特点,通过对词级的语料库进行切分得到词素级的语料库,并分别进行词一级的实验和词素级的实验。实验表明,词素级的实验能降低无法识别的词的概率,提高翻译的质量。 展开更多
关键词 汉维 维汉 词素 预处理 后处理
在线阅读 下载PDF
新疆维吾尔族和汉族中老年人群维生素D水平的流行病学调查 被引量:19
9
作者 周晓辉 王倩杰 +3 位作者 朱梅生 邹婷 卡比努尔.克依木 于兆海 《中国骨质疏松杂志》 CAS CSCD 北大核心 2012年第5期453-457,共5页
目的了解新疆维吾尔族、汉族中老年人维生素D的营养状况以及是否在民族间存在差异,为指导老年人更加合理的补充维生素D及预防骨质疏松性骨折的发生提供理论依据。方法采用分层随机多级整群抽样方式,抽取新疆南疆、东疆、北疆、乌鲁木齐... 目的了解新疆维吾尔族、汉族中老年人维生素D的营养状况以及是否在民族间存在差异,为指导老年人更加合理的补充维生素D及预防骨质疏松性骨折的发生提供理论依据。方法采用分层随机多级整群抽样方式,抽取新疆南疆、东疆、北疆、乌鲁木齐地区年龄≥55岁维吾尔族、汉族老年人共计1729人,采用酶联免疫法对其进行血清25羟化维生素D(250HD)的检测。选择250HD<10ng/ml、<15ng/ml、<20ng/ml不同测定值计算低维生素D状态,比较民族间有无差异性。结果1729名受试者年龄55~111岁,平均年龄(67.68±8.34)岁,其中维吾尔族895名,汉族834名,血清250HD平均值为(8.63±4.54)ng/mL,呈正态分布。应用血清250HD三个测定值评估低维生素D状态。结果维生素D缺乏或不足的现患率分别为73.1%、91.0%和97.8%。维吾尔族和汉族测定的血清250HD平均值差异无统计学意义(P>0.05)。结论结合新疆地区老年人群总体健康水平,低维生素D状态测定值宜采用<15ng/mL,低维生素D状态的流行率为91.0%。 展开更多
关键词 血清250HD 中老年人 维吾尔族 汉族
在线阅读 下载PDF
新疆农牧区维吾尔族13~15岁中学生体质下降现象的运动干预研究 被引量:13
10
作者 武杰 任相涛 +3 位作者 秦天红 颜超 马业康 赵丽瑞 《体育科学》 CSSCI 北大核心 2011年第4期41-47,66,共8页
1985-2005年的20年间,新疆维吾尔族13~15岁学生形态、机能、素质等各项指标呈下降趋势,农村学生尤为明显,与同龄汉族学生相比有较大差距。针对维吾尔族学生下肢力量、柔韧性、有氧耐力等素质较差的特点,选取新疆喀什伽师县夏普吐... 1985-2005年的20年间,新疆维吾尔族13~15岁学生形态、机能、素质等各项指标呈下降趋势,农村学生尤为明显,与同龄汉族学生相比有较大差距。针对维吾尔族学生下肢力量、柔韧性、有氧耐力等素质较差的特点,选取新疆喀什伽师县夏普吐勒乡中学,随机选取维吾尔族学生300人,有针对性展开干预实验,探寻有一定针对性、简便易行且科学有效的运动干预方案。研究表明,运动干预所选择项目及具体设计能够有效提高维吾尔族中学生下肢力量、柔韧性及有氧耐力素质,改善学生体质状况。 展开更多
关键词 农牧区 中学生 维吾尔族 体质 干预 新疆
在线阅读 下载PDF
基于词缀库的非监督维吾尔语词切分方法 被引量:7
11
作者 薛化建 董兴华 +2 位作者 王磊 吐尔洪.吾司曼 蒋同海 《计算机工程与设计》 CSCD 北大核心 2011年第9期3191-3194,共4页
在维吾尔语中,词缀的数量有限且构词具有一定的规律性。为了提高维吾尔语词切分算法的性能,在一个词缀库的基础上,通过分析维吾尔语的基本构词规则,提出了一种改进的非监督维吾尔语词切分方法。该方法对词进行规则切分,采用MAP切分评价... 在维吾尔语中,词缀的数量有限且构词具有一定的规律性。为了提高维吾尔语词切分算法的性能,在一个词缀库的基础上,通过分析维吾尔语的基本构词规则,提出了一种改进的非监督维吾尔语词切分方法。该方法对词进行规则切分,采用MAP切分评价模型对规则切分打分,选取得分最高的规则切分作为该词的最终切分形式。在一个5000词的测试语料上进行了实验,实验结果表明,使用该方法进行维吾尔语词切分具有更高的准确率。 展开更多
关键词 维吾尔语 粘着语 词切分 词缀库 最大后验概率 非监督
在线阅读 下载PDF
新疆维吾尔族与哈萨克族和汉族患者疼痛敏感性及舒芬太尼镇痛剂量的比较研究 被引量:10
12
作者 柯雪茹 雷波 +1 位作者 王明春 曹兴华 《中国全科医学》 CAS CSCD 北大核心 2016年第8期916-919,共4页
目的探讨新疆维吾尔族、哈萨克族及汉族在试验性疼痛、术后疼痛及术后阿片类药物用量的差异。方法前瞻性选取2013年8月—2014年10月于新疆医科大学附属中医医院行结直肠癌根治术的患者93例为研究对象,其中维吾尔族32例,哈萨克族31例,汉... 目的探讨新疆维吾尔族、哈萨克族及汉族在试验性疼痛、术后疼痛及术后阿片类药物用量的差异。方法前瞻性选取2013年8月—2014年10月于新疆医科大学附属中医医院行结直肠癌根治术的患者93例为研究对象,其中维吾尔族32例,哈萨克族31例,汉族30例。采用便携式压力测试仪,于患者右前臂内侧腕横纹上2 cm处测定压力痛域(PPT)和压力耐痛域(PTO)。患者术后48 h内均使用静脉病人自控镇痛(PCA),分别于术后6、12、24、48 h进行疼痛视觉模拟评分(VAS)。如果患者在上述任意时间点出现VAS>4分,即定义为存在镇痛不全,立刻静脉给予帕瑞昔布钠40 mg。记录不良反应(如恶心、呕吐、瘙痒和呼吸抑制)的发生情况及镇痛结束后PCA泵中舒芬太尼的用量。结果维吾尔族、哈萨克族及汉族患者PPT比较,差异无统计学意义(P>0.05)。3个民族PTO比较,差异有统计学意义(P<0.05);其中,哈萨克族和汉族患者PTO高于维吾尔族,差异有统计学意义(P<0.05)。民族和术后时间对VAS的影响无交互作用(P>0.05),但不同民族间VAS比较,差异有统计学意义(P<0.05);其中哈萨克族、汉族患者术后6 h VAS低于维吾尔族,差异有统计学意义(P<0.05)。不同民族舒芬太尼用量及镇痛不全比例比较,差异均有统计学意义(P<0.05);其中哈萨克族、汉族患者舒芬太尼用量及镇痛不全比例低于维吾尔族,差异有统计学意义(P<0.05)。维吾尔族、哈萨克族和汉族分别有7例(21.9%)、6例(19.4%)、6例(20.0%)发生呕吐,各民族呕吐发生率比较,差异无统计学意义(χ2=0.07,P=0.96)。维吾尔族、哈萨克族及汉族患者PTO与术后6、12 h VAS均呈负相关(P<0.05),各民族患者PPT、PTO与舒芬太尼用量均无直线相关(P>0.05)。结论维吾尔族在试验性疼痛、术后疼痛及术后阿片类药物用量方面与哈萨克族和汉族均存在差异,术前PTO可能有助于预测术后疼痛严重程度。 展开更多
关键词 疼痛 人种群 痛阈 镇痛药 阿片类 维吾尔族
在线阅读 下载PDF
基于双向LSTM的维吾尔语事件因果关系抽取 被引量:18
13
作者 田生伟 周兴发 +3 位作者 禹龙 冯冠军 艾山.吾买尔 李圃 《电子与信息学报》 EI CSCD 北大核心 2018年第1期200-208,共9页
针对传统方法不能有效抽取维吾尔语事件因果关系的问题,该文提出一种基于双向LSTM(Bidirectional Long Short-Term Memory,Bi LSTM)的维吾尔语事件因果关系抽取方法。通过对维吾尔语语言以及事件因果关系特点的研究,提取出10项基于事件... 针对传统方法不能有效抽取维吾尔语事件因果关系的问题,该文提出一种基于双向LSTM(Bidirectional Long Short-Term Memory,Bi LSTM)的维吾尔语事件因果关系抽取方法。通过对维吾尔语语言以及事件因果关系特点的研究,提取出10项基于事件内部结构信息的特征;同时为充分利用事件语义信息,引入词嵌入作为Bi LSTM的输入,提取事件句隐含的深层语义特征并利用批样规范化(Batch Normalization,BN)算法加速Bi LSTM的收敛;最后融合这两类特征作为softmax分类器的输入进而完成维吾尔语事件因果关系抽取。实验结果表明,该方法用于维吾尔语事件因果关系的抽取准确率为89.19%,召回率为83.19%,F值为86.09%,证明了该文提出的方法在维吾尔语事件因果关系抽取上的有效性。 展开更多
关键词 语言信号处理 事件因果关系 维吾尔语 双向LSTM 词嵌入 批样规范化
在线阅读 下载PDF
汉维/维汉统计机器翻译中若干问题研究 被引量:6
14
作者 徐春 杨勇 董兴华 《计算机工程与应用》 CSCD 北大核心 2011年第35期150-154,167,共6页
针对汉语和维吾尔语形态差别较大的特点,借助开源的Moses工具箱,通过各种翻译模型的对比及相关实验结果的分析,深入探讨了对汉维/维汉翻译有影响的各种因素,包括词对齐问题,汉维翻译中主语、谓语中心词、时态等的一致性问题,维汉翻译中... 针对汉语和维吾尔语形态差别较大的特点,借助开源的Moses工具箱,通过各种翻译模型的对比及相关实验结果的分析,深入探讨了对汉维/维汉翻译有影响的各种因素,包括词对齐问题,汉维翻译中主语、谓语中心词、时态等的一致性问题,维汉翻译中OOV的问题,汉维句法结构差异问题。最后给出了提高汉维/维汉统计翻译性能的一些建议。 展开更多
关键词 汉维 维汉 词对齐 一致性 句法结构
在线阅读 下载PDF
基于机器学习的维吾尔文文本分类研究 被引量:20
15
作者 阿力木江·艾沙 吐尔根·依布拉音 +1 位作者 艾山·吾买尔 马尔哈巴·艾力 《计算机工程与应用》 CSCD 2012年第5期110-112,共3页
随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型(VSM)表示下的高维性,采用词干提取和IG相结合的方法对表示空... 随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型(VSM)表示下的高维性,采用词干提取和IG相结合的方法对表示空间进行降维。采用基于机器学习的分类算法(kNN和Nave Bayes)对维吾尔文文本语料进行了分类实验并分析了实验结果。 展开更多
关键词 文本分类 朴素贝叶斯方法 k-最近邻方法(kNN) 维吾尔语 特征选择
在线阅读 下载PDF
印刷维吾尔文本切割 被引量:17
16
作者 靳简明 丁晓青 +1 位作者 彭良瑞 王华 《中文信息学报》 CSCD 北大核心 2005年第5期76-83,共8页
我国新疆地区使用的维吾尔文借用阿拉伯文字母书写。因为阿拉伯文字母自身书写的特点,造成维文文本的切割和识别极其困难。本文在连通体分类的基础上,结合水平投影和连通体分析的方法实现维文文本的文字行切分和单词切分。然后定位单词... 我国新疆地区使用的维吾尔文借用阿拉伯文字母书写。因为阿拉伯文字母自身书写的特点,造成维文文本的切割和识别极其困难。本文在连通体分类的基础上,结合水平投影和连通体分析的方法实现维文文本的文字行切分和单词切分。然后定位单词基线位置,计算单词轮廓和基线的距离,寻找所有可能的切点实现维文单词过切割,最后利用规则合并过切分字符。实验结果表明,字符切割准确率达到99%以上。 展开更多
关键词 计算机应用 中文信息处理 文本切割 字符切割 字符识别 维吾尔文
在线阅读 下载PDF
基于深度学习的维吾尔语名词短语指代消解 被引量:7
17
作者 李敏 禹龙 +2 位作者 田生伟 吐尔根.依布拉音 赵建国 《自动化学报》 EI CSCD 北大核心 2017年第11期1984-1992,共9页
针对维吾尔语名词短语指代现象,提出了一种利用栈式自编码深度学习算法进行基于语义特征的指代消解方法.通过对维吾尔语名词短语指称性的研究,提取出利于消解任务的13项特征.为提高特征对文本语义的表达,在特征集中引入富含词汇语义及... 针对维吾尔语名词短语指代现象,提出了一种利用栈式自编码深度学习算法进行基于语义特征的指代消解方法.通过对维吾尔语名词短语指称性的研究,提取出利于消解任务的13项特征.为提高特征对文本语义的表达,在特征集中引入富含词汇语义及上下文位置关系的Word embedding.利用深度学习机制无监督的提取隐含的深层语义特征,训练Softmax分类器进而完成指代消解任务.该方法在维吾尔语指代消解任务中的准确率为74.5%,召回率为70.6%,F值为72.4%.实验结果证明,深度学习模型较浅层的支持向量机更合适于本文的指代消解任务,对Word embedding特征项的引入,有效地提高了指代消解模型的性能. 展开更多
关键词 深度学习 栈式自编码神经网络 指代消解 WORD EMBEDDING 维吾尔语
在线阅读 下载PDF
CRF与规则相结合的维吾尔文地名识别研究 被引量:9
18
作者 买合木提·买买提 卡哈尔江·阿比的热西提 +2 位作者 艾山·吾买尔 吐尔根·依布拉音 王路路 《中文信息学报》 CSCD 北大核心 2017年第6期110-118,共9页
该文通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法。根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、... 该文通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法。根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、地名特征词、地名词缀等特征进行实验,结果表明这些特征对识别性能有较大的影响。通过对错误识别结果分析,该文提出了基于规则的后处理,进一步提高了识别性能,准确率达到94.68%,召回率达到89.52%,F值达到92.03%。 展开更多
关键词 命名实体 维吾尔文 地名 条件随机场 词向量
在线阅读 下载PDF
正字法深度对汉族、维吾尔族大学生汉字词命名的影响 被引量:8
19
作者 杨群 王艳 张积家 《心理学报》 CSSCI CSCD 北大核心 2019年第1期1-13,共13页
汉字的多音字数量众多,种类复杂,为维吾尔族学生学习汉语带来了困难。通过两个实验,考察正字法深度对汉族大学生和维吾尔族大学生的汉字词命名的影响。结果表明,无论是命名单字词还是命名双字词,维吾尔族学生的反应时均比汉族学生显著... 汉字的多音字数量众多,种类复杂,为维吾尔族学生学习汉语带来了困难。通过两个实验,考察正字法深度对汉族大学生和维吾尔族大学生的汉字词命名的影响。结果表明,无论是命名单字词还是命名双字词,维吾尔族学生的反应时均比汉族学生显著长。对单字词,两个民族被试的命名时间均受汉字的正字法深度和词频影响,被试命名多音字的时间显著长于命名单音字,命名低频字的时间显著长于命名高频字。对双字词,两个民族被试的命名时间存在着词频与正字法深度的交互作用:对高频词,汉族学生对由多音字组成的词与由单音字组成的词的反应时差异不显著,维吾尔族学生对由多音字组成的词的反应时显著长于对由单音字组成的词;对低频词,汉族学生对由多音字组成的词的反应时显著长于对由单音字组成的词,维吾尔族学生对由多音字组成的词与由单音字组成的词的反应时差异不显著。整个研究表明,正字法深度对两个民族大学生的汉字词命名的影响具有不同模式。所以如此,与两个民族的母语特点、词汇获得年龄、语言熟练程度和语言加工方式不同有关。 展开更多
关键词 正字法深度 词频 语境 维吾尔族
在线阅读 下载PDF
一种改进的印刷体维吾尔文投影切分方法 被引量:10
20
作者 万金娥 袁保社 +2 位作者 李晓 谷朝 米尔沙力江.沙吾提 《计算机工程》 CAS CSCD 2013年第4期263-266,271,共5页
针对印刷体维吾尔文文字识别系统中的文字,尤其是连体段字母的切分这一难点问题,提出一种改进的投影切分方法。采用将基线区域像素点置白(像素点索引值置为255),并对其进行垂直投影,取投影值为0的间隙中间位置作为候选切线位置,根据行... 针对印刷体维吾尔文文字识别系统中的文字,尤其是连体段字母的切分这一难点问题,提出一种改进的投影切分方法。采用将基线区域像素点置白(像素点索引值置为255),并对其进行垂直投影,取投影值为0的间隙中间位置作为候选切线位置,根据行高度与空白间隙宽度比的统计数据均值设置阈值,以此消除误切分。实验结果证明,该方法可有效提高连体段切分的正确率。 展开更多
关键词 印刷体维吾尔文 光学字符识别系统 连体段 基线 积分投影 切分
在线阅读 下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部