期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于综合的句子特征的文本自动摘要 被引量:11
1
作者 程园 吾守尔.斯拉木 买买提依明.哈斯木 《计算机科学》 CSCD 北大核心 2015年第4期226-229,共4页
采用了一种综合的文本自动摘要方法来抽取出涵盖范围广、冗余信息少、最能反映文本中心思想的文本摘要。该方法充分考虑文本中的词频、标题、句子位置、线索词、提示性短语、句子相似度等特征因素,构建了一个综合的特征加权函数,运用数... 采用了一种综合的文本自动摘要方法来抽取出涵盖范围广、冗余信息少、最能反映文本中心思想的文本摘要。该方法充分考虑文本中的词频、标题、句子位置、线索词、提示性短语、句子相似度等特征因素,构建了一个综合的特征加权函数,运用数学回归模型对语料进行训练,去除冗余句子信息,提取关键句生成摘要。实验评估表明了该方法的可行性、有效性以及在摘要质量方面的优越性。 展开更多
关键词 自动摘要 特征因素 综合 加权函数
在线阅读 下载PDF
基于词序统计组合的中文文本关键词提取技术 被引量:10
2
作者 苏祥坤 吾守尔.斯拉木 买买提依明.哈斯木 《计算机工程与设计》 北大核心 2015年第6期1647-1651,共5页
为进一步改善关键词提取的效果,提出一种基于词序统计组合的关键词提取方法。通过词序统计、词性标注、停用词过滤、词语组合等步骤,实现短语或组合词的生成和候选关键词的过滤;通过其它特征项的引入,进一步提高最终提取关键词的准确度... 为进一步改善关键词提取的效果,提出一种基于词序统计组合的关键词提取方法。通过词序统计、词性标注、停用词过滤、词语组合等步骤,实现短语或组合词的生成和候选关键词的过滤;通过其它特征项的引入,进一步提高最终提取关键词的准确度。实验结果表明,该方法对中文文本的关键词提取具有良好的效果。 展开更多
关键词 权重 词序 关键词 单文本 词语组合
在线阅读 下载PDF
基于N元模型的维吾尔文文本分类技术研究 被引量:6
3
作者 买买提依明.哈斯木 吾守尔.斯拉木 +1 位作者 维尼拉.木沙江 努尔麦麦提.尤鲁瓦斯 《计算机应用研究》 CSCD 北大核心 2015年第7期1986-1988,2004,共4页
考虑到维吾尔文词干提取、词性标注等工具不够成熟和相关的开源资源很少的实际情况,提出了基于N元模型的维吾尔文文本分类技术。其特点是不需要任何自然语言处理工具,拼写错误率对分类结果的影响很低。在训练阶段分别提取字符级别的三... 考虑到维吾尔文词干提取、词性标注等工具不够成熟和相关的开源资源很少的实际情况,提出了基于N元模型的维吾尔文文本分类技术。其特点是不需要任何自然语言处理工具,拼写错误率对分类结果的影响很低。在训练阶段分别提取字符级别的三元和四元模型构造不同规模的N元词典,在分类测试阶段分别用曼哈顿距离计算和骰子测量对文本进行分类。实验结果表明,当四元模型词典的规模为500时,使用骰子测量分类时性能最佳,平准准确率达到86.56%。 展开更多
关键词 N元 文本分类 维吾尔文 N元词典 相似度 曼哈顿距离 骰子测量
在线阅读 下载PDF
基于统计专用字符的维、哈、柯文文种识别研究 被引量:5
4
作者 买买提依明.哈斯木 吾守尔.斯拉木 +1 位作者 维尼拉.木沙江 努尔麦麦提.尤鲁瓦斯 《中文信息学报》 CSCD 北大核心 2015年第2期111-117,共7页
在Unicode编码方案中维、哈、柯文字符安排在阿拉伯字符区域,三种语言中共享字符比较多,跟阿拉伯字符区域混在一起,没有专用的语言ID。在信息检索和自然语言处理领域对维、哈、柯文的识别、处理带来不便。该文首先分析并总结了维、哈、... 在Unicode编码方案中维、哈、柯文字符安排在阿拉伯字符区域,三种语言中共享字符比较多,跟阿拉伯字符区域混在一起,没有专用的语言ID。在信息检索和自然语言处理领域对维、哈、柯文的识别、处理带来不便。该文首先分析并总结了维、哈、柯文三种语言中的专用字符、复合字符、某些字符在某种语言中出现形势的独特性等特征,然后在此基础上设计了维、哈、柯文种识别算法。实验结果表明该文提出的文种识别算法的正确率在文本多于70词时达到96.67%以上。 展开更多
关键词 文种识别 专用字符 复合字符 维文 哈文 柯文 UNICODE
在线阅读 下载PDF
维吾尔文后缀树构造算法的设计与实现
5
作者 买买提依明.哈斯木 吾守尔.斯拉木 维尼拉.木沙江 《计算机工程与应用》 CSCD 2013年第8期9-11,16,共4页
为用后缀树聚类算法对维吾尔文网页进行聚类,通过分析可扩展后缀树和维吾尔文的特点设计了维吾尔文后缀树构造算法。实验结果证明该方法能够在线性的时间范围内构造维吾尔文后缀树,并用它来对维吾尔文网页进行聚类。
关键词 后缀 后缀树 可扩展后缀树 节点 公共前缀
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部