期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Word2vec的哈萨克文词向量化模型的实现
1
作者 吾塔嗯拜克·阿萨汗 亚森·艾则孜 阿依努尔·努尔太 《数字通信世界》 2025年第5期148-149,166,共3页
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源... 词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源的科大讯飞哈萨克文语料数据集作为语料库,经过清洗、分词等步骤,用Word2vc实现向量化,将每一个哈萨克文词转换为一个独立的K位词向量,通过对词向量的计算,实现发现哈萨克文文本中包含的上下文语义规律、文本主题词提取、相似词计算等功能。 展开更多
关键词 哈萨克文 Word2vec 词向量 相似度分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部