期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Word2vec的哈萨克文词向量化模型的实现
1
作者
吾塔嗯拜克·阿萨汗
亚森·艾则孜
阿依努尔·努尔太
《数字通信世界》
2025年第5期148-149,166,共3页
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源...
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源的科大讯飞哈萨克文语料数据集作为语料库,经过清洗、分词等步骤,用Word2vc实现向量化,将每一个哈萨克文词转换为一个独立的K位词向量,通过对词向量的计算,实现发现哈萨克文文本中包含的上下文语义规律、文本主题词提取、相似词计算等功能。
展开更多
关键词
哈萨克文
Word2vec
词向量
相似度分析
在线阅读
下载PDF
职称材料
题名
基于Word2vec的哈萨克文词向量化模型的实现
1
作者
吾塔嗯拜克·阿萨汗
亚森·艾则孜
阿依努尔·努尔太
机构
中国人民公安大学
新疆警察学院
南京邮电大学
出处
《数字通信世界》
2025年第5期148-149,166,共3页
基金
2024年新疆维吾尔自治区自然科学基金科研基金项目面向数据共享的安全电子数据存取方法研究研究成果之一(编号2024D01A55)
2024年度新疆警察学院校级科技创新团队无人机安全技术团队(编号XJKYKJTD202402)。
文摘
词向量嵌入技术是研究自然语言的重要一步,通过向量化,将自然语言数字化,使自然语言能够被计算机识别和进行相关处理计算。基于Word2vec实现哈萨克文向量化,对哈萨克语机器翻译、文本分类和识别等领域研究具有重要支撑意义。本文将开源的科大讯飞哈萨克文语料数据集作为语料库,经过清洗、分词等步骤,用Word2vc实现向量化,将每一个哈萨克文词转换为一个独立的K位词向量,通过对词向量的计算,实现发现哈萨克文文本中包含的上下文语义规律、文本主题词提取、相似词计算等功能。
关键词
哈萨克文
Word2vec
词向量
相似度分析
Keywords
Kazakh language
Word2vec
word vector
analysis
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Word2vec的哈萨克文词向量化模型的实现
吾塔嗯拜克·阿萨汗
亚森·艾则孜
阿依努尔·努尔太
《数字通信世界》
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部