期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于松弛平方交叠率的分词词典无监督优选方法
1
作者
王琳
刘伍颖
《南京大学学报(自然科学版)》
北大核心
2025年第2期293-299,共7页
分词是自然语言处理中的一项基础研究.针对词典规模影响分词效果这个科学问题,提出了平方交叠率(SOR)和松弛平方交叠率(RSOR)两种新量度,并验证了其有效性.平方交叠率的数值是词典交叠率和语料交叠率的乘积,而松弛平方交叠率是无监督学...
分词是自然语言处理中的一项基础研究.针对词典规模影响分词效果这个科学问题,提出了平方交叠率(SOR)和松弛平方交叠率(RSOR)两种新量度,并验证了其有效性.平方交叠率的数值是词典交叠率和语料交叠率的乘积,而松弛平方交叠率是无监督学习下平方交叠率的松弛版本.这两种量度都反映了分词词典和待分词语料之间的适合程度.在越南语分词实验中的结果表明,基于松弛平方交叠率的无监督优选方法能在无需人工标注的前提下,选出最适合的越南语分词词典来达到最优的分词效果.
展开更多
关键词
松弛平方交叠率
平方
交
叠
率
分词词典
无监督优选
越南语
在线阅读
下载PDF
职称材料
题名
基于松弛平方交叠率的分词词典无监督优选方法
1
作者
王琳
刘伍颖
机构
上海外国语大学贤达经济人文学院
南昌师范学院数学与信息科学学院
出处
《南京大学学报(自然科学版)》
北大核心
2025年第2期293-299,共7页
基金
教育部人文社会科学研究基金(20YJC740062,20YJAZH069)
山东省教育科学“十四五”规划重点课题(2023ZD021)。
文摘
分词是自然语言处理中的一项基础研究.针对词典规模影响分词效果这个科学问题,提出了平方交叠率(SOR)和松弛平方交叠率(RSOR)两种新量度,并验证了其有效性.平方交叠率的数值是词典交叠率和语料交叠率的乘积,而松弛平方交叠率是无监督学习下平方交叠率的松弛版本.这两种量度都反映了分词词典和待分词语料之间的适合程度.在越南语分词实验中的结果表明,基于松弛平方交叠率的无监督优选方法能在无需人工标注的前提下,选出最适合的越南语分词词典来达到最优的分词效果.
关键词
松弛平方交叠率
平方
交
叠
率
分词词典
无监督优选
越南语
Keywords
relaxed square overlap ratio
square overlap ratio
segmentation dictionary
unsupervised optimal selection
Vietnamese
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于松弛平方交叠率的分词词典无监督优选方法
王琳
刘伍颖
《南京大学学报(自然科学版)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部